乐于分享
好东西不私藏

用 AI 画论文插图,我测了 6 种工具,最好用的居然是 TikZ

用 AI 画论文插图,我测了 6 种工具,最好用的居然是 TikZ

为了给论文画一张流程图,我尝试了好几种 AI 模型和工具,这里记录一下我的发现。

科研绘图用 AI 来做,大致有两种思路:一种是直接用图片生成模型出图,另一种是让大模型写代码(Draw.io XML、HTML、TikZ 等)来生成图形。前者视觉效果好但没法精确编辑,后者可控性强但往往更朴素。

NanoBanana Pro & NanoBanana 2

先说图片生成。NanoBanana Pro 画出来的图更有视觉冲击力,层次丰富;NanoBanana 2 相对克制,逻辑上更清晰干净。

NanoBanana Pro

NanoBanana 2

但仔细看就会发现问题:图标变形、箭头方向不对、流程逻辑不通……这些在科研插图里是不能接受的。而且说实话,现在 NanoBanana 的风格特征太明显了,放到论文里一眼就能被认出来是 AI 生成的。

SVG

我也测了 SVG 直接生成。控制力不太行,和 Draw.io 的问题类似,模型对空间布局把握不准,生成出来需要大量手动调整,性价比不高,没有继续深入。

SVG(GPT Pro 生成)

Draw.io

Draw.io 的图形是用 XML 描述的,理论上很适合让模型生成,而且输出可以直接在 Draw.io 里打开做二次编辑。

我用 GPT 5.4 Pro 测试:把 Draw.io 界面截图和 NanoBanana 生成的效果图一起发给它,让它用 XML 重现。结果其实出乎意料,不依赖视觉生成的情况下,GPT 5.4 Pro 几乎找对了大多数组件的位置。但细节上不行,圆角对齐、箭头锚点、间距这些精度都不够,后期要改的地方很多。

Draw.io XML(GPT 5.4 Pro 生成)

HTML

大模型在前端代码上明显比 Draw.io XML 熟练得多,可用的排版工具也更丰富。

我用 Claude Opus 4.6 根据论文内容直接生成 HTML 流程图,整体非常 polish,没有 UI 重叠或渲染错误。不过 HTML 表达复杂流程时有个短板:模型倾向于把组件铺在同一条线上,排版比较单调,大小比例也不太均衡。话说回来,就开箱即用的程度来说,HTML 已经比 Draw.io 和 AI 图片生成好用了。

HTML(Claude Opus 4.6 生成)

TikZ

TikZ 是 LaTeX 下的绘图工具,自由度很高。同样用 Claude Opus 4.6 测试。

一开始我对这个方案没什么期待,因为 TikZ 在训练语料里出现的频率远低于 HTML,觉得模型可能不擅长。但实际效果比预想的好:TikZ 画出来的图有一种独特的学术质感,天然就和论文风格搭。初始版本当然有不少问题,格式错误、布局不合理,但和 Opus 来回迭代几轮之后,这些都能解决。

TikZ(Claude Opus 4.6 生成)

总结

纯视觉效果:

NanoBanana Pro > NanoBanana 2 > HTML > TikZ > Draw.io

考虑论文场景的实际可用性(可编辑、可迭代、向量输出、学术风格契合):

TikZ ≈ HTML > Draw.io > AI 图片生成

NanoBanana 的图初看很唬人,但要精确调整或者作为出版物插图,反而最难用。代码生成的图初始效果朴素,但迭代之后能精确达到预期,而且天然是向量格式,没有分辨率的问题。

各方案的综合对比见雷达图。

综合对比雷达图

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 用 AI 画论文插图,我测了 6 种工具,最好用的居然是 TikZ

猜你喜欢

  • 暂无文章