用 AI 画论文插图,我测了 6 种工具,最好用的居然是 TikZ-夜雨聆风

用 AI 画论文插图,我测了 6 种工具,最好用的居然是 TikZ

为了给论文画一张流程图，我尝试了好几种 AI 模型和工具，这里记录一下我的发现。

科研绘图用 AI 来做，大致有两种思路：一种是直接用图片生成模型出图，另一种是让大模型写代码（Draw.io XML、HTML、TikZ 等）来生成图形。前者视觉效果好但没法精确编辑，后者可控性强但往往更朴素。

NanoBanana Pro & NanoBanana 2

先说图片生成。NanoBanana Pro 画出来的图更有视觉冲击力，层次丰富；NanoBanana 2 相对克制，逻辑上更清晰干净。

NanoBanana Pro

NanoBanana 2

但仔细看就会发现问题：图标变形、箭头方向不对、流程逻辑不通……这些在科研插图里是不能接受的。而且说实话，现在 NanoBanana 的风格特征太明显了，放到论文里一眼就能被认出来是 AI 生成的。

SVG

我也测了 SVG 直接生成。控制力不太行，和 Draw.io 的问题类似，模型对空间布局把握不准，生成出来需要大量手动调整，性价比不高，没有继续深入。

SVG（GPT Pro 生成）

Draw.io

Draw.io 的图形是用 XML 描述的，理论上很适合让模型生成，而且输出可以直接在 Draw.io 里打开做二次编辑。

我用 GPT 5.4 Pro 测试：把 Draw.io 界面截图和 NanoBanana 生成的效果图一起发给它，让它用 XML 重现。结果其实出乎意料，不依赖视觉生成的情况下，GPT 5.4 Pro 几乎找对了大多数组件的位置。但细节上不行，圆角对齐、箭头锚点、间距这些精度都不够，后期要改的地方很多。

Draw.io XML（GPT 5.4 Pro 生成）

HTML

大模型在前端代码上明显比 Draw.io XML 熟练得多，可用的排版工具也更丰富。

我用 Claude Opus 4.6 根据论文内容直接生成 HTML 流程图，整体非常 polish，没有 UI 重叠或渲染错误。不过 HTML 表达复杂流程时有个短板：模型倾向于把组件铺在同一条线上，排版比较单调，大小比例也不太均衡。话说回来，就开箱即用的程度来说，HTML 已经比 Draw.io 和 AI 图片生成好用了。

HTML（Claude Opus 4.6 生成）

TikZ

TikZ 是 LaTeX 下的绘图工具，自由度很高。同样用 Claude Opus 4.6 测试。

一开始我对这个方案没什么期待，因为 TikZ 在训练语料里出现的频率远低于 HTML，觉得模型可能不擅长。但实际效果比预想的好：TikZ 画出来的图有一种独特的学术质感，天然就和论文风格搭。初始版本当然有不少问题，格式错误、布局不合理，但和 Opus 来回迭代几轮之后，这些都能解决。

TikZ（Claude Opus 4.6 生成）

总结

纯视觉效果：

NanoBanana Pro > NanoBanana 2 > HTML > TikZ > Draw.io

考虑论文场景的实际可用性（可编辑、可迭代、向量输出、学术风格契合）：

TikZ ≈ HTML > Draw.io > AI 图片生成

NanoBanana 的图初看很唬人，但要精确调整或者作为出版物插图，反而最难用。代码生成的图初始效果朴素，但迭代之后能精确达到预期，而且天然是向量格式，没有分辨率的问题。

各方案的综合对比见雷达图。

综合对比雷达图

用 AI 画论文插图,我测了 6 种工具,最好用的居然是 TikZ

NanoBanana Pro & NanoBanana 2

SVG

Draw.io

HTML

TikZ

总结

wang

猜你喜欢