AI辅助的科研写作全流程-skill分享

AI的发展，增大了我们写论文的效率。但如何使用ai，也是一门本事，今天分享一下我正在使用从选题到写作的ai全流程科研处理链路。

1.选题-good-question

项目地址：https://github.com/Rimagination/good-question

科研写作的第一步不是动笔，而是确认问题值不值得做。

很多项目一开始看起来有方向，但其实只是一个主题，比如“气候变化与植被恢复”“微生物多样性与生态功能”“遥感监测生态系统变化”。这些还不是研究问题。

good-question 解决的就是这个问题：把一个模糊兴趣，推进成一个更清晰、更可检验、更容易说服评审的研究问题。

它会帮你追问：

这个问题为什么重要？

它挑战了什么已有假设？

竞争性解释有哪些？

什么结果会推翻你的判断？

两周内能不能做一个 pilot？

最强的评审质疑会是什么？

它的价值不是“多生成几个选题”，而是帮你避免一开始就选到一个松散、无力、后期很难写成论文的问题。

他也会给你已经有的选题方向和研究内容进行打分，并提出合理的解决方案，给你一个参考。

对科研写作来说，选题质量决定了后面所有工作的上限。一个问题如果本身不够锋利，后面文献再多、图再漂亮、语言再精致，也很难真正立住。

2.研究背景（综述）-onefind/scansci-pdf

项目链接：

https://github.com/iawnfoanaowt/OneFind

https://github.com/Rimagination/scansci-pdf

在确定了一个研究方向之后，首先第一步是要去文献综述。看看别人怎么做，别人的成果如何。我们不能一直重复造轮子，而是能参考的就一定要参考，并从已经有的研究中发现缺口，直插一刀。

在以往的流程中，这一步最费时间费力气——因为文献是看不完的，同时下文献也是十分费劲的。

scansci-pdf 负责“找和拿”。

它可以根据 DOI、arXiv ID、关键词或 BibTeX 文件检索和下载论文，也支持批量下载、补全引用信息、导出 BibTeX/RIS 等格式。遇到付费墙时，也可以配合机构登录流程处理。

它解决的是文献综述里最基础但最烦的一层：把候选论文尽快拿到手，并且把引用信息整理好。

onefind 负责“查和用”。

很多时候，我们不是没读过相关文献，而是想不起来那句话、那个方法、那个数据集到底在哪篇文章里。onefind 可以从本地知识库里检索，包括 Zotero、Obsidian、本地文件夹、Notion、Mendeley 等来源。

它更像是一个本地科研记忆系统。

当你已经积累了一批文献、笔记、PDF 标注之后，可以直接问它：

某个方向已有研究主要用什么方法？

有没有文章讨论过某个机制？

哪些论文提到了这个数据集？

我之前读过的文献里，谁做过类似实验？

某个概念在我的资料库里是怎么被定义的？

这样综述就不只是“重新搜索一遍互联网”，而是把你过去积累过的资料重新调动起来。

所以这两个 skill 的分工很清楚：

scansci-pdf 帮你扩展文献池，尽快把论文拿回来。

onefind 帮你盘活已有知识，把本地文献和笔记变成可检索的证据库。

一个向外找，一个向内查。

综述阶段最理想的状态，就是先用 scansci-pdf 快速建立候选文献池，再用 onefind 在本地知识库里反复追问、对比和归纳。这样既不会漏掉新文献，也不会浪费过去已经读过的材料。

在本人实际使用中，偏爱zotero，全链路是scansci下载，然后导入zotero，接着用onefind检索。但其中恰恰缺失关键一步：自动下载-自动导入。因此本人开发了一个bridge skill。适配zotero软件，实现下载-导入-检索的全过程。感兴趣的小伙伴可以去看看。

项目地址：https://github.com/qwlei328-maker/bridge-skill

数据分析：GEEmu

在我所在的专业里，经常会使用 Google Earth Engine 进行数据分析。

GEE 的优势很明显。它能直接调用大量遥感数据集，也能在云端完成影像筛选、时间序列处理、指数计算、区域统计和导出。对生态、地理、环境、遥感相关研究来说，它几乎已经是一个绕不开的工具。

但 GEE 的问题也很明显。

它不是简单写几行代码就结束了。很多分析看起来能跑通，但结果未必可靠。比如：

数据集选择是否合适？

时间范围和研究区是否正确？

云掩膜有没有处理？

波段、单位、比例因子有没有弄对？

空间分辨率和统计尺度是否匹配？

导出区域会不会太大？

结果到底是预览图，还是可用于论文分析的数据？

这些细节一旦出错，后面图画得再漂亮、文字写得再顺，也只是建立在错误结果之上。

GEEMu 解决的是 GEE/geemap 工作流中的这些实际问题。

它不是只帮你补代码，而是把整个分析过程流程化：先确认 Earth Engine 项目 ID 和本地环境，再根据研究区、时间范围、数据集、变量、尺度和输出目标，生成可运行的 Python/geemap 代码。同时，它会提醒你检查数据语义、边界处理、导出方式和计算成本。

这对科研分析很重要。

因为 GEE 最大的风险不是“代码报错”，而是“代码不报错但结果错了”。

比如同样是 NDVI，不同数据集的波段名称、比例因子、云质量控制方式可能都不同。再比如区域统计时，如果研究区边界复杂、尺度设置过细，导出任务可能非常慢，甚至直接失败。还有一些结果如果直接用 getInfo() 拉到本地，会很容易卡死或超限。

GEEMu 的价值就在于，它会把这些容易被忽略的问题提前放到流程里。

对我来说，它适合用在几个场景：

根据研究问题选择合适的 GEE 数据集；

编写 Earth Engine / geemap 数据处理代码；

检查云掩膜、比例因子、单位和 QA band；

按研究区做区域统计或时间序列分析；

设计安全的导出方式，比如 Drive、Asset 或本地 GeoTIFF；

记录一次 GEE 分析的参数、数据层和输出路径。

这样数据分析阶段就不会完全依赖临场写代码，而是变成一个更稳定的流程：先确认研究设计，再确认数据语义，最后再运行和导出。

这一步做好，后面的制图、结果解释和论文写作才有基础。因为论文里所有看起来漂亮的结论，最底层都来自这里的数据处理是否可靠。

4.制图：rfigure

做完分析也就该到制图了。制图是最简单的工作，在这里推荐我开发的rfigure skill，这是一款基于r语言的绘图工具，最新的版本中已经支持了中国地图的制作。

skill内置一套个人常用的方案，你可以要求ai更改为你爱用的方案。包括字体、线条、色彩搭配。

5.写作

在写作上，我不太喜欢全盘依靠ai生成。我更热衷于ai提供写作思路和破题方向，本人牢牢把住最后一关。因此在这里不推荐任何写作项目。

6.写在最后

通过上面推荐的项目，会极大地提升我们的科研效率。但请注意：ai也会犯错！请在ai完成初步探索后仔细核实每一步！特别是在代码运算。

科研工作需要对自己负责对读者负责对社会负责。在发表时切记纰漏ai使用情况！