《AI 赋能学术写作》| 文本生成工具:DeepSeek、ChatGPT和Gemini-夜雨聆风

《AI 赋能学术写作》| 文本生成工具:DeepSeek、ChatGPT和Gemini

AI技术的突破性发展正在重塑学术写作的流程和底层逻辑。以DeepSeek、ChatGPT和Gemini为代表的大语言模型(Large Language Model, LLM)实现了从知识检索到内容生成的跃迁，成为文本生产的有力工具。

这些工具不仅改变了传统写作的线性流程，更引发了关于学术原创性、知识所有权和认知边界的深层讨论。

文本生成工具的技术演进大致上可以分为三个阶段：一是规则驱动阶段，如早期的拉泰赫LaTeX排版系统；二是统计学习阶段，如基于循环神经网络(Recurrent Neural Network, RNN)的自动文本摘要模型；三是预训练大模型阶段，以OpenAI的GPT系列为标志。

在当前的主流工具中，DeepSeek聚焦中文科研场景，ChatGPT代表了通用型生成能力，Gemini能整合搜索引擎提供实时数据。尽管技术路线各异，这些工具的共性在于通过注意力机制捕捉文本深层语义，进而辅助研究者完成从实验设计描述到理论框架建构的学术写作任务。研究者可借助AI突破思维定式，但同时也面临着内容可信度验证等新挑战。

一、DeepSeek：中文语境下的科研写作辅助

作为由我国本土科技公司杭州深度求索研发的大模型产品， DeepSeek（见图1-2-1）凭借其开源特性和创新性的深度思考模式等，在2025年初一经推出就引发了行业震动和全社会的密切关注。

数据分析平台QuestMobile发布的数据显示，自2025年1月20日DeepSeek-R1模型发布后，在一个月内没有广告投放的情况下，用户增长就高达1.25亿a。

这款模型因其庞大的参数数量、巨大的模型体积以及对硬件资源的高要求，能够提供较为精确的回答，并且能够充分利用网络连接，获取最新的数据和资料，因此也被称为“满血联网版”模型。

图1-2-1　DeepSeek的使用界面

（图片来源：DeepSeek官方网站）

DeepSeek作为科研写作工具，其核心竞争力主要体现在对中文科研语料的专业化处理能力上。DeepSeek采用了先进的自然语言处理技术，能够理解和生成高质量的学术文本。相比于其他工具， DeepSeek在中文语境理解和内容输出方面的表现尤为突出，它能够较好地理解复杂的学术语境，尤其是深度思考模式更能胜任复杂的逻辑推理和分析工作。

同时，DeepSeek也支持多种语言的科研写作，无论是撰写中、英文还是其他语言的学术文章，DeepSeek都能提供流畅的文本生成服务，极大地提升了研究者的写作效率。此外， DeepSeek还可以为科研写作的全流程提供相应的辅助。它可以根据研究主题自动生成论文大纲，生成高质量的初稿，提供语言润色和语法检查功能，以及支持论文查重和降重等。

这些功能不仅简化了写作过程，还提升了论文的语言质量，使研究者能够更加专注于学术内容的创新和研究深度。

不过，尽管DeepSeek在通用学术写作中表现优异，但在某些高度专业化或小众化的科研领域中，其生成的文本可能缺乏足够的领域深度和准确性。

同时，DeepSeek作为一款基于云端的AI工具，用户须将数据上传至服务器进行处理。对于一些涉及敏感数据的研究，可能会存在数据安全方面的隐忧。

二、ChatGPT：通用型数字研究助理

ChatGPT（见图1-2-2）是由美国OpenAI公司开发的基于GPT系统的大模型，其本质是提高人类收集、整理、计算和分析各类信息资料能力的工具体系。

ChatGPT强大的自然语言处理能力和多模态转化能力使之可被用于包括学术写作在内的多个场景和领域。截至2025年2月，OpenAI已更新至GPT-4.5版本。通过扩展无监督学习，GPT-4.5提高了其识别模式、建立联系和无须推理即可产生创造性见解的能力。早期测试表明，GPT-4.5给人的交互感觉更自然，它拥有更广泛的知识库、更好地跟踪用户意图的能力以及更高的“情商”，可完成写作、编程和解决实际问题等任务，同时出现“AI幻觉”，即生成虚假或不准确的内容的频率或也更低。

此外，ChatGPT还提供了Deep Research，即增强功能，可以为更复杂的在线多步骤研究任务（如金融、科学、政策、工程等领域的研究）提供服务。

作为行业中的先行者和领头羊，ChatGPT作为学术写作的辅助工具也展现出了一些显著的优势。ChatGPT能够快速生成高质量的初稿，帮助研究者节省大量时间。ChatGPT还能够对已有内容进行扩展和补充，帮助研究者丰富论文的细节。

例如，当研究者对某个概念或理论描述不够充分时，ChatGPT可以提供更详细的解释或补充相关背景信息。ChatGPT基于大量包括英语和其他语种在内的文本数据进行预训练，支持多种语言的文本生成和翻译，在英语写作上依然是目前最强大的大模型之一。

此外，ChatGPT还具备强大的语言润色功能，能够识别并修正文本中的语法错误、用词不当或表达不清的问题，使论文语言更加规范和流畅。这种多语言支持和语言优化能力特别适合需要发表国际期刊或参与国际会议的研究者。

不过，与DeepSeek相似，使用ChatGPT进行学术内容写作时，也容易遭遇专业深度和准确性，以及数据隐私安全方面的问题。

图1-2-2　ChatGPT的使用界面

（图片来源：ChatGPT官方网站）

三、Gemini：基于搜索的实时知识整合者

Google研发的Gemini（见图1-2-3）前身为Bard，是基于专为对话优化的LaMDA(Language Model for Dialogue Applications)模型形成的，能够处理简单或复杂的查询并提供不同版本的回答， 2024年起全面升级为Gemini系列。

相比于传统模型，基于LaMDA的Gemini更擅长理解上下文逻辑和生成连贯回复。例如，当用户提出需要多个步骤推理的学术问题时，Gemini能分解问题结构并给出阶段式的回答。

同时，Gemini通过整合搜索引擎实时数据与学术数据库，构建了动态更新的知识网络，其核心优势体现在跨模态信息处理上。

例如，当用户提出研究问题时，系统不仅能生成文字综述，还能自动关联统计图表、卫星影像甚至实验视频资料。这种多维度的信息呈现方式，特别适合需要融合定量分析与质性研究的学科。

图1-2-3　Gemini的使用界面

（图片来源：Gemini官方网站）

截至2025年3月，Gemini已更新至2.5版本，在数据处理速度和精确度上相较前期版本均有提升。此外，Gemini也已上线Deep Research功能，其核心优势在于代理式研究能力，用户只需输入研究主体，Gemini即可自动制订研究计划，搜索资源并进行推理分析，生成结构化研究报告。

不过，Gemini在语言支持方面优先面向使用英语的研究者群体，在处理高度专业化的问题时，无法保证其有效性和准确性。

四、工具选择、学术伦理和未来图景

从不同的比较维度来说，DeepSeek、ChatGPT和Gemini三大工具各有自身的优劣势（见表1-2-1）。在能够满足的核心需求方面，DeepSeek相较于后两者具有更强的中文语境理解和内容生成能力；而ChatGPT提供的发散性建议或许最具启发性；Gemini则凭借Google搜索引擎具有最佳的实时数据整合能力，同时也支持图像和文字的多模态形式。

在适用场景方面，DeepSeek更适用于面向中文期刊发表等中文学术写作目的；ChatGPT则在研究设计与综述上具有较好的表现；而Gemini则更适用于需要生成大量图像的数据驱动型研究。

在约束条件方面，DeepSeek和Gemini都可供用户免费使用，但是DeepSeek由于用户基数过于庞大，常有信息过载导致无法及时获得内容的倾向；而ChatGPT主要采取付费模式，个人和团体用户的月订阅费用在20美元和200美元之间，对个人研究者来说需要承担一定的经费开支。

表1-2-1　文本生成工具选择的比较框架满足的核心需求

文本生成工具的普及已经使得学术界对于重新定义“原创性”标准的需求越来越迫切。

目前，已经有包括《科学》和《自然》在内的大量学术期刊，以及如国际出版伦理道德委员会(Committee on Publication Ethics, COPE)，国际医学期刊编辑委员会(International Committee of Medical Journal Editors, ICMJE)，国际科学、技术和医学出版商协会(STM)，泰勒·弗朗西斯出版集团(Taylor & Francis)，爱思唯尔等学术出版机构都各自制定了如何在工作中使用生成式AI工具的规则。

2024年11月28日，复旦大学发布的《复旦大学关于在本科毕业论文（设计）中使用AI工具的规定（试行）》中，对AI工具在本科毕业论文（设计）撰写过程中的使用进行了详细规范。但这些规范要求各不相同，形形色色的指导方针和判别标准常让研究者感到困惑。如何在更大程度上对生成式AI使用的学术伦理标准加以统一或许是学界亟待解决的问题。

就学术写作而言，下一代的内容生成工具将呈现出三个主要的发展方向。

首先是更智能的内容生成与优化，能够理解更复杂的理论模型和实验设计，生成更符合规范的优质文本；其次是多模态协同，支持文本、图表、公式和代码的多模态生成；最后是科研领域自适应能力的提升，能够针对特定学科生成特定规范要求的文本，以及通过迁移学习和模型微调实现专属定制等。

在生成式AI技术的推动下，学术写作或将形成从人类设定认知框架，到AI填充证据链，再到人机协同智能修订的全新流程，知识生产的效率边界和质量阈值也将被进一步打破和提升。