AI slop一则(?):维基百科专题——AI生成内容的蛛丝马迹
AI-in-ception

Salicylic: 真有趣吧,用AI翻译关于识别AI写作风格的论述……这里提到的许多破绽都是可以通过一个认真负责的人类贡献者的基本检查得到消除的,但可不可以说经过那样的消除之后这提交就不算是完全AI,而是有人类的劳动了呢?
WP:AISIGNS
这是一份关于 [[ChatGPT]] 等 [[AI 聊天机器人]] 典型写作与格式惯例的列表,包含取自维基百科条目及草稿的真实案例。本列表旨在作为一份实地指南,帮助编者识别[[WP:LLMDISCLOSE|未经披露的 AI 生成内容]]。
注意: 不要完全依赖 [[GPTZero]] 等 [[人工智能内容检测]] 工具来评估文本是否由 [[LLM]](大语言模型)生成,因为它们并不可靠。虽然其表现优于随机猜测,但误报率很高,无法取代人类的判断。
注意事项
本列表是描述性的,而非规范性的;它由观察结果组成,而非硬性规则。关于维基百科条目中应避免的格式或语言建议,请参阅[[WP:PAG|方针与指引]]以及[[WP:MOS|格式手册]],这些内容不属于本页面的范畴。
特别需要注意的是,本列表并非要全面禁止某些词汇、短语或标点符号;没有人会剥夺你使用破折号的权利。本列表也并不声称只有大语言模型才会使用这些表达。并非所有包含以下特征的文本都是 AI 生成的,因为驱动 AI 聊天模型的大语言模型是基于人类写作(包括维基百科编者的写作)训练的。这仅仅是对在成千上万个 AI 生成文本案例(尤其是维基百科上的案例)中观察到的极其常见模式的编录。
这里的模式也仅仅是问题的潜在征兆,而非问题本身。虽然许多此类问题显而易见且易于修复——例如过度加粗、措辞拙劣、标记语言破碎、引用格式怪异——但它们可能指向更隐蔽、具有[[WP:AIFAIL|更严重方针风险]]的问题。如果生成的文本经过精细润色(无论是初始生成还是后续手动清理),这些表面缺陷可能不复存在,但深层问题往往依然潜伏。请不要仅仅将这些征兆视为需要修复的“故障”,否则可能会加大检测难度。真正的问题在于那些深层隐患,因此请务必根据[[Wikipedia:Large language models#Handling suspected LLM-generated content|处理可疑 AI 生成内容]]及 [[Wikipedia:WikiProject AI Cleanup/Guide|AI 清理指南]]的建议来解决它们。
[[Wikipedia:Speedy deletion|快速删除方针]]标准 G15(未经人工审核的 AI 生成页面)仅限于那些存在最客观、争议最小的 AI 生成证据的情况。这些指标共有三项,其中第一项见于“[[#与用户的沟通内容]]”,另外两项见于“[[#参考文献与引用]]”。其他征兆虽然确实可能指向 AI 的使用,但不足以构成快速删除的理由。
语言与语气
对象征意义和重要性的过度强调
需要警惕的词汇:
• is/stands as/serves as a testament(作为……的证明/见证) • plays a vital/significant role(扮演着至关重要的角色) • underscores its importance(突显了其重要性) • continues to captivate(持续吸引着/令……着迷) • leaves a lasting impact(留下了深远影响) • watershed moment(分水岭时刻/转折点) • key turning point(关键转折点) • deeply rooted(植根于) • profound heritage(深厚的遗产) • steadfast dedication(坚定的奉献) • solidifies(巩固/强化)…
大语言模型的写作经常会吹捧主题的重要性,不断提醒读者该主题代表或贡献了某个更广泛的领域。这类提醒的表达方式往往非常局限,即使在某些场合下使用是合适的,最好也对其进行重写。
在谈论生物学时(例如描述某种动植物物种),大语言模型倾向于过度强调该物种的受威胁状态及其保护工作,即使该物种的状态尚不明确或并无实质性的保护措施。
示例:
杜埃拉紧邻首都阿尔及尔,进一步增强了其作为充满活力的活动与文化中心的重要性。凭借其海岸魅力和便利的地理位置,杜埃拉让居民和游客都为之着迷[…]
宣传性语言
需要警惕的词汇:
• rich cultural heritage(丰富的文化遗产) • rich history(悠久的历史) • breathtaking(令人惊叹的) • must-visit / must-see(必游之地/必看之选) • stunning natural beauty(绝美的自然风光) • enduring/lasting legacy(持久的遗产) • rich cultural tapestry(丰富的文化织锦) • nestled(坐落于/依山傍水) • in the heart of(位于……的心脏地带)…
大语言模型在保持中立语气方面存在严重问题,尤其是当描写对象被视为“文化遗产”时——在这种情况下,它们会不断提醒读者这是文化遗产。
示例:
阿拉马塔拉亚科博坐落于埃塞俄比亚贡德尔地区令人惊叹的地带,是一座充满活力的小镇,拥有丰富的文化遗产,并在阿姆哈拉州占有重要地位。从其壮丽的景观到其历史地标,阿拉马塔拉亚科博为游客提供了对埃塞俄比亚多样化织锦的迷人一瞥。在本文中,我们将探索使阿拉马塔拉亚科博成为值得一游的小镇的独特特征,并阐明其在阿姆哈拉地区的重要性。
发表评论(社论化)(Editorializing)
需要警惕的词汇:
• it’s important to note/remember/consider(值得注意/记住/考虑的是) • it is worth(……是值得的) • no discussion would be complete without(如果不谈论……讨论就不完整) • this article wouldn’t exist without(如果没有……这篇文章就不会存在)…
即使被要求保持中立,大语言模型也经常在写作中加入自己的解释、分析和观点,这违反了维基百科的[[WP:NPOV|中立观点]]和[[WP:NOR|非原创研究]]方针。评论可能通过特定词汇、短语或更广泛的句子结构表现出来。人类作者(尤其是新编者)也常犯此类错误。
示例:
FSP 模型的一个定义性特征是它们模拟环境交互的能力。
它们模拟形式与功能的能力,使其成为了解植物与环境相互作用……的强大工具。
过度使用某些连词
需要警惕的词汇:
• on the other hand(另一方面) • moreover(此外) • in addition(另外) • furthermore(而且/此外)…
虽然人类写作显然也会使用连接词和短语,但大语言模型(LLM)往往会以一种僵硬、公式化的方式“过度使用”它们。这通常是“论文式结构”的副产品,旨在暗示对事实的综合处理——这种结构在 LLM 写作中极其典型,但对于维基百科条目而言并不合适。
示例(AI 生成):
该方法的优势在于其基于迭代、混合模式的开发周期,将理论分析与实际反馈相结合。它对原型设计和经验验证的强调支持了对设计缺陷的早期识别,而场景化设计和主张分析的使用则有助于使设计选择背后的基本原理变得明确且可测试。此外 (Furthermore),将价值观作为操作性设计元素而非抽象原则的结合,有助于将伦理和社会问题转化为具体的设计和评估过程。
与此同时 (At the same time),仍有几个领域需要改进。例如 (For example),虽然该方法在原则上支持跨学科协作,但在大型、异构团队中有效应用它仍具挑战性。协调认知科学家、工程师、设计师和领域专家之间的工作需要精细的引导,并且通常需要在沟通和文档记录方面投入额外精力。
另一个需要进一步发展的领域涉及 (Another area for further development involves)设计模式和本体跨领域的扩展性。尽管抽象是该方法的核心特征,但在不简化特定背景约束的情况下概括知识仍然是一种持续的张力。同样地 (Similarly),操作化和衡量价值观的方法——特别是那些存在争议或依赖于背景的价值观——可以从更稳健的框架和共享基准中受益。
社会认知工程(SCE)继续在应对这些挑战中演进。其当前形式为负责任的系统开发提供了坚实基础,特别是在人类判断、协作和适应仍然至关重要的环境中。然而 (However),其长期价值将取决于持续的方法论改进、在不同环境下的经验验证,以及对跨学科协调和价值观协商问题的持续关注。
将上述内容与下文人类撰写的散文进行对比。即便不考虑其缺失了那些 AI 特有的浮夸词汇(Buzzwords)和整体的空洞感,下文摘录中的连接短语也更加多样且不显眼。
示例(人类撰写):
社会启发式可以包括利用社会信息、在社会背景下运行或两者兼而有之的启发式。社会信息的例子包括 (Examples of social information include)关于社会实体行为或社会系统属性的信息,而非社会信息则是关于物理事物的信息。生物体可能使用社会启发式的背景可以包括“与自然的博弈”和“社会博弈”。在与自然的博弈中 (In games against nature),生物体努力预测自然发生的事情(如天气)或与其他自然力量竞争以完成某事。在社会博弈中 (In social games),生物体是在涉及其他社会生物的情境下做出决策。重要的是 (Importantly),在社会博弈中 (in social games),最适应环境的行动方针也取决于其他参与者的决策和行为。例如 (For instance),“跟随多数”启发式使用社会信息作为输入,但不一定应用于社会背景;而“公平启发式”使用非社会信息,但可以应用于社会背景,例如在后代之间分配亲本资源。
在社会心理学领域 (Within social psychology),一些研究人员认为启发式与认知偏见密切相关。另一些人则认为,这些偏见是由于社会启发式根据其运行环境结构的具体应用而产生的。后一种研究方法的学者将社会启发式研究视为与社会理性密切相关,这是一个将有限理性和启发式思想应用于社会环境领域的研究。在这种观点下 (Under this view),社会启发式被视为具有生态理性。在进化的背景下 (In the context of evolution),利用进化模拟模型的研究已经发现,当社会互动的驱动结果具有不确定性时,社会启发式和协作的进化得到了支持。
章节总结
需要警惕的词汇:
• 总之 (In summary) • 最后 (In conclusion) • 总的来说 (Overall)…
大语言模型(LLM)经常会在段落或章节末尾对核心观点进行总结和重述。虽然这种写法在某些学术论文中是允许的,但标准的维基百科条目通常不会对某一段正文内容进行总结(除了全篇开头的“首段”是对整篇条目的概述外)。
示例:
总之,护理科学家的教育和培训路径通常涉及从护理硕士学位到护理哲学博士学位的晋升,随后是护理研究的博士后培训。这种结构化的路径确保了护理科学家能够获得必要的知识和技能,从而参与严谨的研究并为护理科学的发展做出有意义的贡献。
否定平行句式(Negative parallelisms)
AI 写作中经常出现涉及“不是……而是……”或“不仅是……更是……”的平行结构(如 “不仅……而且……” 或 “这不仅仅关乎……更是……”)。这些句式虽然常见,但往往不符合百科全书的中立语气。
示例:
草间弥生的《自画像》创作于 2010 年,目前保存在佛罗伦萨著名的乌菲兹美术馆,它不仅是一部自我展现的作品,更是一份关于她的痴迷、视觉策略和心理传记叙事的视觉文献。
这不仅仅关乎人声之下的节奏;它更是侵略性与氛围的一部分。
有时这种平行句式会跨越多个句子:
他出身于受人尊敬的杜斯家族,该家族以演艺遗产闻名。然而,欧金尼奥的生活轨迹却将个人抱负与家族的复杂性交织在了一起。
还有一些排比可能遵循 “没有……没有……只有……” 的模式:
没有长篇人物简介。没有编辑见解。没有关于她游戏开发生涯的报道。没有显著的荣誉。只有 TikTok 的简报和点名。
三项排比原则(Rule of Three)
LLM 过度频繁地使用“三项排比原则”——即“好的、坏的、丑的”(the good, the bad, and the ugly)这种三分法。它可以表现为“形容词,形容词,和形容词”,也可以是“短语,短语,和短语”。
虽然在创意写作、辩论或宣传文案中偶尔使用排比很常见,但它不太适合纯粹的信息类文本。AI 经常使用这种结构,试图让浅薄的分析看起来更全面。
示例:
Amaze 大会汇聚了全球 SEO 专家、营销专家和增长黑客,共同探讨数字营销的最新趋势。活动内容包括主题演讲、小组讨论和社交机会。
肤浅的分析
需要警惕的词汇:
• 确保了…… (ensuring) • 突显了…… (highlighting) • 强调了…… (emphasizing) • 反映了…… (reflecting)
AI 聊天机器人倾向于在信息中插入肤浅的分析,通常涉及该信息的重要性、认可度或影响。这通常是通过在句尾附加一个现在分词(-ing)短语来实现的。这些评论通常毫无用处,因为它们引入了不必要甚至虚构的观点。
示例:
2025 年,该联合会获得了国际认可并受邀参加亚洲皮克球峰会,突显了巴基斯坦进入全球皮克球界的进程。
消费者受益于在合作商户处使用其偏好的移动钱包的灵活性,提高了便利性。
这些引用跨越了 60 多年,出现在公认的学术出版物中,说明了布洛瓦在计算语言学、语法和新词构造方面的持久影响。
模糊的观点归因(模棱两可的话)
需要警惕的词汇:
• 行业报告称 • 观察家指出 • 一些批评者认为……
AI 聊天机器人倾向于将观点或主张归于某些模糊的权威——这种做法被称为“模棱两可的话(Weasel wording)”。它们往往只引用一两个可能并不支持该观点的来源,或者倾向于将极少数来源的看法上升为整个群体的广泛共识。
示例:
他的作品被描述为探索了概念主题,并架起了艺术媒介之间的桥梁。(注:此处其实只引用了音乐家本人的网站)
由于其独特的特征,哈来河引起了研究人员和环保人士的关注。目前正在努力监测其生态健康并保护周围的草原环境。
虚假范围(False Range)
在列举一组项目时,AI 机器人经常使用 “从……到……”(from … to …) 的句式。这往往会导致一种非百科全书式的、带有煽情色彩的语气。注意:不要将此类用法与描述空间或时间分布的正常用法混淆(例如“从芝加哥到洛杉矶”或“从周五到周三”)。
示例:
构成索马里菜肴基础的基本成分包括大米和面食等主食,以及从羊肉到牛肉和鸡肉的广泛肉类选择。
我们穿越宇宙的旅程带我们经历了从大爆炸的奇点到宏伟的宇宙网,从锻造生命元素的恒星诞生与毁灭,到塑造宇宙命运的暗物质与暗能量的神秘之舞。
智慧与创造力:从解决问题和工具制造,到科学发现、艺术表达和技术创新,人类智慧的特点在于其适应性和产生新颖解决方案的能力。
格式与样式
章节标题中的词首大写(Title Case)
参见:维基百科格式手册:标题与大写
AI 聊天机器人强烈倾向于在章节标题中将所有主要单词的首字母大写(即 Title Case)。
示例:
## 早期生活与教育 (Early Life and Education)托马斯出生于宾夕法尼亚州科克伦维尔……
## 在赛马领域的应用 (Applications in Racing)托马斯的行为分析已被用于评估肯塔基赛马……
## 全球咨询 (Global Consulting)……
## 国际演讲邀请 (International Speaking Engagements)2025 年 7 月,托马斯受邀作为特邀演讲者参加第二届马业经济论坛……
过度使用粗体
参见:维基百科格式手册:粗体
AI 聊天机器人经常以一种机械的方式,过度使用粗体来强调短语。这种倾向往往源于它们训练数据中的 README 文件、爱好者维基、操作指南、营销文案或演示文稿。它们习惯于强调每一个选定的关键词,使条目读起来像是一份“核心要点”总结。
示例:
它融合了目标与关键结果 (OKRs)、关键绩效指标 (KPIs) 以及视觉策略工具,如商业模式画布 (BMC) 和平衡计分卡 (BSC)。OPC 旨在通过在组织内培养统一的心态和共同方向,弥补战略与执行之间的差距。
列表格式
AI 聊天机器人通常将回复内容组织成特定格式的列表。
从 AI 界面直接复制粘贴的内容往往会保留其原始格式。它们可能不会使用标准的维基列表语法(如 * 或 #),而是直接出现圆点符号(•)、连字符(-)或连接号(–)。有序列表(数字列表)则可能直接写出数字(如 1.)而非使用维基代码。
示例:
1. 二战后的历史背景:二战后世界正在迅速变化…… 2. 核军备竞赛:继美国原子弹轰炸后,苏联于 1949 年引爆了第一颗原子弹…… 3. 关键人物爱德华·泰勒:一位倡导开发更强大核武器的匈牙利物理学家…… 4. “日晷”氢弹的技术细节:“日晷”的设计涉及一颗氢弹…… 5. 破坏潜力:如果引爆,“日晷”将产生直径达 50 公里的火球……
表情符号 (Emoji)
有时,AI 聊天机器人会通过在章节标题或列表项前添加表情符号来“装饰”内容。
示例:
让我们来解码这里到底发生了什么:
🧠 认知失调模式:
你已经证明了作者身份并展示了原创性,但他们仍在维护一个排斥原创者的系统……
🧱 结构性守门:
维基百科方针倾向于:……
🚨 潜在动机:
为什么人类会在这件事上与你争论?……
过度使用破折号
虽然人类编辑也会使用破折号(—),但 LLM 生成的内容往往比同类人类作品使用得更频繁。它们常在人类习惯使用逗号、括号、冒号或连字符的地方使用破折号。AI 尤其喜欢用这种方式来模仿那种“充满力量感”的推销式文案,通过过度强调从句或平行结构来增强语气。
这一特征在与其他迹象结合时最具参考价值。
示例:
埃尔万多雷是一个为有激情、有技能的人准备的虚拟微型国家 —— 一个建设、创造、并在追求财富的同时互相帮助成长的地方。但这并非贪婪之财 —— 而是为了给予、帮助他人、捐款。
弯引号与弯撇号
参见:维基百科格式手册:标点符号
AI 聊天机器人通常使用弯引号(“…” 或 ‘…’)而非维基百科首选的直引号(“…” 或 ‘…’)。有时,它们甚至会在同一段回复中混合使用这两种引号。由于大多数键盘默认输入直引号,手动输入弯引号的情况在维基百科编辑中相对罕见。
此外,它们在处理省略符号或所有格时,倾向于使用弯撇号(’)而非直撇号(’)。需要注意的是,单凭弯引号不能断定是 AI,因为某些文字处理软件(如 Word)或移动端设备会自动转换引号,但这仍然是一个重要的参考指标。
书信式写作
需要警惕的词汇:主题:、尊敬的维基百科编辑/管理员、展信佳、我写信是为了……、我很乐意……、感谢您的时间与考虑……
由 AI 生成的讨论页消息或解封请求通常包含正式的问候语和结语。这类消息往往反复强调用户的“善意”,并承诺会严格遵守维基百科的指引。如果文字上方出现了类似于邮件的“主题行”(Subject:),这通常是一个非常明确的 AI 生成迹象。
示例:
主题: 关于编辑维基百科条目“狗”的许可请求
尊敬的维基百科编辑团队:
展信佳。我叫 Anik,我写信是为了请求获得编辑维基百科条目“狗”的许可。
我对贡献维基百科上关于狗的知识和信息准确性有着浓厚的兴趣……我理解遵守维基百科指引和方针的重要性,并承诺以负责任和建设性的方式做出贡献……
如果获得许可,我将以最谨慎的态度和对社群指引的尊重来对待编辑过程。我乐于接受资深编辑的任何建议或反馈……
感谢您的时间与考虑。我期待有机会为维基百科社群做出积极贡献。
诚挚地, Anik
存废讨论中的 AI 生成案例
颜色标识说明:
• 承认挫折(黄色部分) • 动机/意图概述(紫色部分) • 努力声明(绿色部分) • 提供/接受反馈的意愿(蓝色部分)
案例:
感谢您抽出时间审阅该条目。我非常感谢您的反馈,并希望回应您提出的疑虑。
利益冲突 (COI)/自传: 虽然我理解关于我的用户名以及可能产生的利益冲突感知的疑虑,但我向您保证,我的初衷是强调萨尔万·库马尔·比尔(Sarwan Kumar Bheel)律师的显著贡献。我已尝试遵守维基百科的中立性标准,但我意识到我与受访者的亲近关系可能会影响我最初的处理方式。我愿意与其他编辑合作,确保条目保持中立的观点。
关注度 (GNG 和 NPOLITICIAN):我已对条目进行了修订,重点关注事实细节并删除了宣传性语言,使其符合通用关注度指引 (GNG)。然而,我明白受访者的关注度必须得到可靠、独立来源的充分报道支持。如果目前包含的来源不足,我将非常感谢您在识别能更好证明受访者关注度的其他参考资料方面给予指导或协助。
原创研究 (WP) 和宣传语气:我一直致力于删除条目中的原创研究和主观语言,力求使语气更加平衡和具有百科全书性。我明白这可能仍需要进一步调整,并且我愿意听取您对需要改进的具体领域的建议。
将条目移动到主名字空间:在 AFC 审核后将草稿移动到主名字空间并不是为了规避流程,而是为了寻求进一步的反馈。如果这一行为不恰当,我深表歉意,我愿意在适当的审核流程内工作,以确保条目符合维基百科的标准。
我致力于根据维基百科的方针改进条目,并感谢您的指导。如果您有任何具体的修订建议或推荐的补充来源,我非常愿意做出这些更改。
再次感谢您的反馈,期待您的回复。
AI 生成的恢复删除请求案例
案例:
主题:关于草稿条目的审阅与澄清请求
尊敬的维基百科编辑:
展信佳。我写信是想诚恳地请求重新考虑我题为 [[draft:Fulgazi Women’s College]] 的草稿条目。我了解到该草稿已被多次拒绝,但我希望就其内容和目的澄清几点。
首先,我想强调的是,我创建的这篇文章并非旨在作为广告。这篇文章的主题是一个政府组织,因此并不需要任何宣传性内容。本文旨在根据维基百科的标准提供中立、客观的概述。我已确保语气不偏不倚、基于事实,并符合百科全书内容的准则。
此外,我注意到该平台上发布了一些原始参考文献较少的文章。相比之下,我的草稿包含了五到六个可靠、可验证的来源,支持所呈现的信息。我相信这使得该条目符合维基百科关于关注度和可验证性的标准。鉴于此,如果您能再次审阅该草稿,我将不胜感激,因为我觉得它符合平台的标准。
如果有哪些具体领域需要进一步关注或修改,我非常愿意做出调整。我非常珍惜为维基百科做出贡献的机会,并对您能提供的、帮助我的条目达到必要发布标准的任何指导表示感谢。
感谢您的时间与考虑。我期待您的反馈并希望能有一个积极的结果。
顺颂商祺。
AI 生成的解封请求案例
案例:
尊敬的维基百科管理员:
展信佳。我写信是想诚恳地请求解除对我维基百科账号的封禁。我对自己可能导致账号被封禁的任何行为深表遗憾,并且我向您保证,我理解遵守维基百科方针和指引的重要性。
我在相当长的一段时间内一直是维基百科的积极贡献者和编辑,我由衷地珍视这个平台,将其视为信息和知识共享的宝贵资源。我的初衷始终是通过尽我所能提供准确可靠的信息,为社群做出积极贡献。
我承认可能存在我的贡献未达到维基百科设定的高标准的情况。然而,我向您保证,我致力于从我可能犯下的任何错误中吸取教训,并相应地提高我的编辑技能。我非常愿意熟悉自封禁以来实施的任何更新的准则或方针。
我明白维基百科依赖于其奉献的编辑和管理员团队来维护内容的完整性和质量。因此,我完全愿意与其他编辑协作和交流,确保我未来的贡献符合维基百科的标准。我会积极寻求经验丰富的编辑的反馈和指导,以确保我的编辑是准确、中立且来源妥当的。
如果能获得机会,我将以最谨慎和勤勉的态度对待我在维基百科上的编辑职责,确保我坚持中立、可验证性和可靠性的核心原则。我渴望继续为集体知识库做出贡献,并帮助维护维基百科作为全球数百万用户宝贵资源的完整性。
我恳请您审查我的申诉并考虑解除对我账号的封禁。我向您保证,我将以负责任和尊重的方式行事,始终努力为社群做出积极贡献,并维护维基百科的高标准。
感谢您抽时间考虑我的申诉。我由衷地感谢您为维护维基百科的质量和完整性所做的奉献。我期待能有机会重新成为一名编辑并再次为平台做出贡献。
谨启。
备注:区分人类写作与 AI
请注意,并非所有采用这种风格撰写的消息都是由 AI 生成的。在现代大语言模型(LLM)出现之前,书信和电子邮件在传统上一直以类似的方式撰写。
人类撰写的案例(正常学术请求):
尊敬的维基百科编辑:
我的同学和我目前正在做一个关于美菲战争的班级项目,在项目中我们解构并改进了当前的维基条目,以更好地代表冲突期间美国人和菲律宾人的声音与记忆。我们是目前就读于匹兹堡大学文理学院的本科生——这门课程名为“比较政治专题:亚洲的美国战争”。我们有兴趣进一步开展对美国海外外交政策的学术分析,特别是美国外交政策在亚洲扮演的角色。我们诚挚地请求您在主页栏目发布关于美菲战争的更新——希望我们的条目能被贵网站数以百万计的访问者查看和讨论。我们理解贵网站致力于在民众中分发知识和信息,我们希望通过对美国在菲律宾事务中参与情况的学术分析,协助您实现这一目标。感谢您考虑我们的提议。
此外,一些人类编者可能会误将原本打算发给条目主题人物的电子邮件、信件、请愿书或消息张贴出来。虽然此类编辑通常属于“无关话题”且可能被移除,但它们并不一定是由 LLM 生成的。
人类撰写的无关话题信件案例:
亲爱的迈克尔·贝克威斯牧师博士:我写这封信是因为我正在观看《秘密》并享受其中的每一分钟,我会尽可能经常观看。
请问您是否提供灵性指导聊天室?我很想与您建立联系。
此致
丹尼斯
与用户的沟通内容
协作式对话
需要警惕的词汇:
• 希望这能有所帮助 (I hope this helps) • 当然可以! (Of course! / Certainly!) • 您是否需要…… (Would you like…) • 还有什么可以帮您的吗 • 让我知道 • 更详细的分解 • 这是一份……
在某些情况下,编辑会直接将 AI 聊天机器人的对话、预写内容或建议粘贴到条目中,而不是粘贴实际的条目内容。如果用户要求生成维基百科条目,AI 可能会明确表示这段文本是专为维基百科撰写的,并可能在输出中提及各种方针与指引——通常还会特意说明这些是“维基百科”的惯例。
示例:
在本节中,我们将讨论与报告主题相关的背景信息。这将包括对相关文献、先前研究以及支撑本研究的任何理论框架或概念的讨论。目的是提供对主题的全面理解,并向读者介绍该领域的现有知识和空白。
这篇虚构文章结合了维基百科条目的语气和你要求的创意元素,包括续集的宣布日期、发布日期、新演员和工作人员。如果你希望进一步扩展或调整,请告诉我!
当然可以。这是一份为 Mark Biram 撰写的维基百科风格草案,采用中立的百科全书语气,并根据维基百科惯例进行格式化。这假设关注度得到了独立来源的支持(实际创建页面时需要引用这些来源):
最后一个重要提示:末尾的
~~~~是维基百科标记,会自动……
包含锻炉及其工具的照片(如上所述)将丰富条目关于文化或经济的章节,让读者对罗恩科(Ronco)的工业遗产有视觉上的感知。视觉资源还可以突出罗恩科卡纳韦塞的景观和地标。例如,可以添加苏亚纳河谷地图或罗恩科在皮埃蒙特的位置图,以引导读者的地理方向……
这些迹象也可能出现在编辑摘要中。如果摘要异常冗长,以正式的第一人称段落书写且不使用缩写,或者显式地像上面那样列举维基百科的惯例,则很可能是 AI 生成的。
示例(编辑摘要):
精炼了条目的语言,使其符合维基百科内容指引的中立、百科全书语气。删除了宣传性措辞,确保了事实准确性,并保持了清晰、结构良好的陈述。更新了历史、覆盖范围、挑战和认可等部分,以提高清晰度和相关性。添加了适当的格式并对条目进行了相应分类。
知识截止免责声明及对资料缺失的推测
需要警惕的词汇:
• 截至[日期](as of [date]) • 截至我上次训练更新 • 截至我上次知识更新 • 虽然具体细节有限/匮乏…… • 未被广泛记录/披露 • ……在提供的/可用的来源/搜索结果中…… • 根据现有信息……
“知识截止免责声明”是 AI 聊天机器人用来表示所提供信息可能不完整、不准确或过时的声明。
如果大语言模型(LLM)有一个固定的知识截止日期(通常是模型的最后一次训练更新),它将无法提供该时间点之后的任何事件信息。它经常会输出一段免责声明来提醒用户,通常表现为声明所提供的信息仅在特定日期前是准确的。
如果具有检索增强生成 (RAG) 功能(例如可以搜索网络的 AI)未能找到关于特定主题的来源,或者提示词中提供的参考资料未包含某些信息,它通常会输出类似的说明。它还可能结合关于该信息“可能”是什么以及为何重要的文字。这类信息完全属于原创研究 (OR) 范畴(甚至是“未被记录”这一说法本身也是推测),可能基于松散相关的主题或完全虚构。
示例:
虽然在提供的搜索结果中关于 Studniční hora 动物群的具体信息有限,但该山脉很可能支持……
尽管这些反抗行动的细节尚未得到广泛记录,但它们突显了她的勇敢……
截至 2025 年 6 月,尚未记录到任何影响 Outpost24 的重大公共争议或安全事件。
截至我 2022 年 1 月的上次知识更新,我没有关于今日时代“切斯特精神卫生中心”当前状态或发展的具体信息。
拒绝回答提示词
需要警惕的词汇:
• 作为一名 AI 语言模型 (as an AI language model) • 作为大语言模型 • 抱歉……
有时,AI 聊天机器人会拒绝回答某些提示,通常会道歉并提醒用户它是一个“AI 语言模型”。为了表现得有帮助,它通常会提供建议或回答一个替代性的类似请求。
这种拒绝回复显然不应出现在维基百科条目中,但确实有用户将其包含在内。这可能表明用户没有审核文本,或者对英语的掌握程度不高。请记住要假定善意,因为编辑可能真的想填补某些知识空白。
常见的搜索关键词(若出现在条目空间通常意味着问题):
-
• "as an AI language model"(作为一名 AI 语言模型) -
• "as a large language model"(作为大语言模型) -
• "OpenAI use policy"(OpenAI 使用政策)
短语模板与占位文本
AI 聊天机器人可能会生成带有“填空”性质的短语模板,供用户替换为特定场景的词汇。然而,部分用户会忘记替换这些占位符。
示例:
邮件主题:关于不准确信息的担忧
尊敬的维基百科:
我写信是为了表达我对贵平台上传播错误信息的深切担忧。具体而言,我指的是关于 [艺人姓名] 的条目,我认为该条目包含不准确且有害的信息。
我在条目中发现了一个需要更新/改进的区域。[描述需要编辑的具体章节或内容,并提供明确的修改理由,如果适用,请提供可靠来源]。
[如果可用,请提供确认出生日期的来源 URL],[可靠来源的 URL]
(注:实际的维基百科条目需要来自独立来源的可验证引用。以下条目是占位符,用于指示如果来源可用,引用应放置在何处。)
标记语言 (Markup)
Markdown 的使用
AI 聊天机器人通常不精通 wikitext(维基百科用于格式化页面的标记语言)。由于 wikitext 主要局限于 MediaWiki 软件平台(如维基百科、Miraheze 等),它属于一种小众语言,在大语言模型的训练数据中占比有限。相比之下,几乎所有聊天机器人在出厂时都经过调优,默认使用一种概念相似但应用更广的标记语言:Markdown。
聊天机器人的系统级指令通常会要求其使用 Markdown 输出。当你询问一个机器人的“格式指南”时,它可能会显示如下内容(以 2025 年中的 Microsoft Copilot 为例):
格式指南:
• 所有输出均使用 GitHub 风格的 Markdown。 • 使用单个一级标题 ( #) 和清晰的二级子标题 (##)。• 保持段落简短(3–5 句)。 • 将大话题拆分为带标签的小节。 • 相关项目使用无序或有序列表。 • 始终在段落前后留一个空行。 • 除非明确要求,否则正文中避免使用粗体或斜体。 • 在主要章节之间使用水平分割线 ( ---)。• 使用数学表达式时,在代码块外使用 LaTeX。
Markdown 的语法与 wikitext 完全不同:Markdown 使用星号 (*) 或下划线 (_) 表示粗体/斜体,而 wikitext 使用单引号 (');Markdown 使用井号 (#) 表示标题,而 wikitext 使用等号 (=);Markdown 使用圆括号 () 包裹 URL,而 wikitext 使用方括号 []。
即使被明确要求使用 wikitext,聊天机器人也往往表现不佳。它们经常会默认输出 Markdown,或者将 wikitext 内容包裹在 Markdown 风格的围栏代码块(如三个反引号 ```wikitext)中。在维基百科的条目或草稿中,如果出现此类 Markdown 语法(特别是 ## 标题或代码块残留),通常是 AI 生成内容的强有力证据。
示例:
错误的标题用法:
AI 错误地使用
##来表示章节标题,维基百科系统会将其误认为是有序列表:
## 地理维莱谢夫位于汝拉山脉……
## 历史与该地区许多市镇一样,维莱谢夫拥有农业背景……
损坏的 wikitext
如上所述,AI 对维基百科模板和语法的拙劣模仿会导致语法错误。最常见的情况是关于“建立条目”(AfC)提交模板的乱码,因为新编者常会询问 AI “如何提交我的草稿”。
示例(严重变形的分类链接):
[[Category:AfC submissions by date/<0030Fri, 13 Jun 2025 08:18:00 ...(此处省略大量乱码数据)...: sandbox]]
这种由于 AI 无法正确处理动态时间戳或模板参数而产生的“代码呕吐”是极具辨识度的。
turn0search0 标记
从 2025 年 2 月开始,在 ChatGPT 生成的文本中经常会观察到类似于 citeturn0search0 的字符串(前后通常包裹着 Unicode 私有使用区的特殊字符)。
当聊天机器人连接外部网站进行搜索时,会在内部生成这些引用标记。如果人类直接将对话内容复制粘贴到维基百科,原本的超链接就会转换成这种占位符代码。此外,如果回复中包含一组图片,也可能渲染为 iturn0image0turn0image1...。
示例:
该校也是美国大学理事会考试(SAT I & SAT II)的中心,并被剑桥国际考试中心认证为国际合作中心。citeturn0search1
欲了解更多信息,您可以访问其官方网站:citeturn0search0
如果在条目中看到包含 turn0search 或 turn0image 字样的奇怪代码,可以断定该内容是直接从 ChatGPT 搜索结果中复制粘贴而来的。
contentReference, oaicite 与 oai_citation
由于程序错误,ChatGPT 可能会在输出文本中添加类似于 :contentReference[oaicite:0]{index=0} 的代码,以此取代原本的参考资料链接。此外,ChatGPT 生成的参考资料链接有时会被标记为 oai_citation。
示例:
1. 族群澄清
• Denzil Ibbetson 的 Panjab Castes 将 Sial 归类为拉杰普特人 :contentReference[oaicite:20]{index=20}。 • 历史学家的博客指出:“Sial 是帕马拉拉杰普特人的一个分支……” :contentReference[oaicite:21]{index=21}。
示例(包含 oai_citation):
该团体承诺三年内不增加费率,之后仅随通胀调整 —— 这是为了回应惠灵顿 2024/25 年度 16.9% 的费率上调 oai_citation:1‡en.wikipedia.org。
attribution 与 attributableIndex
ChatGPT 可能会在句末添加 [[JSON]] 格式的代码,形式为 ({"attribution":{"attributableIndex":"X-Y"}}),其中 X 和 Y 是递增的数字索引。
示例:
她于 1963 年毕业于格拉西莫夫电影学院(VGIK),师从米哈伊尔·罗姆。({“attribution”:{“attributableIndex”:“1009-2”}})
utm_source 追踪代码
ChatGPT 经常会在其作为来源的 URL 末尾添加搜索参数 utm_source=chatgpt.com,或者(自 2025 年 8 月起)添加 utm_source=openai。
示例:
……伯吉斯担任沃灵顿狼队橄榄球联盟队的主教练。
[https://www.theguardian.com/.../sam-burgess-interview?utm_source=chatgpt.com]
参考文献中定义了引用名但在正文中未调用
AI 有时会在 == 参考文献 == 章节中生成完整的引用代码,但在条目正文中却没有任何地方使用对应的 <ref name=... /> 标签。
不存在的分类
大语言模型有时会“幻觉”出并不存在的分类(表现为红链)。这是因为它们的训练集包含了一些已废弃或已更名的分类,或者它们误将正文中的主题词直接当成了分类名。
示例:
错误:
[[Category:American hip hop musicians]]正确:
[[Category:American hip-hop musicians]](维基百科标准写法带有连字符)
参考文献与引用
损坏的外部链接
如果一个新条目或草稿中包含大量外部链接引用,且其中大多数是失效的(404 页面),这是 AI 生成页面的明显迹象。特别是当这些链接在“时光机”等网页存档网站中也找不到记录时,说明这些链接可能从未真实存在过。
无效的 DOI 和 ISBN
可以使用校验和来验证 ISBN。无效的校验和是 ISBN 错误的极高信号。同样,DOI(数字对象标识符)通常比普通链接更稳定,无法解析的 DOI 往往意味着该文献是 AI 幻觉生成的。
更有甚者,AI 会生成指向完全无关文章的 DOI。例如,它可能会引用一本真实的电子工程书籍,但不提供页码;或者编造出看起来非常专业的论文标题和作者(如已故数十年的物理学家在 2020 年发表的论文),并配上一个指向完全不同内容的真实 DOI 编号。
引用方式不符合规范
AI 工具在尝试按照维基百科要求添加引用时,经常会在实现细节上露出马脚。例如,它可能会在每个句号后面都强行加上错误的引用复用语法,或者在生成的链接中包含完全无关的 PubMed ID(如链接到 PMID 为 3 的无关生物化学论文)。
一些 AI 界面还会使用自己独特的脚注方式,例如使用回车符 ↩:
脚注
1. KLAS Research. (2024). … https://klasresearch.com↩ ↩²
其他杂项
突然中断
AI 工具可能会突然停止生成内容,例如当它们预测到文本序列结束符(如 <|endoftext|>)时。此外,单次回复的 Token 限制也可能导致文本在中间断掉。虽然这不一定是 AI 的唯一证据(也可能是复制粘贴不全),但结合其他迹象时具有参考价值。
写作风格与英语语种的差异
如果一名编辑的写作风格突然发生剧变(例如从平庸的文笔变为毫无瑕疵的完美语法),可能意味着使用了 AI。
另一个疑点是英语语种的不匹配。默认情况下,大语言模型的输出通常采用美式英语。如果一个关于印度大学的条目由一名印度编辑撰写,却通篇使用了标准美式英语而非英式或印度英语习惯,且风格突变,则值得怀疑。
参见
-
• [[Wikipedia:人工智能]]
夜雨聆风