关于AI批改助手,老师们关心的问题都在这里

关于 AI 批改助手，老师们关心的问题都在这里

各位老师好。

这几天，AI 批改助手收到了很多关注，也收到了非常多老师的留言、私信和反馈。

很多问题其实比较集中：

怎么获取安装文档？怎么联系作者？哪些平台可以用？新平台能不能适配？是否收费？准确率怎么样？数据会不会被拿去训练？理科题、作文、分小题能不能批？如果 AI 批错了怎么办？

因为私信数量比较多，我没有办法及时逐条回复每一位老师，所以专门整理了这篇 FAQ。

如果您是第一次了解这个工具，建议先看完这篇文章，再根据需要回复关键词获取文档、联系方式或反馈入口。

1. AI 批改助手是什么？

AI 批改助手是一款用于辅助老师进行电子阅卷的工具。

它的主要作用是：

在老师原本使用的电子阅卷平台中，读取学生答题卡图片，调用多模态 AI 进行识别和评分，再根据老师设置的评分标准给出分数、评分依据和评语。

它不是一个新的阅卷平台。

更准确地说，它是在老师已有的阅卷平台基础上，增加一层 AI 辅助批改能力。

也就是说，老师不需要把整套阅卷流程迁移到一个新系统里，而是在原来的阅卷页面上，尝试让 AI 帮助完成一部分重复性、标准化的批改工作。

2. 它适合解决什么问题？

它主要适合解决下面几类问题：

第一，大批量电子阅卷带来的重复劳动。

比如大考之后，老师面对几百份、上千份甚至更多答卷，需要长时间盯着屏幕批改。AI 批改助手希望尽量帮老师减少这部分重复性工作。

第二，评分标准相对明确的主观题批改。

比如简答题、步骤题、部分理科解答题、语文主观题、英语表达题等。如果评分标准清楚，AI 会更容易稳定执行。

第三，需要保留批改记录和导出结果的场景。

工具支持历史记录和结果导出，便于老师后续回看、复核和整理。

第四，需要更高一致性的批改场景。

通过统一评分标准、双评模式和仲裁机制，可以尽量减少前后评分尺度不一致的问题。

3. 它是不是要替代老师？

不是。

AI 批改助手的定位不是替代老师，而是辅助老师。

尤其是在教育场景里，学生分数、评分依据和教学反馈都非常重要，不能简单交给 AI 完全自动决定。

更合理的使用方式是：

先让 AI 完成初步识别和评分，老师再根据需要进行试改、抽查、复核和调整。

对于重要考试，建议老师保留人工复核环节。

AI 可以帮老师减少重复劳动，但最终的教学判断仍然应该由老师把关。

4. 怎么获取安装文档和使用说明？

请先关注公众号，然后在公众号后台私信回复：

【阅卷】

系统会自动发送安装文档、使用说明和相关入口。

请注意：

不是在文章留言区回复“阅卷”。

需要在公众号后台对话框里回复【阅卷】，才能触发自动回复。

很多老师之前在文章留言区回复关键词，所以没有收到文档，主要就是因为这个原因。

5. 怎么联系作者？

请先关注公众号，然后在公众号后台私信回复：

【微信】

即可获取联系方式。

由于近期消息比较多，可能无法第一时间通过好友申请或回复私信，还请老师们理解。

如果是比较具体的 bug、新平台适配或功能建议，也建议优先通过反馈问卷提交，这样更方便整理和后续处理。

6. 如何反馈问题、申请新平台适配或提出新功能建议？

请先关注公众号，然后在公众号后台私信回复：

【反馈】

即可获取反馈问卷入口。

也可以直接填写飞书反馈问卷：

反馈内容可以包括：

新平台适配申请已支持平台无法使用安装或配置问题批改效果或准确率反馈新功能建议其他使用体验问题

如果是申请适配新平台，建议尽量在平台里有真实阅卷任务时提交反馈，并提供平台名称、网址、阅卷页面截图或录屏。

因为平台适配通常需要进入具体的阅卷页面，查看答题卡如何加载、分数如何填写、是否分小题、提交按钮如何触发。仅提供平台名称或登录首页，很多时候无法完成判断。

7. 目前支持哪些平台？

目前工具已经适配或正在适配多个阅卷平台。

不同平台的页面结构、图片加载方式、评分方式和提交逻辑都不一样，因此支持情况会随着版本持续更新。

近期已推进或优化过的平台包括：

智学网七天网络好分数五岳阅卷华翰云光大阅卷云阅卷新教育智能平台鑫考阅卷润建学情大数据平台54 学霸等

具体支持情况请以文档站和最新版本说明为准。

如果您的平台暂未支持，可以通过【反馈】入口提交新平台适配申请。

8. 为什么适配一个新平台不能马上完成？

因为不同阅卷平台差异非常大。

有的平台答题卡是普通图片。

有的平台使用 Canvas 渲染。

有的平台通过接口加载图片。

有的平台把答题卡放在 CSS 背景图里。

有的平台运行在学校内网环境。

有的平台是点击式评分。

有的平台需要分小题给分。

有的平台提交时会弹出确认窗口。

还有的平台在刷新、切题、提交后页面状态会发生变化。

所以，新平台适配不是简单“加一个网址”。

真正要做的是：

确认能否正确获取当前答题卡图片；确认图片是否和当前正在评阅的试卷一致；确认分数输入或点击位置；确认是否支持分小题；确认提交按钮和确认弹窗逻辑；确认连续批改时是否会错位或异常。

其中最危险的问题是“图片错位”。

AI 批得再准，如果拿到的不是老师当前正在评阅的那张答题卡，后面的评分就没有意义。

所以平台适配需要谨慎测试。

9. 申请适配新平台时，最好提供什么？

如果您希望适配新平台，建议尽量提供：

平台名称平台网址是否有真实阅卷任务阅卷页面截图或录屏是否需要分小题给分评分方式是输入分数还是点击分数是否需要自动提交主要学科和题型是否方便协助测试

如果能提供一个有阅卷任务的测试账号，或者在有任务时协助远程查看，会大大提高适配效率。

如果暂时没有真实阅卷任务，也可以先提交平台名称和需求，我会先记录，但可能无法立即判断是否能适配。

10. 这个工具收费吗？

目前工具本身仍处于开放测试和快速迭代阶段。

但 AI 批改需要调用大模型 API，因此会产生模型调用成本。

实际成本会受到很多因素影响，比如：

题目长度答题卡图片数量使用单评还是双评是否触发仲裁所选模型配置批改任务复杂度

根据我近期测试经验，双评模式下每千份答卷大约在 10 元左右，单评快速模式下大约为其一半。这个数字仅供参考，实际成本会随题型、图片数量和模型配置变化。

后续我也会继续优化成本，让它尽量保持在老师日常能接受的范围内。

11. 单评、双评和仲裁有什么区别？

单评模式是由一个 AI 模型进行评分。

它速度更快、成本更低，适合低风险、批量较大、评分标准比较清晰的任务。

双评模式是由两个模型独立评分。

如果两个评分结果接近，可以认为结果相对稳定；如果分差超过设定阈值，可以触发更高等级模型进行仲裁。

双评模式成本会更高，但稳定性和可检查性也更好。

简单来说：

想要更快、更省，可以先尝试单评。

想要更稳、更谨慎，可以使用双评和仲裁。

12. 准确率怎么样？

准确率不能用一个固定数字简单概括。

它通常取决于几个因素：

学生字迹是否清晰；答题卡图片是否完整；题型是否适合标准化评分；评分标准是否清楚；模型的多模态识别能力；是否开启双评和仲裁。

对于步骤明确、评分标准清楚的主观题，效果通常会更稳定。

对于特别潦草的字迹、复杂公式、开放作文、有机结构式、图形推理较强的题目，仍然建议谨慎使用，先进行小批量试改。

我不建议一上来就完全无人值守批改重要考试。

更稳妥的方式是：

先试改一小批；查看识别答案和评分依据；根据错误样例调整评分标准；必要时开启双评；正式批量后进行抽查和复核。

13. 如果 AI 批得不准怎么办？

如果发现 AI 批得不准，可以先从几个方面排查：

评分标准是否足够清楚；学生答案是否识别正确；题目图片是否完整；是否存在字迹过于潦草或图片模糊；是否需要补充评分规则或典型样例；是否适合开启双评或仲裁。

工具本身也在不断优化纠错、双评、历史记录和导出能力。

我的目标不是让 AI 永远不犯错，而是尽量让批改过程可检查、可回看、可纠正。

对于重要考试，仍然建议老师保留人工复核和抽查。

14. 理科题可以批吗？

可以尝试，但要分情况。

对于评分标准明确、步骤较清楚的理科主观题，比如部分数学、物理、化学计算题，AI 批改助手可以辅助识别过程并给分。

但对于特别复杂的公式推导、几何图形、有机化学手写结构式、字迹非常潦草的答案，目前仍然有一定难度。

最近我也在推进 Markdown 和 KaTeX 相关开发，希望后续能够更好地展示公式、步骤和结构化评分过程。

理科题是后续重点优化方向之一，但仍建议老师先小规模试改。

15. 作文可以批吗？

作文可以尝试辅助批改，但不建议完全依赖 AI 自动定分。

作文评分往往涉及内容、结构、语言、表达、立意、文采等多个维度，开放性更强，也更依赖老师对评分标准的把握。

如果使用 AI 辅助作文批改，建议把评分维度写清楚，并先进行小批量试改。

比较合适的使用方式是：

让 AI 给出初步评分和评语；老师根据评分标准进行复核；对典型误判样例继续调整提示词和规则。

16. 分小题给分支持吗？

支持部分平台和部分题型的分小题给分。

分小题支持情况和阅卷平台有关。

有的平台本身提供多个小题输入框，有的平台只有总分输入，有的平台通过点击式评分实现。

如果您需要分小题给分，建议在反馈时说明：

平台名称；是否有分小题输入区域；题目结构；是否需要每小题分别给分；是否需要自动提交。

后续我也会继续优化分小题识别、取整、双评平均和分数填入逻辑。

17. 没有扫描仪可以用吗？

目前 AI 批改助手主要面向已经使用电子阅卷平台的场景。

也就是说，学生答题卡通常已经通过学校或平台完成扫描，并进入智学网、七天网络、好分数、云阅卷等电子阅卷系统。

工具是在这些已有阅卷页面中辅助老师批改。

如果学校完全没有扫描或电子阅卷流程，目前使用会比较困难。

后续也可以考虑支持图片或 PDF 上传后批改，但这会是另一个工作流，和当前“电子阅卷平台辅助批改”不完全一样。

18. 默认模型 aimarker 是什么？会不会拿数据训练？

默认配置里的 aimarker 并不是我自己训练出来的专有大模型。

它更像是一个模型路由中继，会根据配置将请求转发给合适的多模态模型完成识别和评分。

请求数据不会被用于模型训练。

也不会因为使用这个工具，就把老师的答卷、评分标准或批改内容拿去训练模型。

但不同学校对数据安全的要求不同。如果是正式考试、大规模敏感数据，仍然建议老师遵循学校规定，先在测试环境或非敏感场景中验证后再使用。

后续我也会继续把模型配置、供应商选择、数据流向等说明写得更清楚。

19. 平台本身已经有 AI 阅卷，为什么还需要这个工具？

很多阅卷平台确实已经有 AI 阅卷能力。

但现实情况是，并不是所有学校都开通了平台自带的 AI 阅卷服务。

很多老师实际使用的，仍然只是普通电子阅卷功能。

也就是说，平台可以在线看卷、打分、提交，但具体批改仍然需要老师手动完成。

AI 批改助手的定位，不是替代这些平台，而是在已有普通阅卷功能之上，为老师增加一层可配置、可导出、可双评、可持续迭代的 AI 辅助能力。

它更像是一个教师个人可以尝试使用的 AI 批改辅助工具。

20. 后续会做哪些功能？

目前反馈比较集中的方向包括：

题目、答案、图片支持直接上传，并由 AI 自动解析；空白答题卡自动跳过；理科题公式和步骤展示优化；Markdown 和 KaTeX 支持；更多阅卷平台适配；平台图片获取和提交逻辑继续增强；双评和仲裁机制继续优化；历史记录和导出体验继续完善；后续错题分析、学情分析、针对性练习生成等。

这些功能不会一次性全部完成。

我会根据老师们的真实反馈、使用频率、开发难度和影响范围逐步安排。

21. 为什么我的私信没有及时回复？

这里也想向各位老师说声抱歉。

目前这个项目不是公司团队运营，也没有完整的客服和产品团队。

主要还是我一个人在开发、维护、测试、写文档和回复消息。

同时我现在还是学生，也有课程、实验、作业、考试、比赛和其他项目。

所以有些消息无法第一时间回复，还请老师们理解。

如果是新平台适配、bug 反馈或功能建议，建议优先通过【反馈】问卷提交，这样更容易整理，也不容易被私信淹没。

22. 我应该如何开始使用？

建议按这个顺序：

第一步，关注公众号，在后台私信回复【阅卷】，获取安装文档和使用说明。

第二步，确认自己所在平台是否已经支持。

第三步，按照文档完成安装和配置。

第四步，先选择一小批答卷进行试改。

第五步，检查 AI 识别答案、评分依据和最终得分是否合理。

第六步，确认稳定后，再逐步扩大批改规模。

如果遇到问题，可以回复【反馈】填写问卷。

如果需要联系作者，可以回复【微信】获取联系方式。

最后

感谢每一位愿意尝试、反馈、提醒和鼓励的老师。

AI 批改助手还不完美。

它仍然会遇到平台适配、图片识别、评分稳定性、安装配置、数据安全说明等很多问题。

但也正是因为有老师们的真实使用和反馈，它才有机会一点点变得更稳定、更好用。

如果您需要安装文档：

请关注公众号后，在后台私信回复【阅卷】

如果您需要联系作者：

请关注公众号后，在后台私信回复【微信】

如果您需要反馈问题、申请适配新平台或提出功能建议：

请关注公众号后，在后台私信回复【反馈】

再次提醒：

关键词需要在公众号后台对话框中发送，不是在文章留言区回复。

留言区回复关键词不会触发自动回复。

感谢各位老师的理解和支持。