AI 改卷工具爆款之后,我成了一个人的产品部

爆款之后，我成了一个人的产品部

距离上一次发公众号，已经过去 13 天了。

这 13 天里，有很多老师私信我、加我微信、在群里反馈问题，也有很多老师提出了新平台适配和功能建议。

其中不少消息，我没有及时回复。

有些好友申请，我没有第一时间通过。

有些平台适配需求，我看到了，但还没来得及仔细处理。

这里先向各位老师认真说一声抱歉。

不是不重视。

是真的有些处理不过来。

也想借这篇文章，先说明一件事：

这个项目目前并不是一个公司在运营，也不是一个完整团队在维护。

主要还是我一个人在做。

写代码是我。

修 bug 是我。

测平台是我。

发版本是我。

写文档、看反馈、回消息，也主要还是我。

同时，我现在也还是学生。

这段时间，我照常要上课、做实验、写作业、开组会，也有考试和比赛。

所以如果有些老师的消息没有及时回复，或者有些问题没有马上处理到，还请老师们多包涵。

当然，我不想用“我一个人”来为所有回复慢开脱。

相反，这 13 天让我意识到：

当一个项目真的被很多老师使用以后，它就不再只是一个学生写的小工具了。

它开始需要更稳定的功能，更清楚的边界，更可靠的适配，也需要我用更成熟的方式去推进它。

5 月 13 日，我发出了那篇关于 AI 批改助手的文章。

发之前，我以为它只是一次阶段性记录。

记录一下这个工具从最早的小脚本，到后来能完成千份级批改、支持双评仲裁、导出 Excel 的过程。

没想到第二天开始，文章突然被很多老师看到。

阅读量涨起来了。

关注涨起来了。

后台私信、留言、好友申请、群消息也一起多了起来。

一开始当然是开心的。

但很快，开心之后更多的是一种很强烈的压力。

因为老师们不是来看热闹的。

老师们带来的，是一个个真实场景。

“我这个平台能不能用？”

“理科题可以批吗？”

“准确率怎么样？”

“如果 AI 批错了怎么办？”

“学生答卷会不会被拿去训练？”

“题目和答案能不能不要手动整理？”

“空白答题卡能不能自动跳过？”

这些问题，一开始看上去像咨询。

但后来我发现，它们其实都是产品问题。

更准确地说，它们都在提醒我：

AI 批改助手如果想真正进入老师的工作流，不能只证明“AI 能批”。

还要证明它能稳定地批、可检查地批、在不同平台上批、在异常情况下不乱批，也要尽量减少老师使用前的准备工作。

这也是为什么，我觉得这 13 天里自己最大的变化，不是又发了几个版本。

而是我开始从“把功能做出来”，转向“把产品做可靠”。

从上一次文章发布到现在，后台一共监控到了 78342 条调用记录。

这个数字对我来说，比阅读量更有冲击力。

阅读量说明文章被看见。

调用记录说明工具真的被使用。

它意味着，有老师打开了工具，进入阅卷页面，配置任务，把它放进了自己的批改流程里。

这不再只是一个演示项目。

它开始进入真实的阅卷现场。

也正是从这个数字开始，我开始重新理解“产品”这两个字。

以前我更关心：

功能能不能跑。

模型能不能给分。

双评能不能完成。

Excel 能不能导出。

平台能不能适配。

现在我开始关心更多事情：

一次批改能不能稳定完成。

图片有没有拿错。

分数有没有填到正确位置。

双评失败后有没有重试。

异常分数能不能识别出来。

公式和步骤能不能更清楚地展示。

空白答题卡能不能自动跳过。

老师配置题目和答案时，能不能少做一点重复整理。

这些问题都更细，也更麻烦。

但它们才是真实使用里会遇到的问题。

一个工具不是靠开发者宣布它成熟。

而是靠一次次真实使用，把不成熟的地方暴露出来，然后再一点点补上。

这 13 天里，现实生活也没有停下来。

5 月 15 日下午，我还在上实验课。

5 月 16 日有通识课考试，考完以后马上去参加江苏省省赛热身赛。

5 月 17 日参加江苏省程序设计省赛。

接下来的一周里，补作业，开组会，参与拍摄并剪辑微电影。

周末开始准备Java期末考试。

本周三晚上Java期末刚刚考完。

这些事情挤在一起的时候，我不可能一直坐在电脑前。

很多时候，是白天处理学校里的事情，晚上再打开电脑，看老师发来的平台截图、群里的反馈、脚本的报错和新的适配需求。

这不是想说自己有多辛苦。

相反，它让我更清楚地意识到：

如果一个项目只能靠一时热情和连续熬夜往前推，它可能走不远。

以前我更习惯用“再多做一点”解决问题。

多回几条消息。

多修一个 bug。

多适配一个平台。

多发一个版本。

但这 13 天以后，我开始意识到，更重要的是判断：

什么问题最影响真实使用？

什么问题会影响批改结果的可靠性？

什么问题被最多老师反复提到？

什么功能能减少最多重复劳动？

什么需求听起来很好，但现在还不是最优先？

什么基础能力如果不补，后面很多功能都会站不稳？

这可能是我个人最大的成长。

我开始从“把功能做出来”，转向“判断什么值得先做”。

从“我想做什么”，转向“真实使用正在把我推向哪里”。

这段时间，更新也一直没有停。

这一周我需要准备考试，所以和老师们说，开发节奏会稍微放慢一些。

但现在回头看，那一周实也做了不少事情。

稳定版渠道里，新增了鑫考阅卷平台适配、润建学情大数据平台适配。

智学网新版阅卷页面的识别与适配能力也继续增强。

光大阅卷的提交、确认弹窗、图片获取等逻辑继续优化。

双评重试机制做了改进，增加了重试次数和降级处理。

评分单元配置增加了必填项验证和错误提示。

版本检测、更新提示、渠道切换提示、构建部署流程也都继续做了调整。

继续推进了 54 学霸平台适配。

图片获取逻辑增加了有效性验证、超时处理和策略优先级调整。

分数匹配逻辑改成了优先精确匹配，同时增加模糊匹配。

分数解析增加了负数、超出满分等异常情况处理。

z-index 修复逻辑也继续增强，避免部分平台页面元素遮挡插件界面。

还加入了自动点击确认弹窗，减少老师批改过程中的重复确认操作。

这些如果写成更新日志，看起来只是一行一行的条目。

但对我来说，它们更像是老师反馈留下来的痕迹。

有老师所在的平台还不能用，于是有了新的适配。

有老师遇到图片获取问题，于是继续改图片逻辑。

有老师在双评时遇到不稳定，于是增加重试和降级处理。

有些页面元素遮挡插件界面，于是继续修 z-index。

有些分数解析可能出现异常，于是补上负数、超出满分等处理。

这些都不是很“炫”的功能。

但它们是工具真正变得可用时必须补上的细节。

平台适配这件事，这段时间尤其让我印象很深。

很多老师会问：

“这个平台能不能支持？”

我非常理解这个问题。

因为老师不可能为了一个工具去换阅卷平台。

工具只能尽量进入老师已经在使用的系统。

但真正做起来以后，我发现，不同阅卷平台之间的差异远比我最初想象得复杂。

有的平台是普通图片。

有的平台是 Canvas。

有的平台通过接口加载答题卡。

有的平台把答题卡放在 CSS 背景图里。

有的平台运行在内网环境。

有的平台是点击式评分。

有的平台需要分小题。

有的平台有确认弹窗。

有的平台页面刷新、切题、提交以后，状态都会变化。

更重要的是，AI 批改最怕的并不是慢。

也不是某一次请求失败。

最怕的是看错卷子。

如果系统拿到的不是老师当前正在评阅的那张答题卡，那么后面的评分再完整，也没有意义。

所以现在我对平台适配的理解，已经不再是“多支持一个网址”。

而是：

在每一个平台里，尽量拿到正确的图。

在正确的位置填入正确的分数。

在正确的时机提交。

在异常出现时尽量不要沉默失败。

这其实是一件很具体，也很需要耐心的事情。

它没有一句“AI 自动阅卷”那么好看。

但它是 AI 真正进入老师工作流之前，必须走过的路。

最近我还在做 Markdown 和 KaTeX 相关的开发。

这个方向并不是为了让结果“看起来更好看”。

它和后续理科题批改有很大关系。

很多数学、物理、化学题，不只是给出一段纯文本评语就够了。

公式、步骤、分数计算、结构化表达，都需要更清楚地呈现。

如果 AI 最后只能输出一段普通文字，老师看起来不方便，学生后续复盘也不方便。

所以 Markdown 和 KaTeX 对我来说，是后续支持理科题、步骤题、复杂表达的一块基础能力。

除此之外，我也在准备做两个老师反馈比较集中的功能。

一个是题目、答案、图片支持直接上传，并调用 AI 工具解析。

现在很多配置工作仍然需要老师手动整理题目和参考答案。

如果这一步能让 AI 先帮忙解析，就能减少不少前期准备时间。

另一个是空白答题卡自动跳过。

对于没有作答内容的答题卡，后续希望能直接跳过，避免无效批改，也减少不必要的模型调用。

这两个方向都很典型。

它们不是我坐在电脑前凭空想出来的。

它们来自老师真实使用中的麻烦。

这也是这 13 天让我最受触动的地方：

AI 批改助手开始不只是按照我的想象生长了。

它正在被真实使用推着生长。

现在回头看，5 月 13 日那篇文章确实很重要。

它让更多老师看见了这个工具。

但真正让我成长的，不是那篇文章本身。

而是文章之后发生的一切。

78342 条调用记录。

不断进来的平台反馈。

老师们对准确率、成本、隐私、适配、理科题、配置效率的追问。

每一次图片获取失败。

每一次分数匹配异常。

每一次平台页面遮挡。

每一次确认弹窗。

每一次“这个平台能不能支持”。

这些东西让我意识到：

一个产品不是靠开发者宣布它成熟。

而是靠一次次真实使用，把它不成熟的地方暴露出来。

再一处一处补上。

这听起来没有那么浪漫。

但很真实。

我以前可能更喜欢讲“AI 改变教育”。

现在我更愿意先把问题落得很小。

把一张答题卡拿准。

把一个分数填对。

把一次异常挡住。

把一个空白答题卡跳过。

把一个公式显示清楚。

把一个平台适配稳定。

把一个老师重复点击的地方减少一点。

如果这些小事能被一点点做好，才有资格继续谈更大的事情。

我也开始重新理解 AI。

AI 当然是杠杆。

没有 AI，我不可能一个人这么快把想法变成工具。

也不可能在这么短时间里完成这么多开发、表达和迭代。

但 AI 杠杆真正有意义的地方，不是让人显得更厉害。

而是让一个普通人有机会更快接触真实问题。

更快把想法放进现实里。

更快被反馈修正。

更快意识到自己哪里还不够。

它放大的不只是能力。

也放大了责任。

这 13 天里，我更清楚地感觉到：

一个人借助 AI 可以做更多事。

但做更多事之后，也必须学会更认真地对待每一个真实使用它的人。

所以，爆款之后，我确实像是成了一个人的产品部。

但不是说我已经做得很好。

恰恰相反，是我第一次发现自己还有很多课要补。

要补产品判断。

要补稳定性。

要补平台适配。

要补理科题表达。

要补异常处理。

也要补自己面对真实反馈时的耐心和节奏。

这个工具还远远不完美。

我也还远远不成熟。

但我很感谢这段时间老师们给我的信任、建议、赞赏和包容。

因为这些反馈让我看到：

这件事不是停在想象里的。

它真的进入了老师们的工作里。

真的被用起来了。

真的在产生问题，也真的在推动改进。

如果改变世界听起来太大，那就先从这些具体的小事开始。

把一个平台适配好。

把一个错误修掉。

把一个公式显示清楚。

把一次无效批改跳过。

把一次重复点击减少一点。

让一个老师少熬一点夜。

世界不死，理想不灭。

谢谢各位老师这段时间的理解、包容和支持。

我会继续更新，也会继续学习怎么把它做成一个真正可靠的产品。

如果您想获取安装文档、联系我，或者反馈使用问题，可以通过公众号后台关键词获取对应入口。

需要安装文档和使用说明：请关注公众号后，在后台私信回复【阅卷】

需要我的联系方式：请关注公众号后，在后台私信回复【微信】

需要反馈问题、申请新平台适配、提出功能建议：请关注公众号后，在后台私信回复【反馈】

(再次提醒一下：关键词回复需要在公众号后台对话框中发送，不是在文章留言区回复。留言区回复关键词不会触发自动回复)

也可以直接填写飞书反馈问卷：