爆款之后,我成了一个人的产品部
距离上一次发公众号,已经过去 13 天了。
这 13 天里,有很多老师私信我、加我微信、在群里反馈问题,也有很多老师提出了新平台适配和功能建议。
其中不少消息,我没有及时回复。
有些好友申请,我没有第一时间通过。
有些平台适配需求,我看到了,但还没来得及仔细处理。
这里先向各位老师认真说一声抱歉。
不是不重视。
是真的有些处理不过来。
也想借这篇文章,先说明一件事:
这个项目目前并不是一个公司在运营,也不是一个完整团队在维护。
主要还是我一个人在做。

写代码是我。
修 bug 是我。
测平台是我。
发版本是我。
写文档、看反馈、回消息,也主要还是我。
同时,我现在也还是学生。
这段时间,我照常要上课、做实验、写作业、开组会,也有考试和比赛。
所以如果有些老师的消息没有及时回复,或者有些问题没有马上处理到,还请老师们多包涵。
当然,我不想用“我一个人”来为所有回复慢开脱。
相反,这 13 天让我意识到:
当一个项目真的被很多老师使用以后,它就不再只是一个学生写的小工具了。
它开始需要更稳定的功能,更清楚的边界,更可靠的适配,也需要我用更成熟的方式去推进它。
5 月 13 日,我发出了那篇关于 AI 批改助手的文章。
发之前,我以为它只是一次阶段性记录。
记录一下这个工具从最早的小脚本,到后来能完成千份级批改、支持双评仲裁、导出 Excel 的过程。
没想到第二天开始,文章突然被很多老师看到。
阅读量涨起来了。
关注涨起来了。
后台私信、留言、好友申请、群消息也一起多了起来。

一开始当然是开心的。
但很快,开心之后更多的是一种很强烈的压力。
因为老师们不是来看热闹的。
老师们带来的,是一个个真实场景。
“我这个平台能不能用?”
“理科题可以批吗?”
“准确率怎么样?”
“如果 AI 批错了怎么办?”
“学生答卷会不会被拿去训练?”
“题目和答案能不能不要手动整理?”
“空白答题卡能不能自动跳过?”
这些问题,一开始看上去像咨询。
但后来我发现,它们其实都是产品问题。
更准确地说,它们都在提醒我:
AI 批改助手如果想真正进入老师的工作流,不能只证明“AI 能批”。
还要证明它能稳定地批、可检查地批、在不同平台上批、在异常情况下不乱批,也要尽量减少老师使用前的准备工作。
这也是为什么,我觉得这 13 天里自己最大的变化,不是又发了几个版本。
而是我开始从“把功能做出来”,转向“把产品做可靠”。
从上一次文章发布到现在,后台一共监控到了 78342 条调用记录。
这个数字对我来说,比阅读量更有冲击力。

阅读量说明文章被看见。
调用记录说明工具真的被使用。
它意味着,有老师打开了工具,进入阅卷页面,配置任务,把它放进了自己的批改流程里。
这不再只是一个演示项目。
它开始进入真实的阅卷现场。
也正是从这个数字开始,我开始重新理解“产品”这两个字。
以前我更关心:
功能能不能跑。
模型能不能给分。
双评能不能完成。
Excel 能不能导出。
平台能不能适配。
现在我开始关心更多事情:
一次批改能不能稳定完成。
图片有没有拿错。
分数有没有填到正确位置。
双评失败后有没有重试。
异常分数能不能识别出来。
公式和步骤能不能更清楚地展示。
空白答题卡能不能自动跳过。
老师配置题目和答案时,能不能少做一点重复整理。
这些问题都更细,也更麻烦。
但它们才是真实使用里会遇到的问题。
一个工具不是靠开发者宣布它成熟。
而是靠一次次真实使用,把不成熟的地方暴露出来,然后再一点点补上。
这 13 天里,现实生活也没有停下来。
5 月 15 日下午,我还在上实验课。
5 月 16 日有通识课考试,考完以后马上去参加江苏省省赛热身赛。
5 月 17 日参加江苏省程序设计省赛。

接下来的一周里,补作业,开组会,参与拍摄并剪辑微电影。
周末开始准备Java期末考试。
本周三晚上Java期末刚刚考完。
这些事情挤在一起的时候,我不可能一直坐在电脑前。
很多时候,是白天处理学校里的事情,晚上再打开电脑,看老师发来的平台截图、群里的反馈、脚本的报错和新的适配需求。
这不是想说自己有多辛苦。
相反,它让我更清楚地意识到:
如果一个项目只能靠一时热情和连续熬夜往前推,它可能走不远。
以前我更习惯用“再多做一点”解决问题。
多回几条消息。
多修一个 bug。
多适配一个平台。
多发一个版本。
但这 13 天以后,我开始意识到,更重要的是判断:
什么问题最影响真实使用?
什么问题会影响批改结果的可靠性?
什么问题被最多老师反复提到?
什么功能能减少最多重复劳动?
什么需求听起来很好,但现在还不是最优先?
什么基础能力如果不补,后面很多功能都会站不稳?
这可能是我个人最大的成长。
我开始从“把功能做出来”,转向“判断什么值得先做”。
从“我想做什么”,转向“真实使用正在把我推向哪里”。
这段时间,更新也一直没有停。
这一周我需要准备考试,所以和老师们说,开发节奏会稍微放慢一些。
但现在回头看,那一周实也做了不少事情。

稳定版渠道里,新增了鑫考阅卷平台适配、润建学情大数据平台适配。
智学网新版阅卷页面的识别与适配能力也继续增强。
光大阅卷 的提交、确认弹窗、图片获取等逻辑继续优化。
双评重试机制做了改进,增加了重试次数和降级处理。
评分单元配置增加了必填项验证和错误提示。
版本检测、更新提示、渠道切换提示、构建部署流程也都继续做了调整。
继续推进了 54 学霸平台适配。
图片获取逻辑增加了有效性验证、超时处理和策略优先级调整。
分数匹配逻辑改成了优先精确匹配,同时增加模糊匹配。
分数解析增加了负数、超出满分等异常情况处理。
z-index 修复逻辑也继续增强,避免部分平台页面元素遮挡插件界面。
还加入了自动点击确认弹窗,减少老师批改过程中的重复确认操作。
这些如果写成更新日志,看起来只是一行一行的条目。
但对我来说,它们更像是老师反馈留下来的痕迹。
有老师所在的平台还不能用,于是有了新的适配。
有老师遇到图片获取问题,于是继续改图片逻辑。
有老师在双评时遇到不稳定,于是增加重试和降级处理。
有些页面元素遮挡插件界面,于是继续修 z-index。
有些分数解析可能出现异常,于是补上负数、超出满分等处理。
这些都不是很“炫”的功能。
但它们是工具真正变得可用时必须补上的细节。
平台适配这件事,这段时间尤其让我印象很深。
很多老师会问:
“这个平台能不能支持?”
我非常理解这个问题。
因为老师不可能为了一个工具去换阅卷平台。
工具只能尽量进入老师已经在使用的系统。
但真正做起来以后,我发现,不同阅卷平台之间的差异远比我最初想象得复杂。

有的平台是普通图片。
有的平台是 Canvas。
有的平台通过接口加载答题卡。
有的平台把答题卡放在 CSS 背景图里。
有的平台运行在内网环境。
有的平台是点击式评分。
有的平台需要分小题。
有的平台有确认弹窗。
有的平台页面刷新、切题、提交以后,状态都会变化。
更重要的是,AI 批改最怕的并不是慢。
也不是某一次请求失败。
最怕的是看错卷子。
如果系统拿到的不是老师当前正在评阅的那张答题卡,那么后面的评分再完整,也没有意义。
所以现在我对平台适配的理解,已经不再是“多支持一个网址”。
而是:
在每一个平台里,尽量拿到正确的图。
在正确的位置填入正确的分数。
在正确的时机提交。
在异常出现时尽量不要沉默失败。
这其实是一件很具体,也很需要耐心的事情。
它没有一句“AI 自动阅卷”那么好看。
但它是 AI 真正进入老师工作流之前,必须走过的路。
最近我还在做 Markdown 和 KaTeX 相关的开发。
这个方向并不是为了让结果“看起来更好看”。
它和后续理科题批改有很大关系。
很多数学、物理、化学题,不只是给出一段纯文本评语就够了。
公式、步骤、分数计算、结构化表达,都需要更清楚地呈现。
如果 AI 最后只能输出一段普通文字,老师看起来不方便,学生后续复盘也不方便。
所以 Markdown 和 KaTeX 对我来说,是后续支持理科题、步骤题、复杂表达的一块基础能力。

除此之外,我也在准备做两个老师反馈比较集中的功能。
一个是题目、答案、图片支持直接上传,并调用 AI 工具解析。
现在很多配置工作仍然需要老师手动整理题目和参考答案。
如果这一步能让 AI 先帮忙解析,就能减少不少前期准备时间。
另一个是空白答题卡自动跳过。
对于没有作答内容的答题卡,后续希望能直接跳过,避免无效批改,也减少不必要的模型调用。
这两个方向都很典型。
它们不是我坐在电脑前凭空想出来的。
它们来自老师真实使用中的麻烦。
这也是这 13 天让我最受触动的地方:
AI 批改助手开始不只是按照我的想象生长了。
它正在被真实使用推着生长。
现在回头看,5 月 13 日那篇文章确实很重要。
它让更多老师看见了这个工具。
但真正让我成长的,不是那篇文章本身。
而是文章之后发生的一切。
78342 条调用记录。
不断进来的平台反馈。
老师们对准确率、成本、隐私、适配、理科题、配置效率的追问。
每一次图片获取失败。
每一次分数匹配异常。
每一次平台页面遮挡。
每一次确认弹窗。
每一次“这个平台能不能支持”。
这些东西让我意识到:
一个产品不是靠开发者宣布它成熟。
而是靠一次次真实使用,把它不成熟的地方暴露出来。
再一处一处补上。
这听起来没有那么浪漫。
但很真实。
我以前可能更喜欢讲“AI 改变教育”。
现在我更愿意先把问题落得很小。
把一张答题卡拿准。
把一个分数填对。
把一次异常挡住。
把一个空白答题卡跳过。
把一个公式显示清楚。
把一个平台适配稳定。
把一个老师重复点击的地方减少一点。
如果这些小事能被一点点做好,才有资格继续谈更大的事情。
我也开始重新理解 AI。
AI 当然是杠杆。
没有 AI,我不可能一个人这么快把想法变成工具。
也不可能在这么短时间里完成这么多开发、表达和迭代。
但 AI 杠杆真正有意义的地方,不是让人显得更厉害。
而是让一个普通人有机会更快接触真实问题。
更快把想法放进现实里。
更快被反馈修正。
更快意识到自己哪里还不够。
它放大的不只是能力。
也放大了责任。
这 13 天里,我更清楚地感觉到:
一个人借助 AI 可以做更多事。
但做更多事之后,也必须学会更认真地对待每一个真实使用它的人。
所以,爆款之后,我确实像是成了一个人的产品部。
但不是说我已经做得很好。
恰恰相反,是我第一次发现自己还有很多课要补。
要补产品判断。
要补稳定性。
要补平台适配。
要补理科题表达。
要补异常处理。
也要补自己面对真实反馈时的耐心和节奏。
这个工具还远远不完美。
我也还远远不成熟。
但我很感谢这段时间老师们给我的信任、建议、赞赏和包容。
因为这些反馈让我看到:
这件事不是停在想象里的。
它真的进入了老师们的工作里。
真的被用起来了。
真的在产生问题,也真的在推动改进。
如果改变世界听起来太大,那就先从这些具体的小事开始。
把一个平台适配好。
把一个错误修掉。
把一个公式显示清楚。
把一次无效批改跳过。
把一次重复点击减少一点。
让一个老师少熬一点夜。
世界不死,理想不灭。
谢谢各位老师这段时间的理解、包容和支持。
我会继续更新,也会继续学习怎么把它做成一个真正可靠的产品。
如果您想获取安装文档、联系我,或者反馈使用问题,可以通过公众号后台关键词获取对应入口。
需要安装文档和使用说明:请关注公众号后,在后台私信回复【阅卷】
需要我的联系方式:请关注公众号后,在后台私信回复【微信】
需要反馈问题、申请新平台适配、提出功能建议:请关注公众号后,在后台私信回复【反馈】
(再次提醒一下:关键词回复需要在公众号后台对话框中发送,不是在文章留言区回复。留言区回复关键词不会触发自动回复)
也可以直接填写飞书反馈问卷:

夜雨聆风