一次让 AI 自动录凭证,一次让 AI 做财务数据分析
这几天,我有点“上头”。
不是在研究什么高深的AI概念,而是把自己平时真正会做的财务工作,一件一件丢给AI,看看它到底能不能干。
我前后做了两个测试。
第一件事,是让Codex自己打开记账软件,根据我指定的发票演示数据录入记账凭证。
第二件事,是把同样的4份财务数据表、同样的分析要求,分别交给ChatGPT和Codex,让它们各做一份财务分析报告。
本来只是想试试工具。
但两次测试做完以后,我的感受比想象中复杂。
不是简单一句“AI真厉害”就能概括。
而是我第一次很具体地感觉到:
AI已经不只是在和我们聊天问答、帮我们写文案、写总结,它已经开始慢慢进入真实的办公流程了。
第一件事:我坐在旁边,看着AI自己录凭证
做了多年的财务,录凭证这件事,对我来说再熟悉不过。
看发票、确认业务内容、选择科目、填写摘要、录入金额、检查借贷是否平衡……
这些事情每天都在重复做。
这次我把一组发票演示数据所在的位置告诉Codex,让它帮我打开会计软件,尝试录入记账凭证。
整个过程大概用了20分钟的样子吧,
我一边喝着奶茶,一边看着它执行任务。

Codex打开软件进入记账凭证页面,找到对应位置,然后根据发票里的信息,一项一项往凭证里填写。动作超快,看得我一口奶茶都忘记吐了。
我原本以为,它可能打开软件以后就不知道下一步该点哪里,或者碰到下拉菜单、页面跳转就会卡住等我来救场呢,可是……它似乎比不倒翁还稳得住。
从演示效果来看,确实有一种“快、准、稳”的感觉。嗯,深得朕心呐!
看到这里,我脑子里冒出来一个很直接的想法:
财务工作里最先被AI改变的,可能不是那些很难的判断,而是大量重复、机械、消耗时间的操作。
第二件事:同样四张表,两个AI交出的答案很不一样
我准备了4份相同的虚拟数据表:销售订单表、销售订单执行情况表、收款单和付款单。
分别发给ChatGPT和Codex。
我的要求也很明确:
请站在财务总监的角度进行分析,最后做成一份PPT,汇报对象是不懂财务的老板,所以不要说太多专业术语,要说简单、直白、老板能听懂的话。
ChatGPT最后做了11页,Codex做了9页。
当然,页数并不是重点。
真正的差别,是两个AI看待这些数据的方式不太一样。

ChatGPT的版本:框架完整,但更像是在做汇总
ChatGPT很快就抓出了几个核心数字:
近期销售订单22.6万元、累计收款417.2万元、累计付款390.3万元、现金净流入26.9万元。
它还做了一页老板能快速看懂的总结,把内容分成“好消息”“需要盯紧”和“管理重点”。
后面也分析了收款趋势,以及客户和供应商的集中情况。
从完成度来说,这份PPT并不是不能用。
框架是完整的,数字也抓到了,老板大概看几分钟,就能知道公司的资金整体上有没有问题。
但我看完以后,总觉得它更多还是停留在“把数据总结出来”的层面。

它告诉我:
最近有多少订单、收了多少钱、付了多少钱、现金流是正还是负。
但是对于老板下一步真正关心的问题,它往下追得还不够深。
比如:
这些订单是谁带来的?
哪些客户贡献最大?
哪些业务员手里的订单更多?
货发出去以后,钱到底收回来没有?
公司现在最需要追的是回款、出货,还是付款安排?
这些问题,ChatGPT的版本里有提到一部分,但整体还是偏概括。
比较像一个人先把几张表快速看了一遍,然后告诉老板:
“目前大致情况是这样,这几个地方需要注意
Codex的版本:不只报数字,还在继续往下追
Codex这次给我的感觉不太一样。
它首先把几张表的数据口径写清楚。
因为销售订单、订单执行、收款和付款几张表的时间范围并不完全一致,如果不提前说明,很容易把不同时间
段的数据直接放在一起比较。
这其实是一个很小的细节,但做财务的人都知道,这个细节非常重要。
数据口径不一致,后面的分析做得再漂亮,也可能是在比较两件完全不同的事情。
在后面的分析里,Codex没有只停在总金额上。
它继续往下拆了客户、产品、业务员、订单执行、回款、付款和现金流。
比如,它会告诉老板:
近期订单虽然不少,但客单价偏小;
有几个大客户拉动比较明显,需要专人盯回款;
订单执行里,大部分货已经发出去了,但回款比例还有缺口;
收款总体大于付款,但客户集中度不低,大客户一旦延迟付款,就可能影响现金流。



最后,它还把管理动作直接归纳成了三件事:
先追回款,再盯出货,最后安排付款。
这个结论不一定有多高深。
但它很像老板真正需要听到的话。
老板通常不是只想知道“公司收了417.2万元、付了390.3万元”。
老板更想知道的是:
现在有没有风险?
风险在哪里?
明天上班以后,应该先找谁、先处理哪件事?
这也是为什么,在这一次测试里,我会觉得Codex做得更细,也更容易让人看懂。
它做出来的每一页,基本都在回答一个具体问题,而不是单纯把图表摆上去。
这不是在证明谁永远更强
看到这里,可能有人会问:
是不是Codex就一定比ChatGPT更适合做财务分析?
也不能这么简单地下结论吧。
至少这一次测试,只能说明:
在相同数据和相同要求下,ChatGPT更快地搭出了一个完整框架,Codex则更愿意继续处理文件、核对口径,
并把分析往下拆得更细。
换一个任务、换一种提示方式,结果可能又会不一样。
所以我真正想记录的,不是谁赢了。
而是同样叫AI工具,它们处理问题的方式也可能差别很大。
我们以后使用AI,可能不能只是问一句:
“哪个AI最好用?”
更实际的问题应该是:
我现在手里的这项工作,更适合交给谁做?
有的工具适合快速理清思路,有的工具更适合处理文件、跑数据、生成完整成果。
就像我们在公司里找人做事,也不会要求一个人什么都最擅长。
工具用对了,效果会完全不一样。
AI能帮财务干活,但责任还得财务自己扛
虽然这两次测试的结果都让我很惊喜,但我并不觉得现在就可以放心地把财务工作全部交给AI。
尤其是财务数据分析。
AI很容易把一堆数据做成一份看起来很漂亮的报告。
但报告漂亮,不代表结论一定正确。
如果原始数据有重复、缺失,或者几张表的统计时间不同,AI也可能一本正经地得出错误结论。
录凭证也是一样。
它可以根据发票填写摘要和科目,但它并不知道这笔业务是不是真实发生,也不一定知道发票内容和实际业务
是否完全匹配。
更不知道背后有没有税务风险、合同风险和合规问题。
这些事情,最后还是需要财务人员判断。
所以我目前比较认可的一种工作方式是:
人来提出问题、制定规则、审核结果,AI来整理数据、执行操作、制作图表和完成初稿。
AI负责把重复、耗时间的事情做快一点。
财务人员把更多精力放在审核、判断、风险控制和经营分析上。
这样可能才是现阶段比较实际的配合方式。
做了10多年财务,我也会焦虑
说实话,看到AI自己录凭证的时候,我不是完全没有压力。
我做了10多年财务,很多工作已经形成了习惯。
以前会觉得,AI离自己的工作还很远。
但现在,它已经可以尝试打开我们每天使用的软件,也可以把几张表做成一份像样的分析报告。
完全不焦虑,肯定是假的。
我也会想:
如果以后录入、整理、做表、写分析这些工作,AI都能完成,那普通财务人还能靠什么竞争?
但后来我又觉得,光焦虑也解决不了问题。
工具不会因为我们不去了解它,就停止发展。
与其等到某一天,公司突然要求所有人都要会用AI,不如趁现在还有时间,自己先多试几次。
至少要知道:
它能做什么,不能做什么,怎么让它知道我要是什么。
哪些地方可以相信,哪些地方必须检查;
怎么提要求,它才能真正帮我们干活,而不是只说一堆正确的废话。先学习一下要怎么与AI沟通才能得到我想的结果也是很有必要的。可千万不能沟而不通白白浪费Token和自己的精力。
写在最后
这两次测试,对我来说都不是什么炫技。
我不是技术人员,也不是资深商业大佬,就只是是个极其普通的打工人,也不会写什么复杂程序。
我只是一个做了10多年财务、最近开始认真学习AI办公的普通人。
我想知道的,也不是AI未来会有多强。
我更关心的是:
它今天能不能帮我少做一点重复工作?
能不能把4张表整理成老板听得懂的结论?
能不能让我把时间留给那些更需要经验和判断的事情?
这几天折腾下来,我越来越确定一件事:
财务工作不会因为AI出现,就在一夜之间消失。
但财务人的工作方式,肯定会发生变化。
以后真正拉开差距的,也许不是谁录凭证录得更快,而是谁更懂业务、更会判断风险,也更会安排AI替自己干活。
接下来,我还会继续做一些普通财务人真正用得上的AI办公实测。
成功的会记录,翻车的也会记录。
因为对普通人来说,最有价值的从来不是听别人说AI有多厉害。
而是亲眼看看:
它到底能不能帮我们解决一个具体问题。
夜雨聆风