我让AI干了两件财务活,开始有点理解未来的工作方式了

一次让 AI 自动录凭证，一次让 AI 做财务数据分析

这几天，我有点“上头”。

不是在研究什么高深的AI概念，而是把自己平时真正会做的财务工作，一件一件丢给AI，看看它到底能不能干。

我前后做了两个测试。

第一件事，是让Codex自己打开记账软件，根据我指定的发票演示数据录入记账凭证。

第二件事，是把同样的4份财务数据表、同样的分析要求，分别交给ChatGPT和Codex，让它们各做一份财务分析报告。

本来只是想试试工具。

但两次测试做完以后，我的感受比想象中复杂。

不是简单一句“AI真厉害”就能概括。

而是我第一次很具体地感觉到：

AI已经不只是在和我们聊天问答、帮我们写文案、写总结，它已经开始慢慢进入真实的办公流程了。

第一件事：我坐在旁边，看着AI自己录凭证

做了多年的财务，录凭证这件事，对我来说再熟悉不过。

看发票、确认业务内容、选择科目、填写摘要、录入金额、检查借贷是否平衡……

这些事情每天都在重复做。

这次我把一组发票演示数据所在的位置告诉Codex，让它帮我打开会计软件，尝试录入记账凭证。

整个过程大概用了20分钟的样子吧，

我一边喝着奶茶，一边看着它执行任务。

Codex打开软件进入记账凭证页面，找到对应位置，然后根据发票里的信息，一项一项往凭证里填写。动作超快，看得我一口奶茶都忘记吐了。

我原本以为，它可能打开软件以后就不知道下一步该点哪里，或者碰到下拉菜单、页面跳转就会卡住等我来救场呢，可是……它似乎比不倒翁还稳得住。

从演示效果来看，确实有一种“快、准、稳”的感觉。嗯，深得朕心呐！

已关注

关注

重播分享赞

视频详情

看到这里，我脑子里冒出来一个很直接的想法：

财务工作里最先被AI改变的，可能不是那些很难的判断，而是大量重复、机械、消耗时间的操作。

第二件事：同样四张表，两个AI交出的答案很不一样

我准备了4份相同的虚拟数据表：销售订单表、销售订单执行情况表、收款单和付款单。

分别发给ChatGPT和Codex。

我的要求也很明确：

请站在财务总监的角度进行分析，最后做成一份PPT，汇报对象是不懂财务的老板，所以不要说太多专业术语，要说简单、直白、老板能听懂的话。

ChatGPT最后做了11页，Codex做了9页。

当然，页数并不是重点。

真正的差别，是两个AI看待这些数据的方式不太一样。

ChatGPT的版本：框架完整，但更像是在做汇总

ChatGPT很快就抓出了几个核心数字：

近期销售订单22.6万元、累计收款417.2万元、累计付款390.3万元、现金净流入26.9万元。

它还做了一页老板能快速看懂的总结，把内容分成“好消息”“需要盯紧”和“管理重点”。

后面也分析了收款趋势，以及客户和供应商的集中情况。

从完成度来说，这份PPT并不是不能用。

框架是完整的，数字也抓到了，老板大概看几分钟，就能知道公司的资金整体上有没有问题。

但我看完以后，总觉得它更多还是停留在“把数据总结出来”的层面。

它告诉我：

最近有多少订单、收了多少钱、付了多少钱、现金流是正还是负。

但是对于老板下一步真正关心的问题，它往下追得还不够深。

比如：

这些订单是谁带来的？

哪些客户贡献最大？

哪些业务员手里的订单更多？

货发出去以后，钱到底收回来没有？

公司现在最需要追的是回款、出货，还是付款安排？

这些问题，ChatGPT的版本里有提到一部分，但整体还是偏概括。

比较像一个人先把几张表快速看了一遍，然后告诉老板：

“目前大致情况是这样，这几个地方需要注意

Codex的版本：不只报数字，还在继续往下追

Codex这次给我的感觉不太一样。

它首先把几张表的数据口径写清楚。

因为销售订单、订单执行、收款和付款几张表的时间范围并不完全一致，如果不提前说明，很容易把不同时间

段的数据直接放在一起比较。

这其实是一个很小的细节，但做财务的人都知道，这个细节非常重要。

数据口径不一致，后面的分析做得再漂亮，也可能是在比较两件完全不同的事情。

在后面的分析里，Codex没有只停在总金额上。

它继续往下拆了客户、产品、业务员、订单执行、回款、付款和现金流。

比如，它会告诉老板：

近期订单虽然不少，但客单价偏小；

有几个大客户拉动比较明显，需要专人盯回款；

订单执行里，大部分货已经发出去了，但回款比例还有缺口；

收款总体大于付款，但客户集中度不低，大客户一旦延迟付款，就可能影响现金流。

最后，它还把管理动作直接归纳成了三件事：

先追回款，再盯出货，最后安排付款。

这个结论不一定有多高深。

但它很像老板真正需要听到的话。

老板通常不是只想知道“公司收了417.2万元、付了390.3万元”。

老板更想知道的是：

现在有没有风险？

风险在哪里？

明天上班以后，应该先找谁、先处理哪件事？

这也是为什么，在这一次测试里，我会觉得Codex做得更细，也更容易让人看懂。

它做出来的每一页，基本都在回答一个具体问题，而不是单纯把图表摆上去。

这不是在证明谁永远更强

看到这里，可能有人会问：

是不是Codex就一定比ChatGPT更适合做财务分析？

也不能这么简单地下结论吧。

至少这一次测试，只能说明：

在相同数据和相同要求下，ChatGPT更快地搭出了一个完整框架，Codex则更愿意继续处理文件、核对口径，

并把分析往下拆得更细。

换一个任务、换一种提示方式，结果可能又会不一样。

所以我真正想记录的，不是谁赢了。

而是同样叫AI工具，它们处理问题的方式也可能差别很大。

我们以后使用AI，可能不能只是问一句：

“哪个AI最好用？”

更实际的问题应该是：

我现在手里的这项工作，更适合交给谁做？

有的工具适合快速理清思路，有的工具更适合处理文件、跑数据、生成完整成果。

就像我们在公司里找人做事，也不会要求一个人什么都最擅长。

工具用对了，效果会完全不一样。

AI能帮财务干活，但责任还得财务自己扛

虽然这两次测试的结果都让我很惊喜，但我并不觉得现在就可以放心地把财务工作全部交给AI。

尤其是财务数据分析。

AI很容易把一堆数据做成一份看起来很漂亮的报告。

但报告漂亮，不代表结论一定正确。

如果原始数据有重复、缺失，或者几张表的统计时间不同，AI也可能一本正经地得出错误结论。

录凭证也是一样。

它可以根据发票填写摘要和科目，但它并不知道这笔业务是不是真实发生，也不一定知道发票内容和实际业务

是否完全匹配。

更不知道背后有没有税务风险、合同风险和合规问题。

这些事情，最后还是需要财务人员判断。

所以我目前比较认可的一种工作方式是：

人来提出问题、制定规则、审核结果，AI来整理数据、执行操作、制作图表和完成初稿。

AI负责把重复、耗时间的事情做快一点。

财务人员把更多精力放在审核、判断、风险控制和经营分析上。

这样可能才是现阶段比较实际的配合方式。

做了10多年财务，我也会焦虑

说实话，看到AI自己录凭证的时候，我不是完全没有压力。

我做了10多年财务，很多工作已经形成了习惯。

以前会觉得，AI离自己的工作还很远。

但现在，它已经可以尝试打开我们每天使用的软件，也可以把几张表做成一份像样的分析报告。

完全不焦虑，肯定是假的。

我也会想：

如果以后录入、整理、做表、写分析这些工作，AI都能完成，那普通财务人还能靠什么竞争？

但后来我又觉得，光焦虑也解决不了问题。

工具不会因为我们不去了解它，就停止发展。

与其等到某一天，公司突然要求所有人都要会用AI，不如趁现在还有时间，自己先多试几次。

至少要知道：

它能做什么，不能做什么，怎么让它知道我要是什么。

哪些地方可以相信，哪些地方必须检查；

怎么提要求，它才能真正帮我们干活，而不是只说一堆正确的废话。先学习一下要怎么与AI沟通才能得到我想的结果也是很有必要的。可千万不能沟而不通白白浪费Token和自己的精力。

写在最后

这两次测试，对我来说都不是什么炫技。

我不是技术人员，也不是资深商业大佬，就只是是个极其普通的打工人，也不会写什么复杂程序。

我只是一个做了10多年财务、最近开始认真学习AI办公的普通人。

我想知道的，也不是AI未来会有多强。

我更关心的是：

它今天能不能帮我少做一点重复工作？

能不能把4张表整理成老板听得懂的结论？

能不能让我把时间留给那些更需要经验和判断的事情？

这几天折腾下来，我越来越确定一件事：

财务工作不会因为AI出现，就在一夜之间消失。

但财务人的工作方式，肯定会发生变化。

以后真正拉开差距的，也许不是谁录凭证录得更快，而是谁更懂业务、更会判断风险，也更会安排AI替自己干活。

接下来，我还会继续做一些普通财务人真正用得上的AI办公实测。

成功的会记录，翻车的也会记录。

因为对普通人来说，最有价值的从来不是听别人说AI有多厉害。

而是亲眼看看：

它到底能不能帮我们解决一个具体问题。