92 年技术极客接管钉钉,办公软件要变 Agent 入口了?

钉钉换帅了。

6 月 11 日，阿里宣布钉钉管理层调整，陈航卸任钉钉 CEO，1992 年出生的陈宇森接任。

这个名字很多同学可能不熟。

但如果你关注安全圈，应该听过长亭科技。陈宇森 22 岁创办长亭，后来公司被阿里云收购。到了 2025 年，他又在阿里云内部创业，带队做了 AI Agent 产品 MuleRun。

92 年和阿里最年轻事业部 CEO 当然醒目，但鸭鸭更在意后面那个安排。

一个做过 Agent 的人，接管了钉钉。

钉钉这个产品，平时大家对它的感情比较复杂。上班打卡、请假审批、老板半夜找你，很多时候都绕不开它。

群消息、会议、文档、待办、审批流、组织架构，这些东西在钉钉里搅在一起，烦是真的烦，但它也确实离公司的日常运转太近了。

这就很适合 Agent。

很多产品一提 Agent，第一反应是做个聊天框。你问一句，它答一句，答得顺一点，就说自己是智能体。

但公司里真正有价值的 Agent，大概率不会一直坐在侧边栏里陪你聊天。

它得知道你在哪个部门，能看哪些文档，能不能发起审批，能不能改项目状态，能不能帮你把会议纪要推给相关人。

说得再直白一点，它得进工作流。

这也是鸭鸭觉得钉钉这个入口很特殊的地方。

普通聊天产品想做 Agent，需要先找场景。

钉钉不一样，它本来就在场景里。

每个公司怎么开会，怎么汇报，怎么审批，谁能拍板，谁只是被抄送，这些东西每天都在钉钉里流动。Agent 如果真想帮人办公，迟早要碰这些东西。

问题也在这里。

公司可以接受 AI 帮你写一段周报。

但让 AI 替你点一个审批，同意一个预算，或者把客户资料发给另一个人，味道就变了。

这时候大家关心的是权限、留痕和事后能不能倒回去查，文案写得漂不漂亮反而排到后面。

个人版 Agent 跑错了，最多是自己骂两句。

企业版 Agent 跑错了，第二天可能就要开复盘会。

所以别只把这次换帅看成一个管理层新闻。

阿里把做过 Agent 的人放到钉钉这个位置上，很可能是在试一件更大的事：办公软件以后既是给人用的界面，也是 Agent 调用公司能力的入口。

这个变化对程序员也挺现实。

以后你简历上写 AI Agent 项目，面试官大概率不会只问你用了哪个模型。

他会问你，Agent 怎么拿企业上下文，工具调用怎么控权限，审批类动作怎么留日志，失败以后怎么回滚。

以前做一个 AI 助手，能回答就算有点东西。

以后做企业 Agent，能不能安全地动一下系统，才是分水岭。

鸭鸭觉得，这才是今天这条新闻最值得看的地方。

钉钉如果真变成 Agent 入口，办公软件的角色就变了，从消息通知器，变成企业 AI 落地时最前面的一道门。

门能不能开，开给谁，开多大，开完之后谁负责。

这些问题，比模型回答得像不像人重要多了。

……

今天鸭鸭和大家分享一道 AI 大模型面试题。

【请举例说明假设在电商系统中，哪些功能适合直接使用大模型完成，哪些需要结合工程化手段？】

回答重点

电商系统里用大模型的核心原则是：对精度要求不高、容错空间大的场景直接用，涉及钱和库存的场景必须加工程化兜底。

适合直接用大模型的场景：

1）用户咨询解答，比如”这款手机防不防水”、”衣服会不会起球”这种开放性问题，大模型能理解问题并从商品描述里提取答案

2）商品文案生成，给一堆参数让 AI 写出有营销感的描述，比如把”屏幕 6.7 寸、120Hz”包装成”大屏沉浸、丝滑流畅”

3）个性化客服回复，根据用户的购买记录和当前情绪，生成有温度的话术

必须结合工程化手段的场景：

1）商品检索和推荐，用户搜”500 块以下的蓝牙耳机”，光靠大模型没法精准过滤价格区间，得先用 Elasticsearch 或数据库查出来，再让大模型排序和润色

2）库存和价格查询，这类数据实时变化、差一分钱都是事故，必须走数据库查询，大模型只负责把结果组织成自然语言

3）订单状态追踪，物流信息在第三方系统里，大模型没法直接访问，得通过 API 拿到数据后再生成回复

扩展知识

为什么不能让大模型直接干所有活

大模型有三个天生的短板：

1）幻觉问题，问它”这款商品有没有货”，它可能编一个”库存充足”出来，实际上早卖光了。京东、淘宝这种日活上亿的平台，一个库存错误可能引发几十万订单翻车

2）延迟和成本，调一次 GPT 要 1-3 秒、花几分钱，用户搜一次商品可能要召回上万条结果，全交给大模型处理根本扛不住

3）数据实时性，大模型的知识是训练时定死的，今天的促销价、当前的库存量它压根不知道

成本控制实战经验

调用大模型 API 是真金白银的，淘宝客服一天处理 5000 万次咨询，如果每次都调 GPT-4，一天光 API 费用就要几百万。

实际做法是分层处理：

1）第一层，规则引擎，”我的快递到哪了”这种高频问题直接走模板，命中率能到 40%

2）第二层，小模型，7B 参数的本地模型处理常规问题，成本是 GPT-4 的 1/100

3）第三层，大模型，只有复杂问题、情绪激动的用户才路由到 GPT 级别的模型

这套分层架构能把平均成本压到每次咨询 0.01 元以下。

监控和兜底机制

大模型上线不是终点，得有完善的监控：

1）置信度过滤，大模型输出时带一个置信度分数，低于 0.7 的自动转人工

2）敏感词拦截，价格承诺、绝对化用语这些必须过一道规则检查

3）A/B 测试，新 Prompt 上线先切 5% 流量，看用户满意度和转化率

4）人工抽检，每天抽 1000 条对话人工复核，发现 bad case 及时修复

篇幅有限，完整答案可以点击下方进行查阅：

我们精选了近两年的高频面试真题，已经有 10000 多道面试题目啦，由大厂资深面试官手写答案，押题命中率超高！

不仅有传统八股文，场景题、项目题、系统设计题等等应有尽有，还在不断更新中！

目前优惠最低特价 129 元即永久（限时上架）畅看所有面试题和答案，正式运营价格为 399+，不要错过这次优惠哈！

且，现在邀请好友注册并成为会员，还可获得 10% 的分佣🧧！详情见面试鸭拉新邀请有赏规则（网页版面试鸭点击头像查看）

网页端网址：www.mianshiya.com

往期推荐

26届春招突然加速，错过这波真要“家里蹲”了！

蚂蚁集团年终开奖

美团年终奖，开了！

大厂开工红包汇总

Leader：“岗位被 AI 替代，降薪 1 万你接受吗？” 我：“不接受。” Leader：“恭喜你，那公司赔你 2N。”