92 年技术极客接管钉钉,办公软件要变 Agent 入口了?
钉钉换帅了。
6 月 11 日,阿里宣布钉钉管理层调整,陈航卸任钉钉 CEO,1992 年出生的陈宇森接任。
这个名字很多同学可能不熟。
但如果你关注安全圈,应该听过长亭科技。陈宇森 22 岁创办长亭,后来公司被阿里云收购。到了 2025 年,他又在阿里云内部创业,带队做了 AI Agent 产品 MuleRun。
92 年和阿里最年轻事业部 CEO 当然醒目,但鸭鸭更在意后面那个安排。
一个做过 Agent 的人,接管了钉钉。
钉钉这个产品,平时大家对它的感情比较复杂。上班打卡、请假审批、老板半夜找你,很多时候都绕不开它。
群消息、会议、文档、待办、审批流、组织架构,这些东西在钉钉里搅在一起,烦是真的烦,但它也确实离公司的日常运转太近了。
这就很适合 Agent。
很多产品一提 Agent,第一反应是做个聊天框。你问一句,它答一句,答得顺一点,就说自己是智能体。
但公司里真正有价值的 Agent,大概率不会一直坐在侧边栏里陪你聊天。
它得知道你在哪个部门,能看哪些文档,能不能发起审批,能不能改项目状态,能不能帮你把会议纪要推给相关人。
说得再直白一点,它得进工作流。
这也是鸭鸭觉得钉钉这个入口很特殊的地方。
普通聊天产品想做 Agent,需要先找场景。
钉钉不一样,它本来就在场景里。
每个公司怎么开会,怎么汇报,怎么审批,谁能拍板,谁只是被抄送,这些东西每天都在钉钉里流动。Agent 如果真想帮人办公,迟早要碰这些东西。
问题也在这里。
公司可以接受 AI 帮你写一段周报。
但让 AI 替你点一个审批,同意一个预算,或者把客户资料发给另一个人,味道就变了。
这时候大家关心的是权限、留痕和事后能不能倒回去查,文案写得漂不漂亮反而排到后面。
个人版 Agent 跑错了,最多是自己骂两句。
企业版 Agent 跑错了,第二天可能就要开复盘会。
所以别只把这次换帅看成一个管理层新闻。
阿里把做过 Agent 的人放到钉钉这个位置上,很可能是在试一件更大的事:办公软件以后既是给人用的界面,也是 Agent 调用公司能力的入口。
这个变化对程序员也挺现实。
以后你简历上写 AI Agent 项目,面试官大概率不会只问你用了哪个模型。
他会问你,Agent 怎么拿企业上下文,工具调用怎么控权限,审批类动作怎么留日志,失败以后怎么回滚。
以前做一个 AI 助手,能回答就算有点东西。
以后做企业 Agent,能不能安全地动一下系统,才是分水岭。
鸭鸭觉得,这才是今天这条新闻最值得看的地方。
钉钉如果真变成 Agent 入口,办公软件的角色就变了,从消息通知器,变成企业 AI 落地时最前面的一道门。
门能不能开,开给谁,开多大,开完之后谁负责。
这些问题,比模型回答得像不像人重要多了。
……
今天鸭鸭和大家分享一道 AI 大模型面试题。
【请举例说明假设在电商系统中,哪些功能适合直接使用大模型完成,哪些需要结合工程化手段?】
回答重点
电商系统里用大模型的核心原则是:对精度要求不高、容错空间大的场景直接用,涉及钱和库存的场景必须加工程化兜底。
适合直接用大模型的场景:
1)用户咨询解答,比如”这款手机防不防水”、”衣服会不会起球”这种开放性问题,大模型能理解问题并从商品描述里提取答案
2)商品文案生成,给一堆参数让 AI 写出有营销感的描述,比如把”屏幕 6.7 寸、120Hz”包装成”大屏沉浸、丝滑流畅”
3)个性化客服回复,根据用户的购买记录和当前情绪,生成有温度的话术
必须结合工程化手段的场景:
1)商品检索和推荐,用户搜”500 块以下的蓝牙耳机”,光靠大模型没法精准过滤价格区间,得先用 Elasticsearch 或数据库查出来,再让大模型排序和润色
2)库存和价格查询,这类数据实时变化、差一分钱都是事故,必须走数据库查询,大模型只负责把结果组织成自然语言
3)订单状态追踪,物流信息在第三方系统里,大模型没法直接访问,得通过 API 拿到数据后再生成回复
扩展知识
为什么不能让大模型直接干所有活
大模型有三个天生的短板:
1)幻觉问题,问它”这款商品有没有货”,它可能编一个”库存充足”出来,实际上早卖光了。京东、淘宝这种日活上亿的平台,一个库存错误可能引发几十万订单翻车
2)延迟和成本,调一次 GPT 要 1-3 秒、花几分钱,用户搜一次商品可能要召回上万条结果,全交给大模型处理根本扛不住
3)数据实时性,大模型的知识是训练时定死的,今天的促销价、当前的库存量它压根不知道
成本控制实战经验
调用大模型 API 是真金白银的,淘宝客服一天处理 5000 万次咨询,如果每次都调 GPT-4,一天光 API 费用就要几百万。
实际做法是分层处理:
1)第一层,规则引擎,”我的快递到哪了”这种高频问题直接走模板,命中率能到 40%
2)第二层,小模型,7B 参数的本地模型处理常规问题,成本是 GPT-4 的 1/100
3)第三层,大模型,只有复杂问题、情绪激动的用户才路由到 GPT 级别的模型
这套分层架构能把平均成本压到每次咨询 0.01 元以下。
监控和兜底机制
大模型上线不是终点,得有完善的监控:
1)置信度过滤,大模型输出时带一个置信度分数,低于 0.7 的自动转人工
2)敏感词拦截,价格承诺、绝对化用语这些必须过一道规则检查
3)A/B 测试,新 Prompt 上线先切 5% 流量,看用户满意度和转化率
4)人工抽检,每天抽 1000 条对话人工复核,发现 bad case 及时修复
篇幅有限,完整答案可以点击下方进行查阅:
我们精选了近两年的高频面试真题,已经有 10000 多道面试题目啦,由大厂资深面试官手写答案,押题命中率超高!
不仅有传统八股文,场景题、项目题、系统设计题等等应有尽有,还在不断更新中!
目前优惠最低特价 129 元即永久(限时上架)畅看所有面试题和答案,正式运营价格为 399+,不要错过这次优惠哈!
且,现在邀请好友注册并成为会员,还可获得 10% 的分佣🧧!详情见面试鸭拉新邀请有赏规则(网页版面试鸭点击头像查看)

网页端网址:www.mianshiya.com

往期推荐
Leader:“岗位被 AI 替代,降薪 1 万你接受吗?” 我:“不接受。” Leader:“恭喜你,那公司赔你 2N。”
赛博乞讨成真?这泼天的富贵我也想要!
同事:“卧槽,你上班刷BOSS直聘,不怕被发现?“我:“嘘,准备跑路了,听说现在行情很好..“
夜雨聆风