乐于分享
好东西不私藏

92 年技术极客接管钉钉,办公软件要变 Agent 入口了?

92 年技术极客接管钉钉,办公软件要变 Agent 入口了?

钉钉换帅了。

6 月 11 日,阿里宣布钉钉管理层调整,陈航卸任钉钉 CEO,1992 年出生的陈宇森接任。

这个名字很多同学可能不熟。

但如果你关注安全圈,应该听过长亭科技。陈宇森 22 岁创办长亭,后来公司被阿里云收购。到了 2025 年,他又在阿里云内部创业,带队做了 AI Agent 产品 MuleRun。

92 年和阿里最年轻事业部 CEO 当然醒目,但鸭鸭更在意后面那个安排。

一个做过 Agent 的人,接管了钉钉。

钉钉这个产品,平时大家对它的感情比较复杂。上班打卡、请假审批、老板半夜找你,很多时候都绕不开它。

群消息、会议、文档、待办、审批流、组织架构,这些东西在钉钉里搅在一起,烦是真的烦,但它也确实离公司的日常运转太近了。

这就很适合 Agent。

很多产品一提 Agent,第一反应是做个聊天框。你问一句,它答一句,答得顺一点,就说自己是智能体。

但公司里真正有价值的 Agent,大概率不会一直坐在侧边栏里陪你聊天。

它得知道你在哪个部门,能看哪些文档,能不能发起审批,能不能改项目状态,能不能帮你把会议纪要推给相关人。

说得再直白一点,它得进工作流。

这也是鸭鸭觉得钉钉这个入口很特殊的地方。

普通聊天产品想做 Agent,需要先找场景。

钉钉不一样,它本来就在场景里。

每个公司怎么开会,怎么汇报,怎么审批,谁能拍板,谁只是被抄送,这些东西每天都在钉钉里流动。Agent 如果真想帮人办公,迟早要碰这些东西。

问题也在这里。

公司可以接受 AI 帮你写一段周报。

但让 AI 替你点一个审批,同意一个预算,或者把客户资料发给另一个人,味道就变了。

这时候大家关心的是权限、留痕和事后能不能倒回去查,文案写得漂不漂亮反而排到后面。

个人版 Agent 跑错了,最多是自己骂两句。

企业版 Agent 跑错了,第二天可能就要开复盘会。

所以别只把这次换帅看成一个管理层新闻。

阿里把做过 Agent 的人放到钉钉这个位置上,很可能是在试一件更大的事:办公软件以后既是给人用的界面,也是 Agent 调用公司能力的入口。

这个变化对程序员也挺现实。

以后你简历上写 AI Agent 项目,面试官大概率不会只问你用了哪个模型。

他会问你,Agent 怎么拿企业上下文,工具调用怎么控权限,审批类动作怎么留日志,失败以后怎么回滚。

以前做一个 AI 助手,能回答就算有点东西。

以后做企业 Agent,能不能安全地动一下系统,才是分水岭。

鸭鸭觉得,这才是今天这条新闻最值得看的地方。

钉钉如果真变成 Agent 入口,办公软件的角色就变了,从消息通知器,变成企业 AI 落地时最前面的一道门。

门能不能开,开给谁,开多大,开完之后谁负责。

这些问题,比模型回答得像不像人重要多了。

……

今天鸭鸭和大家分享一道 AI 大模型面试题。

请举例说明假设在电商系统中,哪些功能适合直接使用大模型完成,哪些需要结合工程化手段?

回答重点

电商系统里用大模型的核心原则是:对精度要求不高、容错空间大的场景直接用,涉及钱和库存的场景必须加工程化兜底

适合直接用大模型的场景:

1)用户咨询解答,比如”这款手机防不防水”、”衣服会不会起球”这种开放性问题,大模型能理解问题并从商品描述里提取答案

2)商品文案生成,给一堆参数让 AI 写出有营销感的描述,比如把”屏幕 6.7 寸、120Hz”包装成”大屏沉浸、丝滑流畅”

3)个性化客服回复,根据用户的购买记录和当前情绪,生成有温度的话术

必须结合工程化手段的场景:

1)商品检索和推荐,用户搜”500 块以下的蓝牙耳机”,光靠大模型没法精准过滤价格区间,得先用 Elasticsearch 或数据库查出来,再让大模型排序和润色

2)库存和价格查询,这类数据实时变化、差一分钱都是事故,必须走数据库查询,大模型只负责把结果组织成自然语言

3)订单状态追踪,物流信息在第三方系统里,大模型没法直接访问,得通过 API 拿到数据后再生成回复

扩展知识 

为什么不能让大模型直接干所有活

大模型有三个天生的短板:

1)幻觉问题,问它”这款商品有没有货”,它可能编一个”库存充足”出来,实际上早卖光了。京东、淘宝这种日活上亿的平台,一个库存错误可能引发几十万订单翻车

2)延迟和成本,调一次 GPT 要 1-3 秒、花几分钱,用户搜一次商品可能要召回上万条结果,全交给大模型处理根本扛不住

3)数据实时性,大模型的知识是训练时定死的,今天的促销价、当前的库存量它压根不知道

成本控制实战经验

调用大模型 API 是真金白银的,淘宝客服一天处理 5000 万次咨询,如果每次都调 GPT-4,一天光 API 费用就要几百万。

实际做法是分层处理:

1)第一层,规则引擎,”我的快递到哪了”这种高频问题直接走模板,命中率能到 40%

2)第二层,小模型,7B 参数的本地模型处理常规问题,成本是 GPT-4 的 1/100

3)第三层,大模型,只有复杂问题、情绪激动的用户才路由到 GPT 级别的模型

这套分层架构能把平均成本压到每次咨询 0.01 元以下。

监控和兜底机制

大模型上线不是终点,得有完善的监控:

1)置信度过滤,大模型输出时带一个置信度分数,低于 0.7 的自动转人工

2)敏感词拦截,价格承诺、绝对化用语这些必须过一道规则检查

3)A/B 测试,新 Prompt 上线先切 5% 流量,看用户满意度和转化率

4)人工抽检,每天抽 1000 条对话人工复核,发现 bad case 及时修复

篇幅有限,完整答案可以点击下方进行查阅

我们精选了近两年的高频面试真题,已经有 10000 多道面试题目啦,由大厂资深面试官手写答案,押题命中率超高!

不仅有传统八股文,场景题、项目题、系统设计题等等应有尽有,还在不断更新中!

目前优惠最低特价 129 元即永久(限时上架)畅看所有面试题和答案,正式运营价格为 399+,不要错过这次优惠哈!

且,现在邀请好友注册并成为会员,还可获得 10% 的分佣🧧!详情见面试鸭拉新邀请有赏规则(网页版面试鸭点击头像查看)

网页端网址:www.mianshiya.com

往期推荐

26届春招突然加速,错过这波真要“家里蹲”了!

蚂蚁集团年终开奖

美团年终奖,开了!

大厂开工红包汇总

Leader:“岗位被 AI 替代,降薪 1 万你接受吗?” 我:“不接受。” Leader:“恭喜你,那公司赔你 2N。”

赛博乞讨成真?这泼天的富贵我也想要!

同事:“卧槽,你上班刷BOSS直聘,不怕被发现?“我:“嘘,准备跑路了,听说现在行情很好..“