说实话,这周AI圈有点忙。
发布的、收费的、量产的,全撞一块了。我挑了5件和上班族最相关的事,快说快走。
文心5.1正式发布,国内模型这次真的打出来了
5月9日,百度文心大模型5.1正式上线,继承文心5.0的知识底座,在多个方向做了大幅升级。
核心数据:LMArena搜索榜 国内第一 · 全球第四 ;数学竞赛AIME26得了 99.6分 ,全球第二,仅次于谷歌Gemini。更关键的是成本——总参数压缩至上一代的 1/3 ,预训练费用只用了同规模竞品的 6% 。
作者快评
国产大模型通常有两条路,要么烧算力堆参数,要么用小模型凑合用。文心这次是第三条——花更少的钱,跑出更好的效果。搜索能力国内第一对上班族最实用,找资料、整合信息的效率会有体感提升,从AI编造的假内容中找真内容更容易了。
🔗 体验:yiyan.baidu.com 重点试搜索功能
📌 来源:百度官方博客 ernie.baidu.com/blog · 2026年5月9日
GPT-5.5 Instant免费了,而且幻觉少了一半
5月5日,OpenAI正式推出GPT-5.5 Instant,取代GPT-5.3 Instant成为ChatGPT的全员默认模型,所有用户免费使用,无需升级订阅。
核心数据:幻觉率下降 52.5% ;数学AIME2025成绩从 65.4→81.2分 ;回复字数缩减约 30% ,更简洁直接。同步引入跨会话记忆,能记住你的个人偏好。
作者快评
幻觉是AI最大的实用障碍,就是它一本正经胡说八道的毛病——数字编错、来源造假。降了一半之后,用来处理合同条款、财务核对、法规查询这类容不得错的工作,安全感会高很多。不用升级,现在就能用。
🔗 体验:chat.openai.com 登录即可使用新版本(可能需要科学上网)
📌 来源:TechCrunch · 2026年5月5日
豆包开始收费了,免费时代在倒计时
5月4日,豆包在App Store悄然挂出付费版声明,三档订阅方案正式曝光:
官方回应称目前仍是测试阶段,免费服务暂时保留,付费功能主要针对PPT生成、数据分析、影视制作等高算力场景。
作者快评
豆包月活 3.45亿 ,是目前国内用户规模最大的AI产品。能收费说明用户粘性够。我的判断是:每天依赖豆包处理工作的人,68元值得考虑;偶尔用的先等等。国内AI工具的免费红利在慢慢收,DeepSeek现在还没收——但别把这当成永远。
🔗 体验:https://www.doubao.com/chat/
📌 来源:腾讯新闻科技 · 2026年5月4日
AI手机提前了,2027年上半年就能买到
供应链分析师郭明錤5月5日发布产业调查,OpenAI首款AI Agent手机量产时间从2028年大幅提前至 2027年上半年 ,目标出货量 3000万部 ,独家芯片供应商为联发科(定制天玑9600)。
核心区别不是摄像头更好,是交互逻辑变了——你不需要切换App,直接用自然语言告诉手机"把今天会议纪要整理成邮件发给A和B",手机自己跨App完成。谷歌官方数据显示Gemini已能帮用户减少 40% 的手动操作时间。
作者快评
这不是遥远的未来,是18个月后的事。现在搞清楚AI Agent是什么、能帮你自动化哪些重复流程,等手机出来你才不会措手不及。
📌 来源:环球网科技综合 · 2026年5月6日;原始来源:分析师郭明錤 Medium报告
四大巨头今年要砸7250亿美元建算力
4月30日,亚马逊、Meta、微软、谷歌Alphabet四大科技巨头集中发布Q1财报,合并资本开支计划达 7250亿美元 ,同比去年的4100亿增长 77% 。
Q1单季度已合计花了 1300亿美元 。
作者快评
这些钱最终会流进你每天打开的Office 365、Google Workspace、飞书里。今天的AI功能还是"加号",两年后可能变成标配操作。微软和谷歌把这么多钱砸进办公软件,还在手动处理Excel的人,两年后的处境会很微妙。
📌 来源:华尔街见闻 · 2026年4月30日;数据原始来源:Financial Times
🛠 动手可做
这周的5条新闻,有两个可以现在就用上:
文心5.1 搜索能力上线了
去 yiyan.baidu.com 找一个你最近要调研的课题或产品,直接搜一遍,看它给出的整合结果和你平时手动搜有什么差距。
GPT-5.5 幻觉率降了
找一份你最近要处理的合同、政策文件或者财务数据,用它核查一遍关键数字和条款,看有没有之前没注意到的问题。
别让这些新闻只停留在"听说过",挑一个,这周就用起来!
下周见。
关键词
一个普通上班族的AI提效日记
点个 赞、在看、转发三连吧想第一时间收到推送,给我个星标 ⭐
夜雨聆风