
【AI资讯日报 | 06月03日】巨头齐发大模型,AI从“对话”转向“干活”
• 🔥🔥🔥🔥🔥 微软Build 2026一口气发布7款自研MAI模型,旗舰推理MAI-Thinking-1叫板Claude Sonnet 4.6,Agent+编程闭环确立“智能体优先”路线|2026-06-02 旧金山|https://news.qq.com/rain/a/20260603A01OUL00 • 🔥🔥🔥🔥🔥 OpenAI Codex三连更:智能体插件+注释精准修改+站点一键生成,Codex将并入ChatGPT覆盖10亿用户,CEO Altman称下一重点是“全天候自主AI”|2026-06-02 直播|https://www.toutiao.com/article/7646947658040459826 • 🔥🔥🔥🔥 阿里发布Qwen3.7-Plus多模态智能体模型,“看、想、写、做、验”一体化,11小时闭环开发App,Vision Arena全球前五、中国第一|2026-06-02 北京时间上午10:47|https://finance.sina.com.cn/tech/shenji/2026-06-02/doc-inhzysxu3287083.shtml • 🔥🔥🔥🔥 英伟达Cosmos 3物理AI世界模型发布:开源全模态,视觉推理+世界生成+动作预测一体,黄仁勋称“物理AI爆发时代近在眼前”|2026-06-02 18:14 新浪科技|https://finance.sina.com.cn/roll/2026-06-02/doc-inhzzivp1594167.shtml • 🔥🔥🔥 腾讯测试微信AI智能体原型:右滑入口,调用小程序完成任务,项目列为最高战略优先级,算力与成本成落地瓶颈|2026-06-02 11:20 市场资讯|https://finance.sina.com.cn/stock/t/2026-06-02/doc-inhzysxu3316782.shtml • 🔥🔥🔥 豆包6月下旬上线付费内容:基础功能永久免费,付费专注PPT/数据分析/影视制作等高算力场景,三档月费68/200/500元|2026-06-12 12:53 澎湃新闻|https://www.21jingji.com/article/20260602/herald/a78cb4eb5e9532c30ab185c4a5638d4d.html • 🔥🔥🔥 腾讯云DeepSeek-V4系列大降价:6月3日0时起最高降幅97.5%,Pro推理输入/输出降75%,缓存命中降97.5%|2026-06-02 腾讯云公告|https://so.html5.qq.com/page/real/search_news?docid=70000021_5126a1ea01139752 • 🔥🔥 百度文心发布PaddleOCR-VL-1.6:文档解析准确率96.33%登顶OmniDocBench v1.6,0.9B轻量架构,代码与权重已开源|2026-06-02 17:50 新浪科技|https://finance.sina.com.cn/tech/mobile/n/n/2026-06-02/doc-inhzzivq4783974.shtml • 🔥🔥 谷歌认领“最强AI版Photoshop” nano-banana:实为Gemini 2.5 Flash Image,现已在Gemini和AI Studio免费开放API|2026-06-02 13:43 快科技|https://soft.china.com/article/2466035.html • 🔥 微软发布Surface RTX Spark Dev Box:AI开发者专属PC,搭载NVIDIA RTX Spark芯片,与Mac Studio正面竞争|2026-06-02 Build 2026|https://m.163.com/dy/article/KUG4538H05118HA4.html
🧠大模型方面
1)微软MAI家族7款自研模型:从“用谁的模型”到“用谁的模型最划算”
• 时间:当地时间2026-06-02(Build 2026主旨演讲) • 事件:微软发布MAI(Microsoft AI)模型家族,共7款自研模型,覆盖推理、编码、图像、语音、转写等,统一“从零训练、零蒸馏”路线,强调企业成本可控与Agent能力栈。旗舰推理模型MAI-Thinking-1在关键软件工程基准上与Claude Sonnet 4.6持平,编程模型MAI-Code-1-Flash深度集成GitHub Copilot与VS Code。 • 亮点: • MAI-Thinking-1:350亿活跃参数,256K上下文,主打复杂多步推理与代码生成,盲测偏好与Sonnet 4.6不相上下。 • MAI-Code-1-Flash:50亿参数,推理效率优化,专为GitHub Copilot与VS Code场景定制。 • MAI-Image-2.5/Flash、MAI-Voice-2/Flash、MAI-Transcribe-1.5:图像生成/编辑、语音合成、多语言转写全栈覆盖。 • 影响:微软在继续与OpenAI合作的同时,用自研模型把推理成本留在自家生态,企业IT采购从“谁最强”转向“用谁最划算”。
2)阿里Qwen3.7-Plus:多模态智能体基座,从“看懂”到“做完”• 时间:2026-06-02 上午10:47(北京时间) • 事件:阿里发布千问3.7系列多模态大模型Qwen3.7-Plus,已在阿里云百炼上线API,定位“多模态混合智能体基座”,实现“看、想、写、做、验”一体化工作流。 • 关键能力: • 文本与视觉双提升:Vision Arena全球前五、中国第一;BabyVision视觉推理从37.4→64.7,超越Gemini3.1-Pro。 • Agent与编程:Terminal Bench 2.0-Terminus、SciCode编程评测提升约9分;Skillbench通用Agent能力提升10.2分;数学推理Apex得分近上代3倍。 • 长任务闭环:基于Hybrid-Agent系统连续运行11小时+,自动完成英语学习App全链路开发(超1万行代码、1000+次Agent调用)。 • 意义:把“视觉感知+代码生成+工具调用+GUI操控”统一到单一智能体循环,Agentic时代从“对话”正式走向“干活”。
3)英伟达Cosmos 3:开源全模态物理AI世界模型• 时间:2026-06-02 18:14 新浪科技报道 • 事件:英伟达发布Cosmos 3——面向物理AI的开放世界基础模型,采用混合Transformer架构,将视觉推理、世界生成与动作预测集成在单一系统,原生支持文本、图像、视频、环境音、动作等多模态。 • 性能:在Artificial Analysis、Physics-IQ、PAI-Bench、R-Bench等世界生成基准,以及RoboLab/RoboArena动作策略和VANTAGE-Bench/TAR视觉理解榜单中,Cosmos 3系列均居榜首。 • 生态:Cosmos 3提供Super/Nano/Edge(即将上线)三版本,同步成立Cosmos联盟,思灵机器人、LG、三星、理想汽车等已加入。
4)百度文心PaddleOCR-VL-1.6:OCR赛道再刷SOTA• 时间:2026-06-02 17:50 新浪科技 • 事件:百度发布PaddleOCR-VL-1.6,在OmniDocBench v1.6上准确率达96.33%,综合性能全球第一,刷新文档解析SOTA。 • 亮点: • 0.9B轻量化架构,在表格、古籍、生僻字、印章等复杂场景识别能力显著提升。 • 代码与权重开源至GitHub与Hugging Face,支持网页端与API调用。
5)DeepSeek-V4:腾讯云大降价,最高降幅97.5%• 时间:2026-06-02 公告,2026-06-03 00:00生效 • 事件:腾讯云智能体开发平台对DeepSeek-V4系列模型价格大幅下调: • V4-Pro:推理输入/输出价格降75%,缓存命中降97.5%; • V4-Flash:缓存命中降90%。 • 背景:此前DeepSeek官方已将V4-Pro永久降价75%,腾讯云在云渠道进一步拉低调用门槛,强化“高性价比国产模型”叙事。
6)豆包大模型:6月下旬上线付费,基础功能永久免费• 时间:2026-06-02 12:53 澎湃新闻 • 事件:字节旗下豆包预计6月下旬正式上线付费内容,三季度打通抖音电商,四季度进入运行期。 • 付费模式: • 标准版:68元/月,688元/年,面向轻度办公; • 加强版:200元/月,2048元/年,面向专业创作; • 专业版:500元/月,5088元/年,面向企业/重度用户。 • 官方表态:基础聊天、问答、文案创作等日常功能永久免费,付费主要针对PPT生成、数据分析、影视制作等高算力场景。
🛠️AI应用侧方面
1)OpenAI Codex三连更:Agent插件+注释+站点,走向“AI员工”平台
• 时间:2026-06-02 直播更新,6月3日逐步上线 • 事件:OpenAI为Codex智能体推出三项更新: • 智能体插件:首发6个角色插件(数据分析、创意制作、销售、产品设计、股票投资、投行),打包62个应用、110项技能,企业无需编程即可接入“资深AI员工”。 • 注释(Annotations):用户可选中Codex输出中的任意内容,要求解释或精准修改,实现“指哪改哪”。 • 站点(Sites):将任意文档转化为交互式网站/仪表盘,支持团队共享与实时预览。 • 战略:Codex将引入ChatGPT,覆盖9亿周活用户;CEO Sam Altman称下一阶段重点是“全天候自主运行的主动式AI”。
2)微信AI智能体原型测试:右滑出AI,调用小程序闭环• 时间:2026-06-02 多家媒体报道 • 事件:腾讯正测试微信内嵌AI智能体原型,项目被列为公司最高战略优先级。 • 交互:用户在微信主界面右滑即可调出AI对话窗口,输入自然语言后,智能体自动调用小程序完成任务(如按口味和预算找咖啡馆并下单)。 • 瓶颈:因前期芯片囤货不足与国产算力紧张,全量上线成本极高,短期营收能否覆盖尚不明朗。
3)谷歌Gemini 2.5 Flash Image:官方认领“最强AI版Photoshop”• 时间:2026-06-02 13:43 快科技 • 事件:此前爆火的匿名图像编辑模型“nano-banana”被谷歌官方认领,实为Gemini 2.5 Flash Image,现已可在Gemini和Google AI Studio免费使用,API价格0.039美元/图。 • 能力:支持多图合成、2D→3D转换、图像推理(如阴影、角度计算),被网友称为“AI版Photoshop”。
4)国家卫健委:探索在社区卫生机构推广AI辅助诊断等技术• 时间:2026-06-02 每日经济新闻 • 事件:国家卫健委办公厅发布通知,提出探索在城市社区卫生服务机构推广应用医学人工智能辅助诊断、处方前置审核、语音病历信息自动采集等技术,提高诊疗效率与文书管理水平。
5)Recorded Future与Wipro达成战略合作,提供AI驱动威胁情报• 时间:2026-06-02 新浪AI热点小时报 • 事件:全球威胁情报公司Recorded Future与Wipro建立战略合作伙伴关系,在Wipro的托管安全服务产品中推出托管威胁情报与品牌监测服务,将AI驱动情报嵌入安全运营工作流。
⚡短讯
• 微软Surface RTX Spark Dev Box发布:搭载NVIDIA RTX Spark芯片,定位AI开发者高性能PC,与Apple Mac Studio正面竞争。 • OpsGuru成为AWS多伦多合作伙伴创新中心启动合作伙伴:将展示数据湖仓加速器,在AWS上快速部署云原生数据湖,加速企业AI应用。 • 四部门启动“剑网2026”专项行动:以AI领域版权整治为重点,强化AI生成内容版权保护。 • 全球首条S+C+L三波段超低损多芯光缆线路在青岛建成开通:单条光纤容量达传统光纤5倍以上,为AI算力中心互联提供新基础设施。 • 腾讯云宣布DeepSeek-V4系列6月3日0时起大幅降价:最高降幅97.5,推动中小企业加速采用AI服务。
📬 主题订阅服务
想要专属的资讯日报?支持订阅特定主题!
三步完成订阅:
1. 👍 点赞 + ❤ 推荐 本篇日报 2. 💰 前往 订阅服务详情页 完成打赏 3. 📸 截图三连(点赞+喜欢+打赏)发至后台,告知你想订阅的主题关键词
订阅权益:连续 7 天收到该主题的精选日报推送
订阅日历:每日最多开放 2 个订阅席位,先到先得
🎁 后台回复「Chat」,可领取特供Plus优惠券或者kicode中转,调用codex额度,先到(优惠额度越高)先得。
ChatGPT Plus订阅优惠使用方法,参考:2026最新保姆级教程:国内如何低门槛升级ChatGPT Plus?
在kicode中转,调用codex的流程,参考:2026 保姆级教程:国内如何配置并使用codex(全流程图解)
夜雨聆风