🧠 MiniMax M3 发布:月49元,编程测试打赢 GPT-5.5 ↗[1]
MiniMax 6月1日发布 M3,SWE-Bench Pro 编程评测 59.0%,超越 GPT-5.5 和 Gemini 3.1 Pro;1M 上下文下每 token 计算成本仅为上一代 1/20,解码速度加速 15 倍。同步推出 MiniMax Code 订阅计划:Plus 49元/月、Max 119元/月、Ultra 469元/月,10天内完全开源权重。国产大模型第一次不靠价格低竞争,而是在编程、长上下文、多模态三项同时越线,闭源推理接口的定价权开始动摇。
🧠 英伟达发布 Cosmos3:物理 AI 大模型全面开源 ↗[2]
英伟达 6月1日发布全球首个全开源多模态物理 AI 大模型 Cosmos3,混合 Transformer 架构单模型覆盖视觉推理、世界生成与动作预测,训练数据含数十亿条运动轨迹,联合行业伙伴成立"宇宙联盟"。机器人训练周期从数月压缩到数天,先把 Cosmos3 用好的团队将在仿真数据飞轮上取得结构性领先。
🚀 奥特曼宣布重启机器人业务,瞄准基础设施建设工人 ↗[3]
OpenAI CEO 奥特曼 6月1日发布 OpenAI Robotics 团队招聘,广纳全栈硬件、系统和机器学习工程师,短期聚焦能辅助技术工人建设基础设施的专项机器人,长期目标是通用家用机器人。OpenAI 2021年关停机器人业务后再入场,意味着软件-模型-硬件一体化的全栈竞争正式开始,对 Figure、波士顿动力等纯硬件公司形成直接压力。
🛡️ 小红书治理 120 万 AI 托管账号,处置 18 万条造假笔记 ↗[4]
小红书在 2026 上海网络视听创作者大会披露:累计处置 18 万篇 AI 造假笔记,系统性治理超 120 万个 AI 矩阵托管账号,手段包括模型识别升级和分级治理。120 万账号的量级说明 AI 刷号已是规模化产业,强力反制的直接结果是真实内容曝光权重上升,做真实内容的创作者红利窗口正在打开。
📊 抖音 4 月 AI 短剧月产 4.4 万部,爆款率仅 0.6% ↗[5]
4 月抖音新增 AI 短剧超 44,200 部,是真人剧的 13 倍,但播放量破亿爆款占比仅 0.6%。产量已不是瓶颈,创意和情绪共鸣才是稀缺资源;纯靠工具堆产量的 AI 短剧生产服务商护城河即将消失,能持续产出爆款公式的内容团队才有议价权。
🚀 千问打通淘宝全链路,儿童节礼品问询单周涨 260% ↗[6]
六一前一周千问 APP 礼品选购问询量增长 260%,背后是阿里打通千问与淘宝从推荐到下单到售后的完整交易链路。AI 助手从"导购"升级到"全程陪跑"是一次关键跃迁,传统搜索广告的转化逻辑一旦被 AI 对话系统替代,竞价排名商业模式将面临结构性挑战。
🤖 企业 AI Agent 落地,ROI 追踪已成采购核心门槛 ↗[7]
2026 年企业级 AI Agent 部署重心从"能否用"转向"用了赚多少",健身房会员留存、旅行社行程生成、留学中介销售转化等垂直场景已有可核实的降本案例,ROI 量化框架成为采购决策前置条件。没有 ROI 数据的 Agent 方案将越来越难过企业采购审核,纯工具型服务商的洗牌正在提速。
🌍 出口管制叠加高效开源模型,国产算力替代路径成型 ↗[8]
英伟达 Q1 FY2026 因 H20 出口管制损失 45 亿美元,Q2 再损失预计约 80 亿美元;同期 MiniMax M3 等高效开源模型集中涌现,M3 在极端测试中把 Hopper 架构 FP8 矩阵乘法利用率从 7.6% 拉到 71.3%,底层算子优化能力一旦迁移到国产芯片(昇腾、寒武纪),"高效开源模型 + 国产算力"就构成了绕过英伟达生态的完整替代链路。
🆕 今日新上榜
1. MiniMax-AI/MiniMax-M3 ↗[9]
今日 +2,100⭐ | 总计 3.6k⭐
MiniMax M3 官方仓库,包含 MSA 架构实现、推理代码和 API 接入示例,权重将于 10 天内完全开源。1M 上下文下每 token 计算量仅为上一代 1/20,编程、长上下文、多模态三项同时达到开源模型最优水平。私有化部署长文档分析、代码审查、多轮 Agent 任务的工程团队现在就值得做基准测试,等权重开源后直接有竞争力的替代方案。
2. NVlabs/Cosmos ↗[10]
今日 +1,240⭐ | 总计 3.1k⭐
英伟达 Cosmos3 官方开源仓库,物理 AI 大模型完整权重与训练代码,覆盖视觉推理、世界生成、动作预测三大能力,专为机器人和自动驾驶设计。英伟达少见的完全开源举动,机器人研究团队构建仿真数据飞轮的成本大幅下降,发布即冲榜说明市场对"物理 AI 基础设施"方向的判断已经形成。
3. openai/openai-realtime-agents ↗[11]
今日 +860⭐ | 总计 5.2k⭐
OpenAI 官方实时多 Agent 协作框架,基于 Realtime API 构建,支持语音输入、工具调用和多智能体任务路由,端到端延迟极低。适合电话客服、实时翻译、会议助理等语音 Agent 场景,官方背书 + 原生 API 集成,是目前搭建语音 Agent 成本最低的起点。
4. langchain-ai/langgraph ↗[12]
今日 +520⭐ | 总计 18.4k⭐
用有向图描述多步 Agent 任务流,支持循环、条件分支和人工审批节点,可回滚、可调试。企业级 Agent 落地的评价体系从"能跑"升级到"可控",LangGraph 这类有状态管理的框架比 AutoGPT 系列更能撑住生产压力,近期因大量 RAG+Agent 生产案例涌现再次进入增长期。
5. All-Hands-AI/OpenHands ↗[13]
今日 +430⭐ | 总计 51.2k⭐
原 OpenDevin,面向软件工程任务的自主 Agent 平台,沙箱隔离环境下支持终端操作、代码编辑、浏览器交互全流程。代码 Agent 赛道竞争激烈,OpenHands 的优势在于完整工具链集成和沙箱安全隔离,个人开发者和小团队可以直接接管真实工程任务,而非只能跑 Demo。
🔥 持续热门(总 Stars 排行)
ollama/ollama ↗[14] - 总⭐120k(今日+650)- 本地运行大模型最简单方式,一行命令拉起 Llama/Qwen/Mistral 等主流模型 Significant-Gravitas/AutoGPT ↗[15] - 总⭐172k(今日+310)- 自主 Agent 先驱,社区生态庞大,持续迭代中 huggingface/transformers ↗[16] - 总⭐145k(今日+560)- 几乎所有主流模型的统一推理接口,AI 工程师必备库 ggml-org/llama.cpp ↗[17] - 总⭐75k(今日+480)- 纯 C++ 推理引擎,边缘设备跑大模型的事实标准 microsoft/autogen ↗[18] - 总⭐41k(今日+290)- 微软多 Agent 对话框架,企业级编排首选之一 commaai/openpilot ↗[19] - 总⭐52k(今日+180)- 开源自动驾驶软件,物理 AI 落地真实车辆的标杆项目
本期要闻 8 条 | GitHub 新项目 5 个 | 持续热门 6 个
引用链接
[1]↗: https://www.minimax.io/blog/minimax-m3
[2]↗: https://news.aibase.com/news/28515
[3]↗: https://news.aibase.com/news/28517
[4]↗: https://news.aibase.com/news/28504
[5]↗: https://news.aibase.com/news/28516
[6]↗: https://news.aibase.com/news/28498
[7]↗: https://planetarylabour.com/articles/ai-agents-for-business
[8]↗: https://nvidianews.nvidia.com/news/nvidia-announces-financial-results-for-first-quarter-fiscal-2026
[9]↗: https://github.com/MiniMax-AI/MiniMax-M3
[10]↗: https://github.com/NVlabs/Cosmos
[11]↗: https://github.com/openai/openai-realtime-agents
[12]↗: https://github.com/langchain-ai/langgraph
[13]↗: https://github.com/All-Hands-AI/OpenHands
[14]↗: https://github.com/ollama/ollama
[15]↗: https://github.com/Significant-Gravitas/AutoGPT
[16]↗: https://github.com/huggingface/transformers
[17]↗: https://github.com/ggml-org/llama.cpp
[18]↗: https://github.com/microsoft/autogen
[19]↗: https://github.com/commaai/openpilot
夜雨聆风