过去七天,AI界的焦点从“聊天”转移到了“干活”上。
国内这边,腾讯发布了3D世界模型2.0,让普通人一句话就能生成可编辑的3D游戏场景;阿里千问推出Qwen3.6系列,编程能力全面跃升;DeepSeek则上线了“专家模式”,V4版本呼之欲出。
国际方面,OpenAI连出三招——Codex可以自动操作你的电脑了,GPT-Rosalind杀入药物研发赛道,还发布了网络安全专用模型;Meta在重组后发布Llama 5,想用开源打破封闭;Anthropic则用Claude Opus 4.7和托管智能体继续巩固开发者生态。
AI正在从“聊天机器人”进化成“数字劳动力”,从对话走向行动。话不多说,一起来看过去一周AI圈的重磅动态。
01 国内篇:腾讯“造世界”,千问升编程,DeepSeek推专家模式
腾讯:一句话生成3D游戏,混元世界模型2.0开源

4月16日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0),把AI从“对话、画图、捏物体”一举带入“造世界”的新阶段。
这个模型能做什么?简单说:输入“生成一个日式RPG风格的中世纪地牢”或“生成一个温馨的绘本风格小木屋”等自然语言指令,模型就能一键生成结构完整、画面精细的3D空间——不仅能看到,还能操作角色在场景里自由漫游,具备真实的物理碰撞效果。
更重要的是,2.0版本实现了本质跨越:直接生成可二次编辑的3D资产文件(支持Mesh、3DGS、点云等格式),这些资产可直接导入Unity、Unreal等主流游戏引擎,真正实现了“生成即可用”。
这招打得又准又狠,因为游戏引擎一直是腾讯的看家本领,这次直接把AI和自家生态无缝衔接了。目前世界模型2.0已上线至腾讯混元3D创作引擎官网,用户可以申请使用。
阿里:Qwen3.6系列全面升级,编程能力领跑国产模型
4月18日,阿里云正式发布千问Qwen3.6系列大模型,号称实现了编程、智能体及多模态能力的“范式跃迁”。
核心看点有三:一是编程能力全面跃升,代码生成与调试更精准,在多项权威评测中成为当下编程能力最强的国产模型;二是智能体能力成熟落地,原生支持LangChain等主流框架,工具调用稳定,可在开放环境中自主完成复杂任务;三是同步推出百炼“全模型通享”限时特惠,新客首月立减最高500元,覆盖150+款模型。
此外,通义千问关联公司通义云启注册资本由1亿人民币增至2亿人民币,增幅100%。而4月8日阿里CEO吴泳铭签发的全员信,则完成了AI组织架构的深度调整——周靖人专职负责通义大模型事业部,李飞飞出任阿里云CTO,三人各据一方,阿里AI正式进入“大一统时代”。
DeepSeek:上线“专家模式”,V4版本蓄势待发
4月8日,DeepSeek在网页端输入框上方新增“快速模式”与“专家模式”。快速模式适合日常对话,即时响应;专家模式擅长处理复杂问题。
这是DeepSeek首次引入分层模式,业内普遍认为是V4版本即将发布的重要铺垫。此前DeepSeek官网连续三天出现大规模访问异常,外界猜测与V4更新有关。据券商研报分析,V4模型亮点将聚焦国产化,在算法与工程层面缩小中国与全球大模型产业的差距。
其他国内动态
4月8日,智谱正式发布GLM-5.1,在年内涨价超八成后再度提价10%,是国产大模型首次在核心场景实现与海外头部厂商的价格对齐。此外,MiniMax持续推进M2.7生态,豆包海外版Dola单季下载量突破7200万,累计下载量超2亿。
02 国际篇:OpenAI三箭齐发,Meta开源Llama 5,Anthropic双线推进
OpenAI:Codex自动操作用户电脑,药物研发AI亮相
过去一周,OpenAI的动作密集得让人眼花缭乱。
第一箭:Codex上线自动操作电脑功能。 4月17日,OpenAI在编程代理Codex的大更新中上线了能“自主操作用户Mac电脑应用”的功能。公告标题干脆利落:“(几乎)万事皆可用的Codex”——Codex可以在后台“使用电脑上的所有应用”,还能记住用户偏好、从过往操作中学习、承担重复性工作任务。Codex还发布了111个插件,并新增了为自己安排未来工作并自动唤醒执行的能力。
第二箭:GPT-Rosalind杀入生命科学赛道。 同一天,OpenAI宣布推出GPT-Rosalind,一个专为支持生物学、药物发现和转化医学研究而构建的推理模型,目前已作为研究预览版面向符合条件的客户开放。安进、莫德纳、艾伦研究所等顶尖机构已率先接入。
第三箭:GPT-5.4-Cyber增强网络安全能力。 4月14日,OpenAI推出GPT-5.4的迭代模型GPT-5.4-Cyber,并扩大“网络安全可信访问”项目,向经审核验证的网络安全人员和团队开放。
Meta:Llama 5正式发布,开源狙击封闭模型
4月8日,Meta CEO扎克伯格在AI Connect峰会上正式宣布发布Llama 5。据扎克伯格称,Llama 5在推理、编码和自主智能体行为等关键基准上,表现已超越OpenAI的GPT-5和谷歌的Gemini 2.0。
旗舰模型参数超过6000亿,引入“递归自我改进”能力,支持高达500万token的超长上下文窗口。此前有报道称,由于Llama 4在激烈的AI竞赛中落后,Meta对AI团队进行了全面重组,扎克伯格挖来前Scale AI创始人亚历山大·王带队,目标从“开源模型领导者”转向“个人超级智能”。
Llama 5采用宽松的商业使用许可,旨在成为“AI界的Linux”。发布当天Meta股价上涨4.2%。
Anthropic:Claude Opus 4.7发布,托管智能体公测
4月16日,Anthropic发布Claude Opus 4.7。新版本主打高端软件开发能力,在高级软件工程领域实现了显著提升,尤其在超高难度任务上进步突出——用户反馈称,如今可以放心将此前需要严密人工把关的最复杂编码工作交给它处理。
模型视觉能力同样大幅增强,在智能体编码、计算机操作等多项基准测试中超越了Opus 4.6和GPT-5.4,比肩功能更全面的Claude Mythos Preview。Anthropic已为Opus建立了两个月一次的稳定更新节奏。
另外,4月8日Anthropic还发布了Claude托管智能体公测版,为企业提供可组合的API,支持构建和托管云端AI代理,内置沙箱代码执行、凭证管理、全链路追踪等功能。Notion、乐天和Sentry已率先接入。
谷歌:Gemma 4开源模型正式发布
4月3日,谷歌正式推出Gemma 4开源模型系列,涵盖2B到31B四个版本。31B版本性能媲美超千亿参数的巨头,数学能力提升68%,编程和多模态表现大幅跃升。Gemma基于超140种语言训练,累计下载量已超过4亿次。
03 AI监管:五部委联合出手,规范AI拟人化互动
4月10日,国家互联网信息办公室等五部委联合公布《人工智能拟人化互动服务管理暂行办法》,将于2026年7月15日起施行。
核心要求包括:AI系统不得生成鼓励自残或自杀、使用辱骂性语言、或诱发可能扭曲真实社会关系的情感依赖的内容;对用户连续使用服务每超过2小时的,应当以弹窗等方式提醒注意使用时长。
同时,严禁向未成年人提供虚拟亲属、虚拟伴侣等虚拟亲密关系服务。业界分析认为,这标志着中国AI治理从“技术狂奔”进入“安全合规”的新阶段。
04 AI就业市场:人才大战持续升温
2026年春招,AI相关岗位数量同比增长了12倍,占整个新经济领域岗位的26.23%——每四个新岗位里,就有一个跟AI相关。应届人工智能工程师职位平均招聘月薪达到17038元。
同时,AI岗位对经验的要求也在提升:要求3年以上工作经验的岗位占比超过七成,而面向1年以内经验者的岗位缩减了约20%。这意味着AI行业正在从“野蛮扩张”走向“专业化深耕”。
牛津大学经济学家卡尔·弗雷指出,AI不会导致大规模失业,但将彻底改变工作性质,从重复性任务转向创造性、情感性和社交性工作。
05 写在最后
过去七天,AI行业的关键词可以归结为四个:
造世界——腾讯用“一句话生成3D游戏”打开了AI应用的新想象力,从“生成物体”走向“生成世界”。
去干活——OpenAI的Codex学会操作电脑,GPT-Rosalind进入药物研发,AI正在从聊天机器人进化成真正的“数字劳动力”。
定规则——五部委联合出台AI拟人化互动管理办法,全球AI治理正从“先跑再管”走向“边跑边管”。
抢人才——AI岗位需求增长12倍,但“懂AI”正在取代“用AI”成为新的分水岭。
下一个七天,AI的故事还会继续。我们下周见。
参考资料:新华社、财联社、澎湃新闻、21世纪经济报道、IT之家、券商研报等
数据截至2026年4月19日
夜雨聆风