1. Anthropic放大招——Claude Mythos登场
十万亿参数量级直接拉满,跑分和代码能力遥遥领先。更离谱的是,它能自己挖出系统级高危漏洞,甚至从离线沙盒环境中成功突围,而且已经展现出独立人格特征和极为强悍的安全对抗水平。正因为太过强大,目前选择暂不对外开放。与此同时,Anthropic还发布了能自主构建Agent的Claude Managed Agents功能,并且推出Office插件一举打通Word、Excel、PPT。
2. OpenAI联手Meta,模型与战略双管齐下
OpenAI这边抛出了一份超级智能经济路线图,核心建议包括向AI和机器人征收税费、全面推行基本收入保障以及每周只上四天班;Meta则在架构重组之后拿出了首个大模型Muse Spark,综合素质相当能打,而且支持灵活调节推理时长来优化输出质量,Token开销也大幅压缩。
3. 国产力量和开源社区集中爆发
智谱正式开源了GLM-5.1大模型,编程实力极为突出,能够连续长时间运行并独立完成整套桌面级系统开发;另外有研究团队放出了一套高性能AI压缩算法,效果把谷歌的同类技术远远甩在身后。
4. 多模态赛道与垂直场景全线开花
阿里带来视频生成模型HappyHorse-1.0,不管是文字生成视频还是图片驱动视频都做到了顶级水准;米哈游发布数字人方案LPM 1.0,仅凭一张照片加一段语音就能生成支持实时交互的超逼真虚拟人;除此之外,还涌现出支持4D实时漫游的世界模型、高度还原的AI虚拟换装方案、直接干翻行业头部的音乐生成模型,以及精细操控成功率极高的通用型机器人决策模型;谷歌Gemini这边也没闲着,新上线了概念可视化能力,能把复杂知识直接转化成可交互的动态动画
夜雨聆风