当前时间: 2026-04-21 21:43:01
更新时间: 2026-04-21
分类:软件教程
评论(0)
2026 年 04 月全球 AI 前沿动态(上)
一、模型与技术突破
1.1 通用大模型(大语言模型与多模态模型)
发布万亿参数通用大模型Ling-1T,基于 Ling 2.0 原生架构打造,采用20T+ tokens海量数据预训练,支持 128K 超长上下文窗口;搭载 FP8 混合精度训练方案,端到端性能加速 15% 以上;强化学习采用 LPO 优化算法,在 ArtifactsBench 前端评测得分 59.31,位居开源行业第一。
同时推出万亿参数思考型模型Ring-1T,完全开源模型权重与完整训练方案;通过 RLVR 强化学习大幅提升逻辑推理能力,在 IMO2025 数学奥赛评测斩获银牌,Arena-Hard V2 评测成功率 81.59%,稳居开源榜首;自研 icepop 算法解决训练与推理精度不一致问题,通过 ASystem 架构优化显存占用与权重交换效率。
预计 4 月下旬正式发布V4 新一代模型,采用万亿参数 MoE 混合专家架构;推理速度较前代提升35 倍,能耗降低 40%,同时首次深度适配华为昇腾等国产算力芯片。
GLM-5.1大模型在 SWE-bench Pro 权威基准测试中,性能超越 Claude Opus 4.6;近 12 个月 API 年化收入增长 60 倍至 17 亿元,2025 年整体营收 7.24 亿元,同比增长 131.9%,业务正从本地化部署全面转向云端 API 服务模式。GLM-5.1 登顶 LMArena Code Arena 开源编程榜单,评分 45.3 分,支持连续 8 小时稳定编程作业;2026 年一季度第三次上调 API 定价,涨幅 10%,Token 调用量仍逆势增长 400%。
发布首款完全闭源大型语言模型Muse Spark,多模态理解、医学问答能力表现突出,计算效率提升 10 倍以上,标志 Meta AI 战略正式转向务实商业化落地。
淘天集团与 ATH 事业群联合研发文生视频模型HappyHorse,登顶文生视频、图文生视频匿名综合评测榜单,目前已进入内测阶段,后续计划开放 API 接口。Wan2.7 视频生成模型登顶 DesignArena 榜单,得分 1334 分,领先第二名 68 分;Marco-Mini-Instruct 采用 17.3B 参数 MoE 架构,激活参数仅 0.86B,多数基准性能超越 4B 稠密模型,CPU 推理速度可达 30 tokens/s;通义实验室正式升级为集团独立 AI 事业部,设立集团技术委员会;CEO 吴泳铭宣布未来五年持续加大云与 AI 投入,目标年度收入突破 1000 亿美元。
Robotics X 实验室与混元团队联合发布具身智能基础模型HY-Embodied-0.5系列,依托架构创新与超 1 亿条专属数据训练;旗下 MoT-2B 模型在 22 项权威评测中斩获 16 项第一,大幅增强机器人三维空间感知与物理交互能力。
🎭 Anuttacon(米哈游蔡浩宇 AI 公司)
发布视频角色表演模型LPM 1.0,采用 170 亿参数扩散 Transformer 架构,支持文本、音频、图像多模态输入;可实现实时语音对话、倾听响应、微表情驱动、自然肢体动作生成,长时序角色身份一致性优秀,情绪演绎效果突出。技术团队由 20 余名研究人员组成,包含港中文博士、前腾讯混元核心成员。
开源JoyAI-Image-Edit图像编辑模型,采用 80 亿参数多模态语言模型 + 160 亿参数扩散 Transformer 耦合架构,是业内首个将空间智能深度写入底层架构的模型;支持相机控制、物体旋转空间漫游、物体空间关系操控三大空间编辑能力,基于 Apache 2.0 协议开源,完美适配 ComfyUI、Diffusers 生态。
发布MERaLiON-2语音文本一体化大模型,提供 10B、3B 双参数版本;融合本地化 Whper-Large-V3 语音编码器与 Gemma2 文本解码器,基于 12 万小时语音音频数据训练,支持 300 秒超长音频输入,覆盖中文、英语、马来语、泰米尔语等东南亚多语种。
开源视觉推理强化学习框架Vero,构建 60 万高质量样本 Vero-600K 数据集,涵盖图表理解、STEM 推理、空间认知等六大任务;采用任务路由奖励机制 + 单阶段强化学习策略,在 30 项基准评测中 23 项超越 Qwen3-VL-8B-Thinking,数据集、代码、模型权重全部开源。
发布GEMS 多模态生成框架,6B 轻量参数在复杂指令遵循、下游任务上表现优异;内置智能体协作机制、长期记忆模块、技能调用库,显著提升多模态生成效果与运行效率。
发布GEN-1 通用机器人模型,放弃传统 VLA 架构,面向物理通用人工智能研发;核心团队来自 Google DeepMind、波士顿动力,机器人任务完成率、执行速度与能效均实现显著提升。
发布 Muse Spark 模型,为旗下 “超级智能实验室” 首款旗舰模型。