2026年5月10日 AI科技日报自动生成
重点关注:AI芯片与硬件
国产AI芯片在2026年迎来集体突破,华为昇腾系列表现尤为突出。
华为昇腾950PR处理器
· 单卡FP4精度算力达到1.56PFlops,搭载112GB自研HBM显存,带宽1.4TB/s,功耗600W
· 首款针对推理场景深度优化的芯片,推理性能达英伟达H20的2.87倍,成本仅为1/4
· 华为2026年昇腾芯片出货量目标上调至75万片,预计贡献375亿至525亿元营收
· 字节跳动、腾讯、阿里巴巴等科技企业已向华为订购大批昇腾950PR处理器
国产AI芯片生态
· DeepSeek-V4发布首日即适配华为昇腾等八大国产芯片
· 海光、沐曦、摩尔线程、昆仑芯、平头哥真武、天数智芯、清微智能等国产芯片厂商实现Day0适配
· 基于FlagOS生态首次在国产可重构芯片完成千亿大模型适配
市场格局变化
· 华为在中国AI芯片市场份额预计2026年达到50%,英伟达份额萎缩至8%
· 昇腾出货量2025年约81.2万张,贡献国产总出货量近五成份额
大模型动态
中国AI大模型赛道在5月初迎来资本层面历史性转折,头部阵营估值体系被彻底重塑。
融资与估值
· <strong>DeepSeek</strong>:首轮融资目标高达500亿元人民币(约73.5亿美元),创下国内人工智能领域单轮融资最高纪录。创始人梁文锋计划自掏200亿元参与认购,融资估值飙升至450至500亿美元
· <strong>月之暗面(Kimi)</strong>:完成约20亿美元新融资,投后估值突破200亿美元
· <strong>阶跃星辰</strong>:即将完成近25亿美元融资,同时宣布红筹架构已拆除,港股IPO路径清障完毕
大模型发布与更新
· <strong>百度文心大模型5.1</strong>:正式发布,继承文心5.0知识,显著降低预训练成本。总参数压缩至约1/3、激活参数压缩至约1/2,仅使用业界同规模模型约6%的预训练成本,实现同级别模型基础效果领先
· <strong>DeepSeek-V4</strong>:发布预览版(包含Pro与Flash双版本),同步开放技术报告及模型权重开源权限。与华为昇腾实现全栈适配,标志着国产大模型和国产算力芯片已打通从训练到部署的全流程
大模型服务平台
· <strong>中国移动MoMA平台</strong>:5月8日在2026移动云大会正式发布,已接入超300款国内主流AI大模型,成为目前国内汇聚大模型数量最多的平台
· 首创词元(Token)集约化运营模式,通过"成本优先""效果优先""均衡优先"三种策略智能匹配最优模型
· 具备秒级故障切换能力,单位词元成本降低30%左右,资源占用率减少50%以上,日均调用量超过千亿级
AI应用与工具
2026年AI应用工具呈现轻量化、上下文原生、代理化与生态协同的发展特征。
全球主流AI工具
· <strong>Google Gemini</strong>:月活跃用户突破7.5亿,API每分钟处理100亿Token,成为全球最大规模AI服务。集成于Android、Workspace,并通过MCP(模型上下文协议)支持跨平台互操作
· <strong>Claude Code</strong>:原生集成Xcode 26.3,实现视觉验证、跨项目理解与自主任务执行,推动"代理式编程"模式被Apple生态广泛采用
· <strong>MiniCPM-o 4.5</strong>:由面壁智能推出,是首款开源全双工多模态模型,成为2026年最受开发者欢迎的开源模型之一
AI编程工具
· <strong>Trae(字节跳动)</strong>:累计注册用户突破600万,月活跃用户达160万,全年生成近1000亿行代码。TRAE 2.0版本推出SOLO独立端,提供Code和More Than Coding两种功能模式。编码效率平均提升30%以上,中文指令识别准确率可达98%。国内版完全免费,国际版Pro仅10美元/月
· <strong>Cursor</strong>:AI原生编辑器,Composer 2支持自研模型、多文件协同编辑与深度上下文推理
· <strong>GitHub Copilot</strong>:全球最大开发者生态,深度集成GitHub工作流,支持Agentic工作流与Copilot SDK
AI视频生成工具
· <strong>海艺AI</strong>:最高支持4K/60fps输出,参测产品中画质最强
· <strong>可灵AI</strong>:支持1080p分辨率,最大时长2分钟,支持口型同步
· <strong>即梦AI</strong>:支持1080p分辨率,60秒时长
· <strong>Runway Gen-4</strong>:支持4K分辨率,60秒时长
· <strong>Google Veo</strong>:支持4K分辨率,60秒时长,支持空间音频
AI音乐与创作工具
· <strong>蘑兔AI</strong>:零门槛中文AI音乐生成工具,提示词用中文即可,注册免费,适合中文创作者和零基础小白
· <strong>Stable Audio</strong>:Stability AI出品,支持44.1kHz立体声输出,提示词控制精细,最长可生成90秒音频
· <strong>Beatoven.ai</strong>:专为视频配乐设计,上传视频片段后AI自动分析画面情绪并生成匹配的背景音乐,自动卡点
行业与监管
政策导向
· 中共中央政治局就加强人工智能发展和监管开展集体学习,明确提出发挥新型举国体制优势、坚持自立自强、突出应用导向、推动健康有序发展的核心方向
· 2025年全国两会首次将大模型写入政府工作报告,同步提及优化全国算力资源布局、发展新一代智能终端、低空经济、生物制造、具身智能等关键领域
应用落地与产业化
· 今年以来人工智能应用落地加速,词元(Token)调用量呈现指数级增长,截至3月底日均值已突破140万亿,和2024年底相比增长超千倍
· 医疗大模型取得重要进展:胸部CT图像辅助诊断软件成功进入国家药监局创新医疗器械特别审查程序,这是全国首款进入该审查通道的大模型多病种AI医疗产品。该智能体可基于单次胸部CT影像识别近百种异常病变,诊断准确率达97.8%
产业格局
· 中国AI大模型行业已形成多层次技术体系,基础模型参数量从最初的十亿级快速攀升至万亿级别
· 针对中文语言特点和文化背景的专项优化成为本土大模型的突出优势,在语义理解、成语运用、古诗词生成等任务上表现优异
· 轻量化技术路径的探索为资源受限场景提供了可行方案,推动大模型从实验室走向实际应用
技术进展
算法创新
· 国内研究团队在注意力机制优化、稀疏化训练、知识蒸馏等关键技术上取得系列成果,显著提升了模型效率与泛化能力
· 分布式训练框架的成熟大幅缩短了模型迭代周期,使更多机构能够参与前沿研发
算力基础设施
· 国家级超算中心和商业云计算平台为大模型训练提供强大支撑
· 华为推出8192颗芯片的超节点,其产生的算力在目前数据中处于领先地位
挑战与应对
· 高端芯片供应受限对行业持续发展构成挑战,催生了异构计算、算法压缩等替代方案的创新
· CUDA生态的垄断在中国市场被实质性打破,国产算力架构在推理侧的性能已可与国际主流产品同台竞技
<strong>多源来源</strong>:IT之家、36氪、新浪科技、钛媒体、东方财富网、CSDN、搜狐科技、科学网、中国移动官网
夜雨聆风