🔬 面壁智能发布国产算力低比特大模型BitCPM-CANN,端侧AI实现“算力自主+模型高效”双闭环
面壁智能于5月23日联合清华大学、OpenBMB开源社区正式发布新端侧模型BitCPM-CANN,其核心在于实现了中国首个完全基于国产算力平台训练并开源的三值(1.58-bit)大模型,标志着中国大模型研发在“算力自主+模型高效”双轮驱动上首次跑通世界级低比特端侧模型的完整闭环。它依托华为昇腾AI处理器,从量化算子、训练算法到全链路框架均在该国产算力平台上完成,并以开源形式发布了涵盖5亿参数至80亿参数的全套模型版本。这使得端侧AI设备能够从依赖高精度、高算力消耗的云端模型,转向部署在本地、极致轻量且性能不降的“三值模型”,例如在手机、IoT设备等资源受限的边缘场景中,该模型能以极低的存储和计算开销实现复杂的自然语言理解与生成任务。此举不仅突破了端侧AI长期面临的算力与能效瓶颈,更在底层硬件与算法框架层面实现了关键技术自主可控,为构建安全、高效的国产AI生态奠定了坚实基础。
⚙️ AI首次独立完成7nm芯片全流程设计,Verkor Design Conductor系统12小时“端到端”交付
芯片设计公司Verkor于5月24日宣布,其自主研发的AI系统Design Conductor仅凭219个单词的自然语言需求,在12小时内自主完成了7nm芯片从需求理解到物理版图生成的全流程设计,全程无工程师参与。这一突破的核心在于,AI首次将芯片设计这一高度复杂、依赖顶尖工程师经验的“手艺活”,转变为由自然语言驱动、高度自动化的“端到端”智能流程。它依托于强大的需求理解、架构探索、逻辑综合、布局布线等AI子模块协同工作,能够将诸如“设计一款用于边缘AI推理的7nm低功耗芯片,主频2GHz,面积小于50mm²”的模糊描述,自动转化为符合所有设计规则、可交付制造的完整版图。这使得芯片设计行业可以从动辄数月的漫长人工迭代周期,跃升至“按需生成、快速验证”的敏捷开发模式,极大缩短了从概念到流片的时间,并有望显著降低设计成本与门槛,为半导体产业的创新速度带来革命性提升。
🌐 谷歌I/O 2026余波:Gemini 3.5 Flash成默认模型,搜索迎25年来最大改版
在5月19-20日的Google I/O 2026开发者大会后,其影响持续发酵。大会的核心在于宣布谷歌全面进入“智能体Gemini时代”,并将AI从辅助工具升级为能够自主执行任务的智能体操作系统。其中,新发布的Gemini 3.5 Flash模型即日起成为Gemini App和AI搜索的默认引擎,其推理速度达到每秒289个Token,是同类前沿模型的4倍,同时成本不到一半,在编码、智能体任务等关键基准上已超越前代Gemini 3.1 Pro。这使得谷歌搜索迎来了25年来最大改版,从传统关键词框转变为支持文本、图片、视频、文件多模态输入的“对话式需求理解”界面,并能生成整合答案与交互界面的“AI概览”。同时,谷歌推出了可7x24小时在云端运行、代表用户跨Gmail、Docs等应用执行复杂任务的个人AI代理Gemini Spark,计划于5月26日起向AI Ultra用户开放。这一系列发布标志着谷歌正试图通过从底层模型到上层应用的全栈AI能力重构,确立下一代以智能体为核心的计算平台标准。
夜雨聆风