“ 模达卓越,智启未来”

www.modatech.com.cn / www.modatech.cn

“ 模达卓越,智启未来”
模达科技
www.modatech.com.cn / www.modatech.cn

国内外大模型发展如火如荼,近期有哪些值得关注的新闻?一起看看吧!
国际篇
INTERNATIONAL NEWS
Claude Opus 4.7曝光!Claude Code一夜重构,7x24小时替你打工
Anthropic近日重磅升级Claude Code,推出两大突破性功能:重构版桌面应用与全新「Routines」自动化系统。新版Claude Code支持单窗口并行运行多个Claude实例,集成终端、文件编辑、高清Diff查看器及PDF/HTML预览,真正迈向“全能IDE”。
更关键的是,Routines功能让Claude变身24小时在线的“云端员工”——无需开电脑,即可通过定时(如每晚修Bug)、API调用(如接入Sentry告警自动修错)、GitHub事件(如PR提交即启动代码审查与跨库同步)三路触发,全自动执行任务。与此同时,Claude Opus 4.7模型将于本周闪电发布,并同步推出AI设计工具Vibe,支持一句话生成网页、PPT等,直接挑战Figma、Adobe,已引发相关股价下跌超2%。

奥特曼被投掷燃烧瓶,点燃了AI圈最深层的恐惧
这起奥特曼豪宅遭纵火事件(旧金山),表面是一起未遂暴力行为,实则引爆了AI时代深层的信任危机。《纽约客》重磅长文直指核心:多位OpenAI前高管、安全负责人(包括联合创始人Ilya Sutskever)长期质疑奥特曼的可信度——他并非说谎,而是擅长用“精准模糊”的叙事,在投资人、政府、公众和员工间传递不同版本的承诺:对监管方强调安全,对军方谈合作,对公众讲普惠,对团队提使命。
这种“多面话术”在高速增长期被容忍,但在AGI临近的今天,却放大为系统性风险:安全团队边缘化、训练数据争议未澄清、与主权资本及国防项目深度绑定。真正令人不安的,不是AI失控,而是掌控AI的人——缺乏刚性约束、透明问责与可验证的制衡机制。

图源:网络
斯坦福423页AI报告出炉!中美差距仅2.7%,清华、DeepSeek冲进全球前十
斯坦福《2026年AI指数报告》(423页)揭示了一个加速狂奔却严重失衡的AI时代:能力飙升,但治理、教育、就业与信任全面滞后。中美模型性能差距已缩至仅2.7%(如Claude Opus 4.6 vs. Dola-Seed 2.0),顶尖模型数量接近五五开;全球95个最具代表性模型中,90%来自企业,学术界基本掉队。
AI能力“封神”速度惊人:编程修复(SWE-bench)准确率一年内从60%跃升至近100%,IMO数学金牌已成常态——但同一模型读模拟时钟正确率仅50.1%,暴露“锯齿前沿”:强项极强,弱项极弱。代价同样真实:22–25岁软件开发者岗位减少20%;全球AI事故年增55%(达362起);进入美国的AI研究者7年锐减89%。

图源:网络
英伟达近日重磅开源全球首个量子AI大模型
英伟达近日重磅开源全球首个量子AI大模型家族——NVIDIA Ising,标志着AI正式进军量子计算核心难题。该系列包含两大关键模型:
一是Ising Calibration(350亿参数视觉语言模型),可自动解读量子芯片测量数据,将原本需数天的量子处理器校准工作压缩至几小时;实测表现超越GPT-5.4、Gemini 3.1等顶尖闭源模型。
二是Ising Decoding(基于3D CNN的纠错解码器),提供“快”“准”双版本:Fast版比行业标准pyMatching提速2.5倍、准确率提升11%;Accurate版联合pyMatching后,纠错准确率提升53%。 当前量子芯片每千次操作就出错一次,而实用化要求错误率降至万亿分之一以下——Ising正瞄准这一瓶颈,用AI加速量子纠错与校准。

谷歌悄悄加了个按钮,Gemini长出手脚变打工人!
谷歌正将Gemini从“会聊天的AI”升级为“能干活的AI”。近日,其产品界面悄然新增「Agents」一级入口(与Chat、Gems并列),标志着Gemini正式迈入Agent时代——用户无需代码,即可在可视化界面中新建任务、设定目标、连接Gmail/Drive/Jira等20+工具、上传文件,甚至添加“人工审核”节点。
数据显示,Agent Designer已随Gemini Enterprise全面上线,支持多步工作流编排与定时自动执行;NotebookLM新增音视频摘要,Chrome侧边栏集成Auto Browse实现AI代操作浏览器。这背后是谷歌“全栈分发”战略:依托20亿+用户基础,把Agent能力嵌入Workspace、Search、Cloud等现有产品,让普通人拖拽即可创建AI员工。

图源:网络

国内篇
DOMESTIC NEWS
宇树机器人再破世界纪录,1秒10米“贴地飞”,连头都不要了
近日,宇树科技发布人形机器人H1新视频:它以10米/秒的惊人速度奔跑,刷新全球人形机器人最快纪录!H1身高约1.6米(腿长0.8米)、体重62公斤,外形“无头无手”,仅保留双臂与强健下肢,被网友笑称“摸不着头脑”。
其低重心姿态让跑步近乎“贴地飞行”,单腿6个自由度(髋3+膝1+踝2)支撑高动态运动。对比人类——博尔特百米世界纪录9.58秒(平均10.44米/秒),H1峰值虽达10米/秒,但加速能力仍弱于顶尖运动员,接近二级运动员水平。视频在B站播放超70万次、X平台23万次,引发热议。值得注意的是,同月镜识科技新机Bolt也宣称达10米/秒;而今年8月第二届世界人形机器人运动会、4月北京亦庄半程马拉松,或将首次迎来多款机器人同场竞速。

超越人手!中国第一家脑机接口独角兽,要把仿生手带给机器人
强脑科技,这家以脑机接口闻名的杭州“六小龙”企业,正悄然开辟新赛道——为机器人造出真正灵巧的手。其最新发布的Revo 3灵巧手,单手拥有21个自由度(接近人手27度),配备全直驱+可反驱结构、全掌触觉阵列和指尖视觉传感,握力达m70N,响应频率达3Hz。
它不是单项参数“卷王”,而是均衡可靠的“水桶手”:自由度够用不冗余,反驱设计让接触更柔顺(大幅缩小仿真与现实差距),触觉+视觉融合实现“边抓边感知”。更关键的是,它走亲民路线——价格具高性价比,已适配主流仿真平台,并计划开源算法,让开发者“半天就能跑起来”。背靠七年仿生手量产经验,Revo 3已获宇树、乐聚、逐际动力等头部机器人公司验证。


准确回答视频细节!11B模型挑战视频理解「证据级」任务,开源可商用
复旦大学与模思智能联合推出的MOSS-VL(11B参数)多模态模型,专攻视频理解中的“证据级”问答——不满足于泛泛而谈“这是一段做饭视频”,而是精准回答“喂猫5次,分别在00:03、00:12、00:18、00:27、00:37”;准确识别一闪而过的蓝色电动车车牌后四位为“4425”;完整转录滚动字幕;甚至能结合语音与画面,判断柜台上三只杯子对应“中杯、大杯、特大杯”(而非靠大小直觉猜错成小/中/大)。
它在时间定位、瞬时细节捕捉、跨模态语义对齐(如动作+字幕)、空间关系推理(如“面朝桌子时马桶在前右”)等硬核任务上显著超越同类模型。技术上创新采用“按需交叉注意力”“绝对时间戳编码”和“XRoPE统一位置编码”,让长视频处理更稳更准。

上海交大DENG Lab提出「LatentUM」:Unified Model的真正「战场」在视觉推理与世界模型


它石智航Pre-A轮融资4.55亿美金破中国具身智能纪录

图源:网络
>>>>>>END<<<<<<
模达科技AI前沿,与您一起见证智能科技的蓬勃发展!
文章仅代表我司观点,请您甄别借鉴。


模达科技公众号
微信号 : modatechsub
扫码关注我们。
夜雨聆风