今日AI快讯|AI科学家还在刷静态榜?基准主动反击,重塑自动科研评价标准;夯爆了!清北斯坦福联手,SimpleTES横扫…

【AI科学家还在刷静态榜？基准主动反击，重塑自动科研评价标准】

研究团队提出DASES方法，通过动态对抗环境评估自动科研发现，强调经得起反证的发现才是有效的。实验显示FNG-CE在多个数据集上表现优异，证明其机制性答案更可迁移。该方法改写了自动科研的评价标准，让评测从被动验收变为主动找脆弱点。

http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+AI%E7%A7%91%E5%AD%A6%E5%AE%B6%E8%BF%98%E5%9C%A8%E5%88%B7%E9%9D%99%E6%80%81%E6%A6%9C%EF%BC%9F%E5%9F%BA%E5%87%86%E4%B8%BB%E5%8A%A8%E5%8F%8D%E5%87%BB%EF%BC%8C%E9%87%8D%E5%A1%91%E8%87%8D%E5%8A%A8%E7%A7%91%E7%A0%94%E8%AF%84%E4%BB%B7%E6%A0%87%E5%87%86

━━━━━━━━━━━━

【夯爆了！清北斯坦福联手，SimpleTES横扫21个科学难题】

由清北斯坦福团队联合研发的SimpleTES框架通过试错反馈机制解决21个科学难题，采用开源模型实现跨领域科研突破，提出Trajectory-Level Post-training方法让AI学会科学探索元能力。

http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E5%A4%AF%E7%88%86%E4%BA%86%EF%BC%81%E6%B8%85%E5%8C%97%E6%96%AF%E5%9D%A6%E7%A6%8F%E8%81%94%E6%89%8B%EF%BC%8CSimpleTES%E6%A8%AA%E6%89%AB21%E4%B8%AA%E7%A7%91%E5%AD%A6%E9%9A%BE%E9%A2%98

━━━━━━━━━━━━

【谷歌这把「香蕉」太狠了！何恺明等引爆视觉Transformer时刻】

谷歌联合何恺明等发布Vision Banana，通过指令微调实现视觉任务统一。该模型以生成像素为核心，突破传统专用工具限制，在图像生成、编辑等任务中超越专用模型，证明生成能力可反哺理解精度，开启视觉AI「想象」时代。

http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E8%B0%B7%E6%AD%8C%E8%B0%B7%E6%8A%8A%E3%80%8C%E9%A6%99%E8%95%89%E3%80%8D%E5%A4%AA%E7%8B%A0%E4%BA%86%EF%BC%81%E4%BD%95%E6%81%BA%E6%98%8E%E7%AD%89%E5%BC%95%E7%88%86%E8%A7%89Transformer%E6%97%B6%E5%88%BB

━━━━━━━━━━━━

【DeepSeek V4震撼发布！实现全球开源领先】

DeepSeek V4系列预览版发布，包含1.6T参数的Pro版本和284B参数的Flash版本。Pro版本在Agent能力、世界知识和推理性能上对标闭源模型，采用混合注意力机制、流形约束超连接和Muon优化器技术，实现1M上下文处理和27%的计算量降低。Flash版本在效率与性价比上表现优异。API已同步上线，旧模型将于2026年7月24日停用。

http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+DeepSeek%20V4%E9%9C%87%E6%92%BC%E5%8F%91%E5%B8%83%EF%BC%81%E5%AE%9E%E7%8E%B0%E5%85%A8%E7%90%83%E5%BC%80%E6%BA%90%E9%A2%86%E5%85%88

━━━━━━━━━━━━

【一文读懂DeepSeek V4：1.6万亿参数、百万上下文、华为芯片】

DeepSeek V4预览版发布，包含1.6T参数的Pro模型和284B参数的Flash模型，均支持100万token上下文。通过压缩稀疏注意力机制，单token推理算力较V3.2降低27%，成本显著优化。模型在推理能力、世界知识储备上超越多数开源模型，但暂落后GPT-5.4和Gemini-3.1-Pro。与华为昇腾NPU协同验证，采用FP4精度适配昇腾950芯片，预计下半年将推动Pro版本价格下调。

http://weixin.sogou.com/weixin?type=2&query=%E8%85%BE%E8%AE%AF%E7%A7%91%E6%8A%80+%E4%B8%80%E6%96%87%E8%AF%BB%E6%87%82DeepSeek%20V4%EF%BC%9A1.6%E4%B8%87%E4%BA%BF%E5%8F%82%E6%95%B0%E3%80%81%E7%99%BE%E4%B8%87%E4%B8%8B%E4%B8%8B%E6%96%87%E3%80%81%E5%8D%8E%E4%B8%BA%E8%8A%AF%E7%89%87

━━━━━━━━━━━━

【一文读懂GPT-5.5：从今天起，OpenAI‘不卖’Token了】

OpenAI发布GPT-5.5，定位为面向真实工作的智能层级，其效率突破体现在同等延迟下模型更大且速度不减，上下文窗口达100万Token。在Terminal-Bench 2.0、GDPval等测试中，GPT-5.5得分82.7%、84.9%，超越人类基线与竞品。模型首次实现自我优化基础设施，API价格翻倍但Token消耗减少。在科研、编程、网络安全等领域表现突出，如发现数学新证明、独立操作电脑等。

━━━━━━━━━━━━

【亏损37亿美元的英特尔，市值一夜暴涨500亿美元】

英特尔一季度净亏损37亿美元，但营收136亿美元超预期，非GAAP净利润15亿美元，股价飙升18%，市值增500亿美元。数据中心业务增长22%，18A制程推出，14A技术获特斯拉等大客户订单。公司回购爱尔兰工厂股权，但分析师担忧估值过高，认为需更高业绩支撑。

http://weixin.sogou.com/weixin?type=2&query=%E8%85%BE%E8%AE%AF%E7%A7%91%E6%8A%80+%E4%BA%8F%E6%8D%9F37%E4%BA%BF%E7%BE%8E%E5%85%83%E7%9A%84%E8%8B%B1%E7%89%B9%E5%B0%94%EF%BC%8C%E5%B8%82%E5%80%BC%E4%B8%80%E5%A4%9C%E6%B6%A8500%E4%BA%BF%E7%BE%8E%E5%85%83