乐于分享
好东西不私藏

今日AI快讯|AI科学家还在刷静态榜?基准主动反击,重塑自动科研评价标准;夯爆了!清北斯坦福联手,SimpleTES横扫…

今日AI快讯|AI科学家还在刷静态榜?基准主动反击,重塑自动科研评价标准;夯爆了!清北斯坦福联手,SimpleTES横扫…

【AI科学家还在刷静态榜?基准主动反击,重塑自动科研评价标准】

研究团队提出DASES方法,通过动态对抗环境评估自动科研发现,强调经得起反证的发现才是有效的。实验显示FNG-CE在多个数据集上表现优异,证明其机制性答案更可迁移。该方法改写了自动科研的评价标准,让评测从被动验收变为主动找脆弱点。
http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+AI%E7%A7%91%E5%AD%A6%E5%AE%B6%E8%BF%98%E5%9C%A8%E5%88%B7%E9%9D%99%E6%80%81%E6%A6%9C%EF%BC%9F%E5%9F%BA%E5%87%86%E4%B8%BB%E5%8A%A8%E5%8F%8D%E5%87%BB%EF%BC%8C%E9%87%8D%E5%A1%91%E8%87%8D%E5%8A%A8%E7%A7%91%E7%A0%94%E8%AF%84%E4%BB%B7%E6%A0%87%E5%87%86
━━━━━━━━━━━━

【夯爆了!清北斯坦福联手,SimpleTES横扫21个科学难题】

由清北斯坦福团队联合研发的SimpleTES框架通过试错反馈机制解决21个科学难题,采用开源模型实现跨领域科研突破,提出Trajectory-Level Post-training方法让AI学会科学探索元能力。
http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E5%A4%AF%E7%88%86%E4%BA%86%EF%BC%81%E6%B8%85%E5%8C%97%E6%96%AF%E5%9D%A6%E7%A6%8F%E8%81%94%E6%89%8B%EF%BC%8CSimpleTES%E6%A8%AA%E6%89%AB21%E4%B8%AA%E7%A7%91%E5%AD%A6%E9%9A%BE%E9%A2%98
━━━━━━━━━━━━

【谷歌这把「香蕉」太狠了!何恺明等引爆视觉Transformer时刻】

谷歌联合何恺明等发布Vision Banana,通过指令微调实现视觉任务统一。该模型以生成像素为核心,突破传统专用工具限制,在图像生成、编辑等任务中超越专用模型,证明生成能力可反哺理解精度,开启视觉AI「想象」时代。
http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E8%B0%B7%E6%AD%8C%E8%B0%B7%E6%8A%8A%E3%80%8C%E9%A6%99%E8%95%89%E3%80%8D%E5%A4%AA%E7%8B%A0%E4%BA%86%EF%BC%81%E4%BD%95%E6%81%BA%E6%98%8E%E7%AD%89%E5%BC%95%E7%88%86%E8%A7%89Transformer%E6%97%B6%E5%88%BB
━━━━━━━━━━━━

【DeepSeek V4震撼发布!实现全球开源领先】

DeepSeek V4系列预览版发布,包含1.6T参数的Pro版本和284B参数的Flash版本。Pro版本在Agent能力、世界知识和推理性能上对标闭源模型,采用混合注意力机制、流形约束超连接和Muon优化器技术,实现1M上下文处理和27%的计算量降低。Flash版本在效率与性价比上表现优异。API已同步上线,旧模型将于2026年7月24日停用。
http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+DeepSeek%20V4%E9%9C%87%E6%92%BC%E5%8F%91%E5%B8%83%EF%BC%81%E5%AE%9E%E7%8E%B0%E5%85%A8%E7%90%83%E5%BC%80%E6%BA%90%E9%A2%86%E5%85%88
━━━━━━━━━━━━

【一文读懂DeepSeek V4:1.6万亿参数、百万上下文、华为芯片】

DeepSeek V4预览版发布,包含1.6T参数的Pro模型和284B参数的Flash模型,均支持100万token上下文。通过压缩稀疏注意力机制,单token推理算力较V3.2降低27%,成本显著优化。模型在推理能力、世界知识储备上超越多数开源模型,但暂落后GPT-5.4和Gemini-3.1-Pro。与华为昇腾NPU协同验证,采用FP4精度适配昇腾950芯片,预计下半年将推动Pro版本价格下调。
http://weixin.sogou.com/weixin?type=2&query=%E8%85%BE%E8%AE%AF%E7%A7%91%E6%8A%80+%E4%B8%80%E6%96%87%E8%AF%BB%E6%87%82DeepSeek%20V4%EF%BC%9A1.6%E4%B8%87%E4%BA%BF%E5%8F%82%E6%95%B0%E3%80%81%E7%99%BE%E4%B8%87%E4%B8%8B%E4%B8%8B%E6%96%87%E3%80%81%E5%8D%8E%E4%B8%BA%E8%8A%AF%E7%89%87
━━━━━━━━━━━━

【一文读懂GPT-5.5:从今天起,OpenAI‘不卖’Token了】

OpenAI发布GPT-5.5,定位为面向真实工作的智能层级,其效率突破体现在同等延迟下模型更大且速度不减,上下文窗口达100万Token。在Terminal-Bench 2.0、GDPval等测试中,GPT-5.5得分82.7%、84.9%,超越人类基线与竞品。模型首次实现自我优化基础设施,API价格翻倍但Token消耗减少。在科研、编程、网络安全等领域表现突出,如发现数学新证明、独立操作电脑等。
━━━━━━━━━━━━

【亏损37亿美元的英特尔,市值一夜暴涨500亿美元】

英特尔一季度净亏损37亿美元,但营收136亿美元超预期,非GAAP净利润15亿美元,股价飙升18%,市值增500亿美元。数据中心业务增长22%,18A制程推出,14A技术获特斯拉等大客户订单。公司回购爱尔兰工厂股权,但分析师担忧估值过高,认为需更高业绩支撑。
http://weixin.sogou.com/weixin?type=2&query=%E8%85%BE%E8%AE%AF%E7%A7%91%E6%8A%80+%E4%BA%8F%E6%8D%9F37%E4%BA%BF%E7%BE%8E%E5%85%83%E7%9A%84%E8%8B%B1%E7%89%B9%E5%B0%94%EF%BC%8C%E5%B8%82%E5%80%BC%E4%B8%80%E5%A4%9C%E6%B6%A8500%E4%BA%BF%E7%BE%8E%E5%85%83