AI情报助手日报03-20
AI研究进展
-
OpenAI挑战赛旨在训练最优小模型。
OpenAI发起“Parameter Golf”挑战,要求参赛者在固定数据集和有限算力下,将模型产物控制在16MB以内,以训练出最优小模型。
点击阅读原文
(https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651022364&idx=2&sn=6ec1dc6f7449e96fb867f731e54d33f6&chksm=859c74766d9cc0c0afcb48392421eb14624ff4e1128bec2e0567a009357297c3aaf93e496bcd&scene=0&xtrack=1#rd) -
物理引擎赋能扩散模型。
北京大学彭宇新团队提出NS-Diff模型,通过结合物理约束与强化学习,让AI在生成视频时遵循物理定律,运动急动度误差降低43%。
点击阅读原文
(https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651022205&idx=2&sn=f9f875002797164e8ed66209e09ed761&chksm=85acba67f774de45c79d5b1c5680d489526fbdef7111d2c4d1b5baf5b8e97267e52f98d192a2&scene=0#rd) -
ProPhy框架让视频扩散模型实现物理一致性。
中山大学等机构提出ProPhy框架,通过“分层物理理解”和“空间物理对齐”能力,解决生成视频中物理bug问题。
点击阅读原文
(http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247876048&idx=3&sn=42bdbc964b60ca7142f410db43bd820d&scene=4#wechat_redirect) -
EmoStyle能将情感融入图像风格化。
深圳大学可视计算研究中心发布EmoStyle,它能根据用户提供的情感词,自动生成富有情绪的风格化图片。
点击阅读原文
(https://mp.weixin.qq.com/s/S-B3zwBXCRdYqoqzo0xYgQ) -
Streamo将离线视频模型转为实时流视频助手。
Streamo是香港浸会大学和腾讯优图实验室提出的模型,它能将“何时回答”转化为模型预测的token。
点击阅读原文
(https://mp.weixin.qq.com/s/Q28azqwk-PtsXoep2i0_0Q) -
MSA架构将大模型长时记忆能力扩展至1亿Token。
EverMind团队提出MSA架构,通过记忆稀疏注意力机制等,在大模型长文本问答评测中表现出色。
点击阅读原文
(http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651022315&idx=1&sn=6826cb3fc0e734e99b0b45cd8bf8ee7f&scene=4#wechat_redirect) -
腾讯开源多模态模型Penguin-VL。
Penguin-VL用纯文本LLM训练视觉编码器,打破了传统视觉backbone与语言模型拼接的套路,在文档理解和长视频时序定位等任务中表现出色。
点击阅读原文
(https://mp.weixin.qq.com/s/bRH402uumfdyeio9NLM5lA)
英伟达动态
-
英伟达CEO黄仁勋将首台DGX Station送给个人开发者卡帕西。
此举预示AI智能体时代个人开发者将登上舞台中央。DGX Station能将数据中心级AI算力压缩到桌面。
点击阅读原文
(https://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247876048&idx=2&sn=fdb19d3631f4261a4fb1326df48e7a1f&chksm=e90348ed69f919a0af84e30c3e17f8a8edf168dcf943044f52e0f70d0c9a545003b58819d491) -
英伟达新AI功能DLSS 5引发争议。
英伟达发布新一代图形技术DLSS 5,它能用生成式AI重绘游戏画面,但因AI生成的“网红脸”效果,遭到玩家集体抵制。
点击阅读原文
(https://mp.weixin.qq.com/s/yb1csSSt1DRK6duHK8pSNQ)
其他
-
OpenAI收购Python开发工具公司Astral。
OpenAI旨在将其uv、ruff等开源工具整合进Codex项目,加速AI编程助手开发,此举引发社区对开源工具未来走向和AI巨头垄断的担忧。
点击阅读原文
() -
量子密码学先驱获图灵奖。
国际计算机协会将本年度图灵奖授予Charles H. Bennett和Gilles Brassard,表彰他们奠定“无法被窃听”的通信基础。
点击阅读原文
(https://mp.weixin.qq.com/s/dPA5-eAS9whRDR-hFUobEw) -
A2A新范式实现机器人高性能单步动作生成。
新加坡南洋理工大学MARS Lab提出A2A新范式,让机器人基于历史轨迹预测下一步动作,打破了生成速度和精度的瓶颈。
点击阅读原文
(http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651022360&idx=2&sn=238cf9638edb4bbf9bb3b99efce04eb9&scene=4#wechat_redirect) -
中国AI“论论全球”呼吁“开源脑机接口”。
“论论全球”认为脑机接口存在数据隐私、黑客攻击等四大安全风险,开源是解决之道,此举引发海外社区热议。
点击阅读原文
(http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651022364&idx=1&sn=b996c7e30682a874ffdd1750cfb64c0d&scene=4#wechat_redirect)
夜雨聆风