2026年4月10日 星期五 · 共 40 条 AI 资讯
今日摘要
OpenAI 推出 ChatGPT 100 美元 Pro 档 字节跳动发布原生全双工语音模型 Seeduplex,豆包可用 Overworld 发布实时扩散世界模型 Waypoint-1.5 LG AI Research 发布 EXAONE 4.5 开源视觉语言模型 阿里AIDC-AI开源两款 Marco-MoE 稀疏大模型 Claude API 上线 Advisor 策略,平衡智能成本性能提升 Claude Code 升级配置向导,引入监控工具 Codex 官方上线 Build macOS Apps 插件 Codex 宣布将再次重置使用额度 OpenClaw 发布 2026.4.9,重构记忆系统与安全机制 MiniMax 发布 MMX-CLI 命令行工具 Google 宣布 Gemini 支持生成交互式可视化及 3D 模型 Gemini 为免费用户开放使用 Lyria 3 生成完整歌曲功能 Claude Cowork 结束预览,全面开放并上线企业管控功能 扣子2.5开启Agent World时代。 腾讯龙虾QBotClaw浏览器智能体来了。 谷歌Gemini解锁Lyria 3音乐创作。 Mistral首款语音模型Voxtral开源。 巨量引擎品星云重塑AI营销。 通义实验室开源 VimRAG,支持图文视频混合知识库检索
产品与功能更新
1 阿里AIDC开源Marco-MoE稀疏大语言模型
大模型AIDC-AIMarco-MoE阿里AIDC-AI开源发布
阿里 AIDC-AI 团队开源了 Marco 系列两款稀疏多语言大模型,分别是总参数 173 亿、激活参数 8.6 亿的 Marco-Mini-Instruct 和总参数 80 亿、激活参数 6 亿的 Marco-Nano-Instruct。 Alibaba International Digital Commerce 近日推出了两款属于 Marco-MoE 家族的新型高度稀疏多语言大语言模型:Marco-Mini-Instruct 与 Marco-Nano-Instruct。 这两款模型均采用 Decoder-only Transformer 架构,并利用 Drop-Upcycling 技术从 Qwen3-0.6B-Base 升级改造而来,以极低的激活参数量实现了高效的推理能力。 其中,Marco-Mini-Instruct 拥有 17.3B 总参数,每个 token 仅激活 0.86B 参数;而 Marco-Nano-Instruct 拥有 8B 总参数,每个 token 仅激活 0.6B 参数。

📌 解读
阿里通过稀疏化技术实现小模型激活大模型能力,特别适合跨境电商的多语言场景。Drop-Upcycling技术将旧模型改造为新架构,大幅降低训练成本。6亿激活参数设计精准匹配边缘计算需求。
💡 启示
谁应该关注:边缘计算部门,多语言实时翻译格局变化:MoE架构成为降本增效新范式机会窗口:开发移动端多语种客服系统行动建议:测试稀疏模型在低功耗芯片表现
2 字节跳动发布全双工语音模型Seeduplex,误打断率降低50%
多模态Seeduplex字节跳动发布模型
字节跳动Seed团队推出原生全双工语音大模型Seeduplex,采用端到端建模技术,在复杂声学环境下将误回复率和误打断率降低50%,抢话比例下降40%。该模型判停延迟减少250ms,通话满意度提升8.34%。用户可通过更新豆包App体验该功能。

📌 解读
字节跳动通过全双工语音技术突破,在实时交互赛道建立技术壁垒。误打断率指标直击语音交互痛点,250ms延迟优化达到电信级标准。该技术可能优先应用于抖音电商客服场景,形成商业闭环。
💡 启示
谁应该关注:语音技术部门,实时语音交互场景格局变化:语音交互进入电信级可靠性竞争阶段机会窗口:开发会议场景的抢话预测功能行动建议:测试复杂环境下的多语种适配性
3 腾讯云发布龙虾浏览器智能体,支持远程操控电脑
应用QBotClaw发布AI Agent
腾讯云推出龙虾浏览器智能体,原生集成AI Agent能力,用户可通过微信扫码远程操控电脑,即使锁屏也能执行任务。该工具支持跨页面操作,Mac版已上线,Windows版即将发布。
📌 解读
腾讯通过微信生态整合AI Agent能力,强化其云服务与社交平台的协同效应,此举可能重新定义远程办公工具的市场标准。一个关键细节是支持跨页面操作,这意味着用户可以在不同应用间无缝切换,提升工作效率。
💡 启示
谁应该关注:产品部门,远程办公与跨设备协作格局变化:推动浏览器智能体成为办公标配机会窗口:开发更多跨平台AI办公工具行动建议:评估集成腾讯云AI Agent的可能性
4 Claude Cowork结束预览,全面开放并新增企业管控功能
大模型ClaudeCoworkClaude Cowork发布落地应用
Anthropic宣布Claude Cowork结束12周预览期,正式向所有付费用户开放桌面端应用。企业版新增基于角色的访问控制、团队支出限制等管控功能,支持macOS和Windows平台。

📌 解读
Anthropic通过企业管控功能强化B端市场壁垒,角色访问控制设计显示其对金融/医疗等强合规行业的针对性。预览期数据可能已用于优化团队协作场景的AI行为边界。
💡 启示
谁应该关注:企业服务部门,跨部门敏感信息处理格局变化:企业AI办公标准形成机会窗口:定制行业合规工作流行动建议:设计权限分级实施路线
5 Google Gemini新增交互式可视化功能,支持3D模型生成
大模型GoogleGemini发布落地应用模型
Google宣布Gemini应用推出交互式可视化功能,用户可在聊天界面生成可调整的3D模型与功能性模拟。该功能支持通过拖动滑块、输入数值调整系统变量,或旋转3D模型探索复杂概念。用户需选择Pro模型并输入特定指令或点击可视化按钮即可体验。

📌 解读
Google将Gemini定位为可视化思维工具而非单纯聊天机器人,通过交互式3D建模切入教育科研市场。这改变了AI助手仅处理文本信息的传统认知,其滑块调节功能可能成为STEM教育新范式。
💡 启示
谁应该关注:教育产品部门,复杂概念可视化教学格局变化:重塑知识传递方式机会窗口:开发学科专用交互模板行动建议:测试物理/化学课程适配性
6 Mistral开源语音模型Voxtral,支持声线克隆
多模态MistralVoxtralMistral首款语音模型Voxtral开源发布
Mistral发布开源TTS大模型Voxtral,该模型参数达4B,可在手机端运行,仅需3秒音频即可克隆声线。其首包延迟低至90毫秒,支持9种语言跨语迁移。

📌 解读
Mistral开源Voxtral模型,降低了语音克隆技术的门槛,可能引发语音合成领域的创新浪潮。手机端运行和低延迟使其在实时应用中具有优势,跨语迁移能力则扩大了市场覆盖范围。
💡 启示
谁应该关注:技术部门,实时语音合成与克隆格局变化:推动开源语音模型生态发展机会窗口:开发多语言语音交互应用行动建议:评估Voxtral在现有产品中的集成
7 Gemini向免费用户开放Lyria 3音乐生成功能
技术GeminiLyriaLyria 3发布
Gemini宣布免费用户现可通过Create music功能每天生成最多5首3分钟的完整歌曲,达到限额后仍可生成30秒短片。该功能上线不足50天已累计产出超1亿首歌曲。

📌 解读
Gemini通过音乐生成功能获取用户行为数据训练更精准的创作模型,免费策略实为数据采集手段。1亿首歌曲产生的隐式反馈比付费收入更具长期价值,这种数据飞轮效应可能改变AIGC竞争维度。
💡 启示
谁应该关注:数据战略部门,UGC内容平台运营格局变化:音乐创作民主化加速机会窗口:建立用户创作行为分析模型行动建议:监控生成内容版权风险
8 Claude Code新增自动化配置向导与监控工具
大模型ClaudeCodeClaude Code发布开发工具
Claude Code 推出了 Setup Wizard 和 Monitor Tool 两项更新。 全新的 Setup Wizard 实现了第三方云服务的自动化配置。 同时,开发者现在可以通过调用 Monitor Tool 来创建后台脚本并唤醒 Agent,从而在执行日志监控等高级任务时告别低效轮询,节省 Token 消耗。 Claude Code 推出了全新的 Setup Wizard 以及 Monitor Tool。 针对过去需手动编写配置文件和环境变量才能将 Claude Code 与 Amazon Bedrock 或 Google Vertex 搭配使用的痛点,新推出的安装向导可自动代为处理这些流程。该向导还能主动建议用户升级至其有权限访问的较新模型。 与此同时,Claude Code 还引入了 Monitor Tool。这项工具允许 Claude 创建后台脚本并在必要时唤醒 Agent,不仅避免了在 Agent 循环中进行低效轮询,还能极大节省 Token 消耗。 在实际操作中,开发者需要显式地对 Claude Code 进行提示才能调用该工具,例如指示其“启动开发服务器并使用 MonitorTool 观察错误”。

📌 解读
Claude Code通过工具链自动化降低使用门槛,反映了AI开发工具向DevOps融合的趋势。监控工具的异步唤醒机制创新性地解决了LLM场景的轮询消耗问题,这种设计思路可能重塑AI运维工具标准。云服务自动配置功能直击多云环境管理痛点。
💡 启示
谁应该关注:DevOps团队,AI系统持续集成部署格局变化:加速AI工具链与现有CI/CD体系整合机会窗口:构建基于事件驱动的AI监控体系行动建议:评估Monitor Tool与现有告警系统集成
9 巨量引擎发布品星云系统,AI可自动识别视频高光插入广告
多模态AI发布
巨量引擎推出品星云系统,该系统能自动识别视频中的高光片段并插入广告。此外,AI还能生成短剧番外内容,将品牌自然融入剧情。系统通过分析爆款逻辑提升互动效果,据称流量裂变效果显著。

📌 解读
巨量引擎通过品星云系统将AI深度融入广告投放,实现了内容与广告的无缝结合。系统通过分析爆款逻辑优化广告效果,这可能改变传统广告的投放模式,提升ROI。
💡 启示
谁应该关注:市场部门,AI驱动的广告投放优化格局变化:重塑视频广告的投放策略机会窗口:利用AI生成高互动性广告内容行动建议:测试品星云系统的广告效果
10 OpenAI推出100美元ChatGPT Pro订阅档,提供5倍Codex使用量
大模型OpenAIChatGPTPro发布开发工具
OpenAI正式推出每月100美元的ChatGPT Pro订阅服务,该档位提供比Plus版本高5倍的Codex使用量,并保留所有Pro功能。6月前促销期间,用户可获得10倍使用额度。同时,OpenAI调整了Plus计划的Codex使用量分配,以支持用户更均衡地分布任务。


📌 解读
OpenAI通过推出高价Pro档位,瞄准企业级和专业用户市场,进一步细分用户群体并提升ARPU。调整Plus计划Codex分配策略,既缓解服务器压力,又避免低价值用户挤占资源。促销期10倍额度是典型的获客策略,但可能掩盖长期留存问题。
💡 启示
谁应该关注:产品部门,AI工具订阅模式优化格局变化:加速AI服务分层化,挤压中小玩家生存空间机会窗口:开发针对Pro用户的垂直场景插件行动建议:监控用户层级迁移数据,优化配额算法
11 OpenClaw 2026.4.9版本更新:重构记忆系统并强化安全机制
网安 / 安全OpenClaw发布网络安全模型
OpenClaw发布2026.4.9版本,重点重构了记忆与梦境系统,新增支持历史路径的REM回填通道和结构化日记视图。同时推出并行运行的character-vibes评估报告以加速模型行为比对。安全方面修复了SSRF隔离漏洞,并限制不受信任工作区对核心授权选项的非法覆盖。

📌 解读
OpenClaw的记忆系统重构标志着AI系统向类人认知架构演进,REM回填通道的提出可能影响后续记忆机制设计标准。并行评估报告功能展现了模型行为可解释性的新思路,安全机制的强化则回应了企业级部署的核心关切。
💡 启示
谁应该关注:AI研究院,复杂对话系统架构设计格局变化:推动认知架构研究进入工程化阶段机会窗口:开发记忆系统的可视化分析工具行动建议:测试结构化日记在客服场景的应用
12 Codex宣布将于4月10日重置使用额度
编程Codex开发工具
Codex负责人于4月9日表示,因近期重置间隔较短,决定次日再次重置使用额度。此次调整旨在庆祝平台活跃用户达到300万节点,距离上次重置约一周时间。

📌 解读
频繁重置额度暴露平台运营策略的灵活性,这种非周期性的用户激励手段可能成为AI服务留存用户的新模式。300万节点里程碑暗示平台已进入规模效应阶段,但持续的资源投入策略需要配套商业化方案支撑。
💡 启示
谁应该关注:运营部门,AI平台用户活跃度管理格局变化:促使竞品重新评估资源分配策略机会窗口:设计弹性资源定价模型行动建议:监测用户行为对额度重置的响应
13 Overworld发布Waypoint-1.5实时扩散世界模型,支持720p/60fps生成
大模型OverworldWaypoint-1.5发布落地应用模型
Overworld发布Waypoint-1.5实时扩散世界模型,训练数据量达前代100倍,采用双层级架构,可在RTX 3070显卡上实现720p/60fps的实时环境生成。该模型支持本地部署和网页端体验,未来将兼容Apple Silicon Mac平台。

📌 解读
Overworld通过消费级显卡实现实时环境生成,打破专业算力门槛。双层级架构设计平衡质量与速度,720p/60fps指标瞄准游戏/VR市场。兼容Apple Silicon显示其跨平台野心。
💡 启示
谁应该关注:图形技术部门,实时虚拟环境构建格局变化:降低AIGC内容生产硬件门槛机会窗口:开发UGC虚拟场景创作工具行动建议:测试不同光照条件下的渲染稳定性
14 谷歌开放Lyria 3模型,每日可免费生成5首歌曲
多模态GeminiLyria模型音乐生成
谷歌开放Lyria 3音乐创作模型,用户每天可免费生成5首完整歌曲,单曲时长可达3分钟。目前该生态内累计创作歌曲已突破1亿首。
📌 解读
谷歌通过免费策略快速扩大Lyria 3的用户基础,意在巩固其在AI音乐生成领域的领先地位。每天5首的限额既能吸引用户,又可能推动付费升级。1亿首的创作量显示了用户生成内容(UGC)的潜力。
💡 启示
谁应该关注:市场部门,AI音乐创作与内容生成格局变化:加速AI音乐生成工具普及机会窗口:探索AI音乐在营销中的应用行动建议:测试Lyria 3生成品牌定制音乐
15 MiniMax推出MMX-CLI命令行工具,支持多模态模型调用
编程MiniMaxMMX-CLI开源发布开发工具
MiniMax发布开源命令行工具MMX-CLI,支持AI Agent原生调用文本、图像、视频、语音和音乐等多模态模型。该工具具备七项核心能力,包括批量图像生成与理解、异步视频生成等,并优化了非交互式环境下的运行体验,生成消耗可直接计入用户Token Plan配额。

📌 解读
MiniMax通过开源MMX-CLI工具强化开发者生态,降低多模态AI应用门槛,意在吸引开发者构建基于其API的解决方案。此举可能挤压中小AI平台生存空间,尤其值得注意的是工具支持消耗计入用户Token Plan,暗示其商业化策略从单纯API调用转向开发者全生命周期服务。
💡 启示
谁应该关注:开发者关系部门,AI应用快速原型开发格局变化:加速多模态AI工具链标准化机会窗口:利用开源工具构建垂直领域Agent行动建议:评估工具与现有CI/CD流程整合
16 字节发布扣子2.5,支持智能体独立云设备
应用AgentWorld发布AI Agent
字节跳动发布扣子2.5,其智能体可运行在独立云设备上,支持7x24小时工作。该版本延续DeerFlow技术路线,具备长期记忆功能,并赋予智能体专属邮箱作为数字身份。

📌 解读
字节赋予智能体数字身份意味着向自主数字员工进化,专属邮箱使Agent具备对外沟通能力。独立云设备部署突破传统SaaS模式,可能引发边缘计算与AI结合的新硬件浪潮。
💡 启示
谁应该关注:IoT事业部,分布式智能终端管理格局变化:智能体实体化趋势显现机会窗口:开发专用硬件管理协议行动建议:研究边缘AI能耗优化方案
17 LG发布330亿参数开源视觉语言模型EXAONE 4.5
多模态LGAILG AI Research开源发布
LG AI Research推出开源视觉语言模型EXAONE 4.5,该模型包含330亿参数,其中视觉编码器12.9亿,语言模型317亿。在文档理解和韩语推理方面表现优于同级别模型,支持262,144 tokens的上下文长度,知识截止至2024年12月。

📌 解读
LG通过开源超大上下文窗口模型,在文档处理领域建立差异化优势。韩语优化显示其本土化战略,12.9亿视觉编码器规模暗示多模态侧重。知识截止日期设定可能影响金融/医疗等时效敏感领域应用。
💡 启示
谁应该关注:多模态研发部门,长文档跨模态分析格局变化:开源VL模型进入300亿参数竞赛机会窗口:开发合同条款自动比对系统行动建议:评估长上下文下的知识衰减曲线
18 Claude API推出Advisor策略优化成本与性能
大模型ClaudeAPIClaude API发布模型
Anthropic在Claude API中推出Beta版Advisor策略,通过将低成本Sonnet或Haiku模型作为执行者,仅在复杂决策时咨询顶级Opus模型,实现智能与成本的平衡。测试显示该策略在SWE-bench评测中提升2.7个百分点,同时降低11.9%任务成本。

📌 解读
Anthropic通过分层模型调用策略优化成本效益,体现了AI服务向精细化运营的转型。这种混合调用模式可能引发行业效仿,改变当前单一模型调用的竞争逻辑。值得注意的是,该策略在SWE-bench的评测提升证明其技术可行性,为模型组合应用提供新范式。
💡 启示
谁应该关注:技术部门,AI模型成本优化方案设计格局变化:推动行业从单一模型向混合架构演进机会窗口:开发跨模型调度中间件行动建议:测试Sonnet+Opus组合的本地化部署
19 Codex正式发布macOS应用构建插件
客户端侧产品CodexBuildApps发布落地应用
Codex官方发布Build macOS Apps插件,支持基于SwiftUI和AppKit的原生应用开发。该插件整合本地构建脚本与UI按钮,实现一键构建打包;增强Agentic Debugging功能,可添加遥测数据辅助实时调试,内置技能涵盖Apple设计规范与测试流程。
📌 解读
Codex聚焦垂直领域开发体验,通过深度集成原生开发工具链建立竞争壁垒。遥测数据与调试功能的结合展示了AI辅助开发的新方向,这种实时反馈机制可能成为开发者工具的标配功能。插件对Apple设计规范的覆盖体现了场景化知识的重要性。
💡 启示
谁应该关注:移动开发部,跨平台应用快速原型开发格局变化:推动AI编码工具向垂直领域专业化发展机会窗口:开发领域特定的代码生成模板行动建议:测试插件在SwiftUI迁移项目中的应用
前沿研究
1 清华AutoSOTA系统一周内刷新105个SOTA记录
大模型AutoSOTASOTA发布模型
清华大学发布AutoSOTA系统,该系统能自动调参和运行实验,实现端到端科研闭环。在一周内刷新了105个顶会SOTA记录,模型平均性能提升10%。相关论文已公开。

2 VGGT-SLAM++通过语义增强解决视觉定位漂移问题
多模态VGGT-SLAM
研究人员提出VGGT-SLAM++视觉定位新方案,引入DINOv2语义增强技术提升几何感知能力。该方案有效解决了机器人定位漂移问题,显著提高了大规模建图精度,推动视觉SLAM技术发展。
3 微软推出思维链压缩技术,推理效率显著提升
大模型开发工具模型
微软开发出思维链压缩技术,通过KV缓存保留关键信息。该技术使模型准确率提升15个百分点,吞吐量实现翻倍,进一步优化了推理资源使用。

4 PlaneCycle无需训练实现2D到3D转换
技术PlaneCycle开源模型
PlaneCycle方案通过将2D基础模型特征循环分布在三个平面,实现了无需重新训练或适配器的2D到3D转换。该方案已开源,在保持性能无损的同时提升了维度转换能力。
5 PRISM物理模型在去雾任务中达到SOTA水平
大模型PRISMSOTA模型
PRISM模型针对真实世界去雾任务,提出PSAR物理重建框架,专门解决非均匀雾气这一行业难题。其图像恢复效果达到商业级水平,清晰度显著提升。
6 腾讯混元MoT架构模型在22项评测中16项领先
大模型MoT发布模型
腾讯混元发布基于MoT架构的具身基础模型,参数规模达20亿。该模型在22项评测中获得16项最佳成绩,项目源码已公开。

7 SurFITR数据集发布,可检测13万张篡改图像
多模态SurFITR网络安全
AI造假正威胁视觉证据安全,SurFITR数据集包含13万张篡改图像,通过多模态LLM自动生成样本,显著提升了检测与定位能力,安全攻防对抗进一步升级。
8 通义实验室开源VimRAG框架,支持多模态知识库检索
多模态VimRAG通义实验室开源模型
通义实验室开源了VimRAG框架,该框架面向文本、图像和视频混合知识库检索。通过动态有向无环图和视觉能量分配机制,解决了多模态检索中的状态盲区问题。在Qwen3-VL-8B模型测试中,平均准确率达50.1%。

📌 解读
通义实验室开源VimRAG框架,解决了多模态检索中的关键技术难题,为混合知识库的应用铺平了道路。动态有向无环图和视觉能量分配机制是其创新点,50.1%的准确率显示了其潜力。
💡 启示
谁应该关注:技术部门,多模态知识库检索格局变化:推动多模态AI检索技术发展机会窗口:开发混合知识库的垂直应用行动建议:研究VimRAG在现有系统中的集成
9 智元GO-2具身智能机器人发布,测试成功率98.5%
大模型GO-2发布模型
智元机器人发布具身大模型GO-2,采用异步双系统架构和动作思维链机制。基准测试显示其成功率高达98.5%,标志着具身智能技术正逐步实用化。
行业展望与社会影响
1 Meta与CoreWeave签署210亿美元云计算协议
技术MetaCoreWeaveAI落地应用算力芯片
Meta与CoreWeave达成一项价值210亿美元的云计算协议,合作期限延长至2032年底。根据协议,Meta将获得英伟达下一代Vera Rubin芯片的初始部署权,以增强其AI研发能力。该协议是双方去年9月142亿美元合作的延续,消息公布后两家公司股价均有所上涨。

2 腾讯云下月起上调AI算力等产品价格5%
技术AI算力芯片
受全球AI算力需求激增及硬件成本上涨影响,腾讯云宣布自下月起将AI算力、弹性MapReduce等核心产品的刊例价统一上调5%,以保障服务质量与算力资源供给。

3 字节跳动面临AI人才持续流失
技术AI发布
字节跳动核心AI人才持续流失,前员工创办的爱诗科技等公司正积极争夺其业务。为应对人才流失,字节推出豆包股激励计划,并倾向于提拔校招生。管理层认为年轻人的学习能力是公司核心资产,正通过人员调整应对人才流失问题。
4 Intel与Google合作推进AI云基础设施与IPU开发
编程IntelGoogleAI落地应用开发工具
Intel与Google宣布达成多年期合作,Google Cloud将继续部署Intel Xeon处理器以满足AI需求,双方还将扩大基于定制ASIC的基础设施处理单元联合开发。
5 Nebius洽谈收购AI21 Labs以拓展AI云服务
投融资 / 创业NebiusAI21AI21 Labs模型
AI云服务商Nebius正在洽谈收购以色列AI公司AI21 Labs,旨在整合其Jamba模型与企业级AI平台,向全栈AI云服务转型。收购价格尚未披露,此前英伟达曾考虑以约30亿美元收购AI21 Labs未果。Nebius表示不对传闻置评,但确认正在构建全栈AI云服务。
开源TOP项目
1 Superpowers框架发布,支持智能体快速叠加技能
应用Superpowers发布开发工具AI Agent
智能体开发框架Superpowers正式发布,提供复杂逻辑处理方法论,支持快速为Agent叠加技能。该框架可提升开发效率,加速从手写代码到编排Agent的转变。
2 微软开源全能Markdown转换工具
多模态MarkItDown开源开发工具
微软开源了一款支持PDF、Word、音频及YouTube链接转换的Markdown工具,适配MCP协议和RAG流程,可通过插件扩展功能,开发者可通过简单命令安装使用。

3 Karpathy编程经验配置库上线,提升大模型代码质量
编程KarpathyKarpathy编程秘籍配置库发布落地应用开发工具
基于Karpathy方法论的编程经验配置库已发布,可精准修复大模型写代码的弱点,显著提升Claude等模型的代码产出质量。该项目已获得450个关注,部署流程较为简单。

4 金融大模型Kronos正式开源
大模型Kronos金融大模型Kronos开源开发工具模型
金融市场语言模型Kronos已开源,采用时序编码处理金融数据,能识别市场规律并优化量化交易,目前该项目在社区已获得2.8k关注。

5 港大推出智能私教系统DeepTutor
应用DeepTutor发布AI Agent
香港大学发布基于原生Agent架构的个性化智能导师系统DeepTutor,可实时捕捉学习痛点,旨在提供更个性化的教育体验。

社媒分享
1 OpenClaw发布memory-wiki记忆整理插件
应用OpenClawmemory-wiki发布AI Agent
延续此前"Light/Deep/REM"三阶段记忆巩固机制,OpenClaw再次跟进Karpathy方法论,发布 记忆整理插件 。自带置信度标注 和健康检查。杂乱Markdown秒变结构化知识库。过时信息自动清理 。Agent检索精度 大幅提升。
2 OpenAI模型成功解决五项Erdős数学难题
大模型OpenAIErd模型
OpenAI内部模型一次性攻克五项Erdős数学难题,其中Erdős 1091的解答尤为突出。数学家评价其证明过程相当优雅,显示出AI在逻辑推理方面的显著进步。

访问链接
阿里AIDC-AI开源两款 Marco-MoE 稀疏大模型
https://huggingface.co/AIDC-AI/Marco-Mini-Instruct
阿里AIDC-AI开源两款 Marco-MoE 稀疏大模型
https://huggingface.co/AIDC-AI/Marco-Nano-Instruct
字节跳动发布原生全双工语音模型 Seeduplex,豆包可用
https://seed.bytedance.com/zh/seeduplex
字节跳动发布原生全双工语音模型 Seeduplex,豆包可用
https://seed.bytedance.com/zh/blog/introducing-seed-full-duplex-speech-llm-attentive-listening-robust-interference-suppression-enabling-more-natural-interaction
字节跳动发布原生全双工语音模型 Seeduplex,豆包可用
腾讯龙虾QBotClaw浏览器智能体来了。
https://www.aibase.com/zh/news/26980
Claude Cowork 结束预览,全面开放并上线企业管控功能
https://x.com/claudeai/status/2042273755485888810
Google 宣布 Gemini 支持生成交互式可视化及 3D 模型
https://blog.google/innovation-and-ai/products/gemini-app/3d-models-charts/
Mistral首款语音模型Voxtral开源。
https://x.com/shao__meng/status/2042231525576441885
Gemini 为免费用户开放使用 Lyria 3 生成完整歌曲功能
https://x.com/Google/status/2042324699955237233
Gemini 为免费用户开放使用 Lyria 3 生成完整歌曲功能
https://x.com/GeminiApp/status/2042316630253076945
Gemini 为免费用户开放使用 Lyria 3 生成完整歌曲功能
https://x.com/joshwoodward/status/2042318148851188151
Claude Code 升级配置向导,引入监控工具
https://x.com/_catwu/status/2042345489778331915
Claude Code 升级配置向导,引入监控工具
https://x.com/trq212/status/2042335178388103559
OpenAI 推出 ChatGPT 100 美元 Pro 档
https://x.com/OpenAI/status/2042295688323875316
OpenClaw 发布 2026.4.9,重构记忆系统与安全机制
https://github.com/openclaw/openclaw/releases/tag/v2026.4.9
OpenClaw 发布 2026.4.9,重构记忆系统与安全机制
https://x.com/openclaw/status/2042072722902077938
Codex 宣布将再次重置使用额度
https://x.com/thsottiaux/status/2042067902392942790
Overworld 发布实时扩散世界模型 Waypoint-1.5
https://over.world/blog/waypoint-1-5
Overworld 发布实时扩散世界模型 Waypoint-1.5
https://github.com/Overworldai/Biome
MiniMax 发布 MMX-CLI 命令行工具
MiniMax 发布 MMX-CLI 命令行工具
https://github.com/MiniMax-AI/cli
LG AI Research 发布 EXAONE 4.5 开源视觉语言模型
https://github.com/LG-AI-EXAONE/EXAONE-4.5
LG AI Research 发布 EXAONE 4.5 开源视觉语言模型
https://huggingface.co/LGAI-EXAONE/EXAONE-4.5-33B
Claude API 上线 Advisor 策略,平衡智能成本性能提升
https://claude.com/blog/the-advisor-strategy
Claude API 上线 Advisor 策略,平衡智能成本性能提升
https://platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool
Claude API 上线 Advisor 策略,平衡智能成本性能提升
https://x.com/claudeai/status/2042308622181339453
Codex 官方上线 Build macOS Apps 插件
https://x.com/OpenAIDevs/status/2042369696608239848
清华AutoSOTA一周刷新105个SOTA。
https://tsinghua-fib-lab.github.io/AutoSOTA/
清华AutoSOTA一周刷新105个SOTA。
https://arxiv.org/abs/2604.05550
VGGT-SLAM++解决视觉定位漂移。
https://arxiv.org/abs/2604.06830
微软思维链压缩技术惊艳亮相。
https://x.com/omarsar0/status/2042315710173528122
PlaneCycle无训练实现2D转3D。
https://arxiv.org/abs/2603.04165
PlaneCycle无训练实现2D转3D。
https://github.com/HINTLab/PlaneCycle
PRISM物理模型达成去雾SOTA。
https://arxiv.org/abs/2604.07048
腾讯MoT架构2B模型横扫榜单。
https://github.com/Tencent-Hunyuan/HY-Embodied
SurFITR数据集反制监控图像造假。
https://arxiv.org/abs/2604.07101
通义实验室开源 VimRAG,支持图文视频混合知识库检索
通义实验室开源 VimRAG,支持图文视频混合知识库检索
https://github.com/Alibaba-NLP/VRAG
智元GO-2刷新具身智能标杆。
https://www.aibase.com/zh/news/26983
Meta 与 CoreWeave 签 210 亿美元协议强化 AI 算力部署
https://www.coreweave.com/news/coreweave-and-meta-announce-21-billion-expanded-ai-infrastructure-agreement
腾讯云上调 AI 算力等产品刊例价 5% 下月起生效
https://cloud.tencent.com/announce/detail/2254
字节沦为AI人才黄埔军校。
https://m.okjike.com/originalPosts/69d7a05f800201ac6863cce1
Intel 与 Google 达成合作推进 AI 云基础设施与 IPU 开发
https://newsroom.intel.com/data-center/intel-google-deepen-collaboration-to-advance-ai-infrastructure
Superpowers框架给智能体叠技能。
https://github.com/obra/superpowers
微软MarkItDown万能格式转换神器。
https://github.com/microsoft/markitdown
微软MarkItDown万能格式转换神器。
https://www.xiaohu.ai/c/a066c4/markitdown-pdf-word-ppt-youtube-markdown
Karpathy编程秘籍配置库上线。
https://github.com/forrestchang/andrej-karpathy-skills
金融大模型Kronos开源登场。
https://github.com/shiyu-coder/Kronos
港大DeepTutor打造智能私教。
https://github.com/HKUDS/DeepTutor
OpenClaw发布memory-wiki记忆插件。
https://m.okjike.com/originalPosts/69d78bfe25bae56612921b7f
OpenAI模型一口气攻克五项Erdős难题。
https://x.com/kevinweil/status/2042073869880848481
夜雨聆风