AI 日报 · 2026年05月11日
AI资讯
1、修复DeepSeek-V4-Flash MTP并量化,推理提速2倍
2、GPT-5.5驱动Codex爆发:单周下载9000万
3、Claude深度接入Office四件套:跨应用上下文贯通
最新开源
1、MaixCAM伺服AI控制:YOLOv8追踪30FPS
2、开源RAG医疗文档问答机器人:多LLM+PDF检索
3、GitHub热榜个人专业网站项目开源上线
4、SwinFaceGuard开源:融合时空频特征识别深伪
5、开源脑电平台解析心理意象与信号质量
📰 最新资讯
01 · 修复DeepSeek-V4-Flash MTP并量化,推理提速2倍
🏷 技术突破
社区针对DeepSeek-V4-Flash修复多令牌预测(MTP)头加载被静默移除的问题,并结合路由专家W4A16 INT4 GPTQ量化与vLLM分支适配优化,使推测解码重新生效。在RTX PRO 6000 Max-Q上,524k双流吞吐由52.85提升至85.52 tok/s,128k单流约111 tok/s,显著降低大上下文推理成本。
主要亮点:
• 修复MTP头被移除,推测解码配置重新生效 • 路由专家采用W4A16 INT4 GPTQ量化并调vLLM • 524k双流吞吐提升至85.52 tok/s,超1倍增益
详情链接:https://huggingface.co/LordNeel/DeepSeek-V4-Flash-Acti-MTP-W4A16-FP8
02 · GPT-5.5驱动Codex爆发:单周下载9000万
🏷 行业动态
报道称奥特曼称GPT-5.5为“自闭天才”,强调其原始智能与性能。搭载该模型的Codex在5月初单周下载达9000万,显著领先竞品。开发者反馈其编码能力与Token效率优于Claude,可显著降低成本,但交互“人味儿”略逊。OpenAI正征集改进意见并暗示加入语音通话。
主要亮点:
• 奥特曼公开称GPT-5.5为“自闭天才” • Codex 5月初单周下载量飙升至9000万 • 初创团队称Token效率提升月省超3.2万美元
详情链接:https://x.com/sama/status/2053192407664259251
03 · Claude深度接入Office四件套:跨应用上下文贯通
🏷 产品更新
Anthropic宣布Claude正式登陆Excel、Word、PowerPoint,并开放Outlook插件公测,覆盖所有付费计划。它从聊天助手升级为Office工作流智能体,可在邮件、文档、表格与演示间保持连续上下文,减少反复交代背景与工具切换,尤其利好金融、咨询、法务等多应用协作场景。
主要亮点:
• 跨Outlook-Word-Excel-PPT全流程协作,上下文不断线 • Excel跨表建模不破坏原公式,支持复杂分析与复用 • PPT按模板生成可编辑图表,Word支持修订与评论审阅
详情链接:https://claude.com/claude-for-microsoft-365
🔭 最新开源
01 · MaixCAM伺服AI控制:YOLOv8追踪30FPS
🏷 开源项目
该开源项目面向MaixCAM实现AI伺服控制,集成YOLOv8目标检测、颜色追踪与运动传感,在端侧以约30FPS实时处理。它降低了机器人与IoT视觉闭环控制门槛,便于快速搭建“看见即行动”的跟随与定位应用原型。
主要亮点:
• YOLOv8目标检测驱动伺服闭环控制 • 融合颜色追踪与运动传感提升稳定性 • 端侧约30FPS实时推理,适配机器人IoT
详情链接:https://github.com/bobberdolle1/maixcam-servo-control
02 · 开源RAG医疗文档问答机器人:多LLM+PDF检索
🏷 开源项目
该GitHub开源项目基于RAG实现医疗PDF文档智能问答,集成FastAPI、LangChain与ChromaDB完成检索增强与向量存储,并用Streamlit提供交互界面,支持多种大模型切换。为医疗文档解读与知识查询提供可落地的工程范式。
主要亮点:
• RAG架构面向医疗PDF问答,降低幻觉提升可追溯性 • FastAPI+Streamlit前后端联动,快速搭建可用原型 • LangChain编排与ChromaDB向量库,支持多LLM切换
详情链接:https://github.com/anujpratap12/MediQuery-Medical-Document-QA-Bot
03 · GitHub热榜个人专业网站项目开源上线
🏷 开源项目
vincentdavidson 在 GitHub Trending 发布个人专业网站项目,主要以 HTML 构建,用于展示履历与作品集。项目虽体量小、Star 尚少,但可作为轻量化个人品牌与技术展示模板,便于二次定制与快速部署,适合开发者搭建在线名片与作品入口。
主要亮点:
• 基于HTML的轻量个人专业网站模板 • 适合快速部署作品集与在线简历展示 • 可作为开发者个人品牌页面二次定制起点
详情链接:https://github.com/vincentdavidson/vincentdavidson.github.io
04 · SwinFaceGuard开源:融合时空频特征识别深伪
🏷 开源项目
SwinFaceGuard 是一项基于 Swin Transformer 的深伪检测开源项目,通过融合空间、时间与频域特征提升对伪造人脸视频的辨识能力。该思路有助于增强跨场景鲁棒性,为内容审核、媒体溯源与身份验证提供更可靠的技术支撑。
主要亮点:
• 以Swin Transformer为骨干提升深伪检测表征能力 • 空间+时间+频域三路特征融合,增强鲁棒性 • 开源Python实现,便于复现、扩展与工程落地
详情链接:https://github.com/saguftaperween/SwinFaceGuard
05 · 开源脑电平台解析心理意象与信号质量
🏷 开源项目
Imagina 是一款 AI 驱动的脑电(EEG)研究平台,聚焦心理意象分析,支持对真实 OpenMIIR 数据进行评测与实验复现。项目提供信号质量度量、数据集就绪度评估与神经反馈启发式实验流程,帮助研究者更快完成从数据清洗到建模验证的闭环,推动脑机接口与认知神经研究落地。
主要亮点:
• 面向心理意象的 EEG 分析与评测工作流 • 集成 OpenMIIR 真实数据评估与复现实验 • 提供信号质量指标与数据集就绪度检测
详情链接:https://github.com/toniIepure25/Imagina
以上内容由 AI 汇总,数据来源于网络公开平台。
夜雨聆风