AI 正在从"对话框"加速走向"浏览器"与"本地端"。Google 通过 Chrome Skills 实现了 AI 与网页操作的深度融合,而 Gemma 4 的发布则标志着"本地优先"的端侧 AI 时代正式开启。
Google Chrome 推出"Skills"功能:AI 助手变身一键网页脚本
这标志着 AI 助手从简单的聊天工具转型为真正的自动化生产力工具,用户可将常用的 Gemini 提示词保存为 Chrome 中的"技能",实现一键处理网页任务。Google 近日宣布在 Chrome 浏览器中内置这一功能,旨在将复杂的 AI 工作流简化为类似浏览器扩展的便捷操作。
MarkTechPost|04-14|原文[1]
Google 发布 Gemma 4:主打"端侧优先"的本地 AI 革命
用户不再需要时刻依赖云端,本地运行 AI 将带来极高的隐私保护和响应速度。Google 正式发布了 Gemma 4 系列模型,其核心设计理念是"本地第一",专门针对智能手机和个人电脑等设备上的端侧推理进行了优化。
InfoQ|04-13|原文[2]
OpenAI 内部信疑似流出:吐槽 Anthropic 营收"注水"
行业巨头间的竞争已进入白热化,不仅在技术上角力,也在商业故事上互相"拆台"。量子位援引社交媒体爆料称,OpenAI 内部信指出 Anthropic 年化收入存在夸大嫌疑,而 OpenAI 同时也正通过加强与亚马逊的联盟来应对微软的限制。
量子位|04-14|原文[3]
工具 / Skills / Agent / 应用
Google 秘密开发桌面代理:Gemini 将能接管你的 PC 任务
这预示着 AI 将拥有更高级别的系统权限,成为真正意义上的"AI 员工"。Google 正在 Gemini Enterprise 内部测试一种类似 Claude Cowork 的桌面 Agent,支持"人工审核"开关,能够直接处理复杂的桌面端任务。
TLDR|04-14|原文[4]
Vidu Q3 震撼发布:支持"万物皆可参考"的短剧神器
大幅降低了高质量 AI 视频的制作门槛,尤其是在保持角色和场景一致性方面迈出了一大步。新发布的 Vidu Q3 提供了特效、音效及场景的深度参考功能,能够根据少量素材生成风格统一的连贯剧集内容。
量子位|04-14|原文[3]
MiniMax 发布 MMX-CLI:让 AI 智能体拥有多模态"超能力"
赋予了开发者更简单的接口来调用视觉、语音和音乐能力,是构建多模态 Agent 的重磅利器。MiniMax 推出的这一命令行工具让 AI 智能体能够原生访问图像、视频、语音和搜索功能。
MarkTechPost|04-12|官网[5]
模型 / 榜单 / 研究
- • 榜单:斯坦福 2026 AI 指数报告出炉:报告指出中美大模型在技术水平上已基本没有差距,且 AI 的普及率正在全球范围内历史性加速。(原文[6])
- • 模型:Audio Flamingo Next (AF-Next) 发布:由 NVIDIA 与马里兰大学联合研发,是一款开源的超大规模音频-语言模型,标志着 AI 在理解环境音、音乐和复杂语音方面取得重大突破。(官网[7])
- • 研究:Anthropic 揭秘 LLM 的"情感"机制:论文深入探讨了在 AI 模型中加入类似情感的机制如何影响其行为表现,试图寻找让 AI 更加拟人且受控的方法。(论文[8])
- • 研究:KV 缓存压缩新技术 TriAttention:MIT 与 NVIDIA 团队提出的方法可在不损耗精度的前提下,将推理吞吐量提升 2.5 倍,能有效解决长文本分析时的显存焦虑。(原文[9])
- • 安全:NVIDIA GPU 遭遇 Rowhammer 攻击风险:研究发现新型攻击手段可利用 GPU 漏洞实现全系统接管,提醒广大开发者和云服务商关注底层硬件安全。(博客[10])
引用链接
[1] 原文: https://www.marktechpost.com/2026/04/14/google-launches-skills-in-chrome-turning-reusable-ai-prompts-into-one-click-browser-workflows/
[2] 原文: https://www.infoq.com/news/2026/04/google-gemma-4-local-first-ai/
[3] 原文: https://www.qbitai.com/2026/04/401367.html
[4] 原文: https://www.testingcatalog.com/google-develops-its-own-desktop-agent-to-compete-with-cowork/
[5] 官网: https://www.marktechpost.com/2026/04/12/minimax-releases-mmx-cli-a-command-line-interface-that-gives-ai-agents-native-access-to-image-video-speech-music-vision-and-search/
[6] 原文: https://www.qbitai.com/2026/04/401047.html
[7] 官网: https://www.marktechpost.com/2026/04/14/nvidia-and-the-university-of-maryland-researchers-released-audio-flamingo-next-af-next-a-super-powerful-and-open-large-audio-language-model/
[8] 论文: https://www.infoq.com/news/2026/04/anthropic-paper-llm-emotion-mechanisms/
[9] 原文: https://www.marktechpost.com/2026/04/11/researchers-from-mit-nvidia-and-zhejiang-university-propose-triattention-a-kv-cache-compression-method-that-matches-full-attention-at-2-5x-higher-throughput/
[10] 博客: https://www.infoq.com/news/2026/04/new-rowhammer-attacks-nvidia-gpus/
夜雨聆风