乐于分享
好东西不私藏

WPS笔记正式发布,AI贯穿记录与整理全过程 – 2026-06-06

WPS笔记正式发布,AI贯穿记录与整理全过程 – 2026-06-06

AI 资讯速读 – 2026-06-06

本次总结

OpenAI / GPT / Codex:关键词 开发、安全、行业;代表事件是 OpenAI 推出 Lockdown Mode…,OpenAI 正式推出Lockdown Mode,面向个人和 ChatGPT Business 账户…;同组还包括 OpenAI Codex迎来多项质量改进更新

Anthropic / Claude:关键词 开发、模型、行业;代表事件是 Opus 4.8 在 ARC-AGI-3…,视频展示Opus 4.8在ARC-AGI-3基准上的表现;同组还包括 Anthropic让Claude成为化学家…

Google / Gemini / DeepMind:关键词 本地、模型、行业;代表事件是 Cerebras实测Gemini 3.5…,Cerebras在自家硬件上跑了Google最新模型Gemini 3.5 Flash与Kimi…;同组还包括 Google发布Gemma 4 QAT优化模型…

今日焦点

1. WPS笔记正式发布,AI贯穿记录与整理全过程

WPS笔记正式发布,以AI驱动记录、整理与复用,定位为信息入口而非简单聊天框,旨在提升办公效率


2. OpenAI 推出 Lockdown Mode 防止提示数据泄露

OpenAI 正式推出Lockdown Mode,面向个人和 ChatGPT Business 账户,用于防止提示中的数据泄露,是一个重要的安全更新


3. lmarena.ai推出Agent Mode,发布Agent Arena排行榜详解

lmarena.ai推出Agent Mode用于评估代理AI,并详解Agent Arena排行榜,包含成功确认、投诉比例、可控性等五个信号,每轮贡献至排行榜


4. Cerebras实测Gemini 3.5 Flash与Kimi K2.6速度对比

Cerebras在自家硬件上跑了Google最新模型Gemini 3.5 Flash与Kimi K2.6的对比,两者智力相当但速度竞争激烈,完整基准结果已发布

资讯内容

1. OpenAI / GPT / Codex


OpenAI 推出 Lockdown Mode 防止提示数据泄露

OpenAI 正式推出Lockdown Mode,面向个人和 ChatGPT Business 账户,用于防止提示中的数据泄露,是一个重要的安全更新


OpenAI Codex迎来多项质量改进更新

Codex新增设置搜索、全屏侧边栏保持可见、跨重启保留更多工作状态(未读标记、草稿等)、以及主题化个人资料分享卡


调查揭发OpenAI/a16z超级PAC造谣,冒充AI安全倡导者煽动暴力

调查发现OpenAI/a16z超级PAC创建假账号冒充AI安全倡导者并煽动暴力,旨在抹黑安全领域公信力

2. Anthropic / Claude


Opus 4.8 在 ARC-AGI-3 基准上表现亮眼,但速度变慢有优化方案

视频展示Opus 4.8在ARC-AGI-3基准上的表现


Anthropic让Claude成为化学家,NMR分析媲美专业软件

Anthropic科学博客展示Claude通过分析NMR光谱解析分子结构,在部分任务上超越专业NMR软件,为AI在科学领域的应用提供新案例


Anthropic再提风险:高资本需求是IPO关键动机,呼吁协调暂停AI开发

Anthropic总裁称高资本需求是IPO关键,并再次呼吁AI实验室制定协调暂停计划,以应对潜在风险

3. Google / Gemini / DeepMind


Cerebras实测Gemini 3.5 Flash与Kimi K2.6速度对比

Cerebras在自家硬件上跑了Google最新模型Gemini 3.5 Flash与Kimi K2.6的对比,两者智力相当但速度竞争激烈,完整基准结果已发布


Google发布Gemma 4 QAT优化模型,可在LM Studio本地运行

Google发布Gemma 4 QAT检查点,通过量化感知训练显著降低内存需求,支持在消费级GPU和移动设备上运行,现已上线LM Studio


SpaceX 与 Google 签订巨额 GPU 算力协议

据 SpaceX 文件,Google 从2026年10月起每月支付9.2亿美元购买算力,包括约110,000个NVIDIA GPU

4. Qwen / 通义千问


阿里发布Qwen-VLA统一视觉-语言-动作模型及Qwen3.7-Plus

Tongyi Lab发布Qwen-VLA,统一操作、导航、轨迹预测于单一架构

5. 开发工具 / Agent 工作流


lmarena.ai推出Agent Mode,发布Agent Arena排行榜详解

lmarena.ai推出Agent Mode用于评估代理AI,并详解Agent Arena排行榜,包含成功确认、投诉比例、可控性等五个信号,每轮贡献至排行榜


Mistral 3.5加入lmarena.ai Agent模式,可测试复杂任务

Mistral 3.5模型已添加到lmarena.ai的Agent Mode,用户可评测其在真实代理任务中的表现


社区发布llama.cpp NVFP4/MXFP6 GGUF量化工具

开发者发布llama.cpp的NVFP4/MXFP6 GGUF量化工具,支持本地模型部署优化


Vercel推出独立于沙盒生命周期的代理文件系统

Vercel推出代理文件系统,支持独立读写和挂载,与沙盒生命周期解耦,为计算产品提供新型虚拟存储基础设施,对AI Agent部署有价值


YC推出Paxel工具:本地分析AI编码会话生成构建画像

Y Combinator发布免费工具Paxel,可分析Claude、Codex、Cursor等AI编码会话,生成构建画像,所有数据不出本地机器


LangChain推出Managed Deep Agents托管代理基础设施

LangChain发布Managed Deep Agents,提供托管、模型无关的深度代理基础设施,支持一行代码部署


WPS笔记正式发布,AI贯穿记录与整理全过程

WPS笔记正式发布,以AI驱动记录、整理与复用,定位为信息入口而非简单聊天框,旨在提升办公效率


MiniMax M3上线DGrid开发者平台

MiniMax M3通过@dgrid_ai平台开放,具备前沿编码、原生多模态和1M上下文能力,扩大开发者生态


Cursor推出Design Mode,可在画布直接标注UI元素指导编辑

Cursor新推出Design Mode,允许用户在画布上直接选择和标注UI元素,用于指导代码编辑,提升开发效率


LangChain发布LangSmith沙盒,支持安全执行agent代码

LangChain发布LangSmith沙盒功能,支持安全执行agent代码,Monday.com已利用该功能赋予Sidekick代理代码执行能力


Kimi推出办公工具Kimi Work,可调度300个Agent

Kimi Work继承Kimi Code和Agent技能,打通金融、科研等专业数据库,可同时调度300个Agent自动完成任务,交付文档、PPT等,无需写命令


华为云发布Agentic AI系列新品,打造智能时代“硅基黑土地”,标志着其在智能体AI领域的重要布局


腾讯云发布WorkBuddy企业版,打造AI效率工具

腾讯云发布WorkBuddy企业版,面向团队协作的企业AI效率工具,成为企业AI标配新选项


GitHub Copilot 终于支持自定义端点连接其他大模型

GitHub Copilot新增功能:支持自定义端点,用户可连接其他大模型(如本地模型)


Hugging Face在3B小模型上实现多代理经济体

Hugging Face博客介绍如何在3B小模型上实现多代理经济体,展示了资源高效的多智能体方案,对低成本部署有启发


VS Code 扩展一键切换 AI 代理 harness/skills/prompts

社区发布 VS Code 扩展,可一键切换多个 AI 编码代理的配置,兼容Claude Code、GitHub Copilot、Cursor和Windsurf


LangSmith LLM Gateway:成本限制、PII检测等运行时治理功能

LangSmith LLM Gateway提供成本限制、PII检测和违规处理等功能,无需离开LangSmith即可实施生产级治理,保障AI应用安全可控


英特尔通过CPU提升AI算力密度,应对Agentic AI算力焦虑

英特尔通过CPU技术提升AI算力密度,应对Agentic AI带来的算力焦虑,硬件创新推动推理效率提升


Runway展示完全AI生成游戏过场动画,单人一周完成

Runway展示完全AI生成的游戏过场动画《50 Crowns》,单人一周即可完成,展现AI在创意内容制作上的潜力

6. 其他值得关注


Image Arena Top 10更新:Reve 2.0等三款新模型入榜

文生图领域排名更新,Reve 2.0跃居第二(仅次于GPT Image 2),MAI-Image-2.5第四,Ideogram 4.0 Quality第九且是唯一开源模型


阶跃Step 3.7 Flash登顶AA榜,拿下速度/性价比/端到端三项第一

阶跃Step 3.7 Flash在AA榜获速度、性价比、端到端三项第一,性能与成本表现突出


微软推出Project Mosaic微LED光互连技术

微软Azure CTO介绍Project Mosaic,一种基于微LED的光学互连技术,可实现低功耗、高速数据传输,对数据中心硬件发展有重要意义


NVIDIA Research的PixelDiT入选CVPR 2026最佳论文决赛

NVIDIA的PixelDiT去除预训练自编码器以消除图像质量损失,是图像生成的重要突破,被选为CVPR 2026最佳论文决赛

7. 行业资讯 / 应用落地


科学家发现可用AI增强计算机蠕虫,安全威胁升级

研究者发现可通过AI增强计算机蠕虫能力,提升传播与破坏性,对网络安全构成新威胁


a16z:代理流量超越人类流量是必然趋势

Pinecone高管在a16z播客中讨论代理流量超越人类流量现象,认为代理已取代人类执行任务,对AI基础设施行业有启示


Alphabet 创纪录融资850亿美元,伯克希尔投资100亿用于AI基础设施

Alphabet 完成850亿美元股权融资,为史上最大规模,其中伯克希尔·哈撒韦投资100亿美元,资金将用于AI基础设施建设


YC法律AI公司Legora年营收超1亿美元,成增长最快企业软件

Y Combinator旗下法律AI公司Legora在18个月内增长至超过1亿美元营收,成为史上增长最快的企业软件公司之一


特朗普签署行政令要求AI模型提交政府安全审查

特朗普签署行政令,要求AI实验室将新模型提交政府进行30天安全审查,重大政策变化影响行业


伊利诺伊州通过美国最强AI安全法案

伊利诺伊州立法者通过美国最强AI安全法案,对AI监管具有里程碑意义,为其他州立法提供参考


英国CMA要求谷歌为出版商提供AI搜索Opt-Out选项

英国CMA下令谷歌为出版商提供AI搜索Opt-Out,将内容显示与AI训练数据权分离,重要监管动态