乐于分享
好东西不私藏

AI与软件开发日报(第七期):Claude Code 推出 Agent View 功能

AI与软件开发日报(第七期):Claude Code 推出 Agent View 功能

要点速览

01Gmail 新注册流程强制要求手机扫码发送短信,引发严重隐私担忧。

02社区证实 Mythos 发现的 FreeBSD 漏洞早已存在于 AI 训练数据中。

03Qwen 3.6 35B A3B 模型凭借长上下文理解能力在开源社区大受好评。

04Claude Code 推出 Agent View 功能,实现多智能体会话统一管理。

05通用汽车裁员数百名 IT 员工,旨在招募具备更强 AI 技能的工程师。

06彭博调查称生成式 AI 正将身份盗用转变为工业规模的犯罪运作。

01

AI 技术与模型

MODEL RELEASES · 6 篇

在开发者社区引发热烈讨论,被证实具有卓越的长上下文理解能力。

资讯来源

Qwen 3.6 35B A3B 在开发者社区引发热烈讨论,被证实具有卓越的长上下文理解能力。多名开发者在 Reddit 上表示,该模型在结合门控增量网络、混合 Mamba2 等先进技术后,甚至能准确理解非常冷门的学术研究代码,其表现超越了 Devstral Small 2 等前代模型。这标志着小尺寸本地大语言模型在智能水平上迎来了质的飞跃,成为了开源社区的新宠。 (

推出了一系列重大更新,在持续将大型语言模型压缩至更小、更快推理包的战斗中取得突破。

资讯Reddit AI + Programming

ExLlamaV3 推出了一系列重大更新,在持续将大型语言模型压缩至更小、更快推理包的战斗中取得突破。继上个月发布 Gemma 4 支持后,最新引入的 DFlash 支持在多项基准测试中表现惊人:在编码任务中速度达到基准线的 3.00 倍,在智能体代码任务中达到 2.51 倍。这些优化显著提升了在 3090、4090 和 5090 等消费级显卡上的模型运行效率。 (

来源ExLlamaV3 Major Updates!
https://www.reddit.com/r/LocalLLaMA/comments/1t9voxs/exllamav3_major_updates/

最近发布了带有保留多令牌预测(MTP)层的 Qwen3.6-27B 和 Qwen3.6-35B-A3B 的 GGUF 格式量化模型。

资讯Reddit AI + Programming

Unsloth 最近发布了带有保留多令牌预测(MTP)层的 Qwen3.6-27B 和 Qwen3.6-35B-A3B 的 GGUF 格式量化模型。开发人员指出,要在本地运行这些具有 MTP 层的模型,用户目前仍需手动检查并编译 llama.cpp 关于 MTP 的拉取请求。Unsloth 在 Hugging Face 的模型卡片中提供了详细的使用说明和编译指导,方便极客玩家抢先体验这一提升生成速度的前沿技术。 (

来源MTP on Unsloth
https://www.reddit.com/r/LocalLLaMA/comments/1ta4rvs/mtp_on_unsloth/

宣布推出一种全新构建的模型架构,旨在大规模应用场景下实现极高的准确性。

资讯来源

Interfaze 宣布推出一种全新构建的模型架构,旨在大规模应用场景下实现极高的准确性。尽管目前关于该架构的具体技术细节尚未完全公开,但其宣称的目标直指当前大模型在海量数据处理和复杂任务中面临的精度瓶颈。这一新架构的发布,为探索超越现有 Transformer 架构的替代方案提供了新的思路,引发了行业内对下一代基础模型技术演进的密切关注。 (

热度:541 分 / 387 评论。

资讯Hacker News Top

Gmail registration now requires scanning a QR code and sending a text message – via Hacker News Top,热度:541 分 / 387 评论。

来源Gmail registration now requires scanning a QR code and sending a text message
https://discuss.privacyguides.net/t/google-account-registration-now-requires-sending-an-sms-via-phone-instead-of-receiving-an-sms/36082

热度:929 分 / 166 评论。

资讯Reddit AI + Programming

The FreeBSD vulnerability “discovered” by Mythos was already in its training data. – via Reddit AI + Programming,热度:929 分 / 166 评论。 摘要:热门评论:(489赞,u/standing_artisan)“A classic.” (379赞,u/RustOnTheEdge)“Right, that is some very interesting background. Mythos is looking more and more as a marketing ploy to get the “supply chain risk” designator removed from Anthropic, but that doesn’t mean there

来源The FreeBSD vulnerability “discovered” by Mythos was already in its training data.
https://www.reddit.com/r/programming/comments/1t9rl27/the_freebsd_vulnerability_discovered_by_mythos/

02

开发者工具与开源项目

DEV TOOLS · 8 篇

最新版本引入了“Agent View”功能,将其从单线程助手升级为多智能体工作空间。

资讯AI HOT All

Claude Code 最新版本引入了“Agent View”功能,将其从单线程助手升级为多智能体工作空间。该功能允许开发者在一个统一界面中集中管理所有正在运行的 Agent 会话,无需在多个终端标签页中切换。用户可以直观查看每个会话的状态,并随时切入切出回复,极大推动了从单个 Agent 顺序执行向指挥多个 Agent 并行协作的工作模式转变。 (

来源Claude Code 发布多任务统一窗口管理工具:Agent View
https://x.com/xiaohu/status/2053986292481056790

是由 MillionCo 在 GitHub 上开源的一个专为 React 开发者设计的诊断工具。

资讯GitHub Trending

react-doctor 是由 MillionCo 在 GitHub 上开源的一个专为 React 开发者设计的诊断工具。随着 AI 智能体自动生成代码的普及,代码质量参差不齐成为一大痛点。该工具的核心功能就是自动捕获并诊断由 AI 智能体编写的不良 React 代码,帮助开发者在使用 Cursor、Claude 等编程助手时守卫代码质量,防止 AI 引入潜在的逻辑漏洞和性能陷阱。 (

来源millionco / react-doctor
https://github.com/millionco/react-doctor

上近期出现了一个名为 AiToEarn 的开源项目,口号是“让我们用 AI 来赚钱!

资讯来源

GitHub 上近期出现了一个名为 AiToEarn 的开源项目,口号是“让我们用 AI 来赚钱!”。该项目旨在探索和提供利用人工智能技术实现自动化赚钱的途径与工具。随着 AI 能力的指数级增长,越来越多的开发者开始寻找将 AI 技术转化为实际收益的落地场景,该项目正是这一趋势的缩影,吸引了大量关注。 (

是一款专为 Claude Code 设计的开源插件,旨在提供更深度的多智能体 PR 审查体验。

资讯Hacker News Top

adamsreview 是一款专为 Claude Code 设计的开源插件,旨在提供更深度的多智能体 PR 审查体验。它通过并行子代理、验证通道和持久化 JSON 状态,执行多阶段审查。与内置命令相比,它能捕获更多真实 Bug 并产生更少的误报。此外,其独特的 walkthrough 命令能逐步引导用户审查不确定项,而 fix 命令能自动派发修复并使用 Opus 模型进行回归测试。 (

来源Show HN: adamsreview – better multi-agent PR reviews for Claude Code
https://github.com/adamjgmiller/adamsreview

是由一名高中生开发的零安装、自带密钥的纯 JavaScript Web IDE 克隆项目。

资讯Hacker News Top

OpenGravity 是由一名高中生开发的零安装、自带密钥的纯 JavaScript Web IDE 克隆项目。作者因在使用 Google Antigravity 时频繁遭遇限制,决定自行构建开源替代品。它完全采用 Vanilla JS 编写,极其轻量,通过集成 WebContainer API 为 AI 智能体提供真实的浏览器内 Linux 环境来运行命令,旨在支持更复杂的自定义智能体工作流。 (

来源Show HN: OpenGravity – A zero-install, BYOK vanilla JS clone of Antigravity
https://github.com/ab-613/opengravity

热度:144728 分。

资讯GitHub Trending

NousResearch / hermes-agent – via GitHub Trending,热度:144728 分。 摘要:The agent that grows with you

来源NousResearch / hermes-agent
https://github.com/NousResearch/hermes-agent

热度:92979 分。

资讯GitHub Trending

rasbt / LLMs-from-scratch – via GitHub Trending,热度:92979 分。 摘要:Implement a ChatGPT-like LLM in PyTorch from scratch, step by step

来源rasbt / LLMs-from-scratch
https://github.com/rasbt/LLMs-from-scratch

热度:10708 分。

资讯GitHub Trending

yikart / AiToEarn – via GitHub Trending,热度:10708 分。 摘要:Let’s use AI to Earn!

来源yikart / AiToEarn
https://github.com/yikart/AiToEarn

03

产品与商业动态

PRODUCT & BUSINESS · 6 篇

通用汽车(GM)近期解雇了数百名传统 IT 员工,目的是重新招聘具备更强人工智能技能的人才。

资讯来源

通用汽车(GM)近期解雇了数百名传统 IT 员工,目的是重新招聘具备更强人工智能技能的人才。此次裁员和招聘计划聚焦于 AI 原生开发、数据工程与分析、基于云的工程、智能体与模型开发以及提示词工程等前沿领域。这表明传统制造业巨头正在加速向 AI 驱动的技术公司转型,对具备新兴 AI 技能的工程师需求激增。 (

和 Udemy 这两大在线教育巨头宣布合并,旨在打造全球最全面的技能培训平台。

资讯来源

Coursera 和 Udemy 这两大在线教育巨头宣布合并,旨在打造全球最全面的技能培训平台。社区对此反应不一,有人质疑其如何通过反垄断审查,也有人认为在 AI 对传统在线教育平台造成巨大冲击的背景下,合并是求生的无奈之举。合并后的平台是否会利用垄断地位提高利润,成为受教育者和内容创作者普遍担忧的问题。 (

一位开发者构建了名为 Wobo 的免费 AI 智能体,专门用于自动寻找工作并代为申请,目前用户量已突破十万。

资讯来源

一位开发者构建了名为 Wobo 的免费 AI 智能体,专门用于自动寻找工作并代为申请,目前用户量已突破十万。该工具旨在解决求职者每天花费大量时间填写重复表格的痛点,它能扫描公司职业页面,过滤虚假职位和诈骗信息,并在几秒钟内判断是否值得申请。这标志着 AI 在个人求职领域的应用已从简单的简历优化,演进到了全自动代理执行的新阶段。 (

据报道,高达 59 万名买家支付了总计 5900 万美元购买特朗普家族推出的金手机,但迄今为止没有一部发货。

资讯来源

据报道,高达 59 万名买家支付了总计 5900 万美元购买特朗普家族推出的金手机,但迄今为止没有一部发货。这一事件引发了科技和商业界的广泛关注,暴露出在名人效应和粉丝经济驱动下的硬件产品预售存在的巨大风险和交付不确定性,也引发了消费者对预付费电子产品供应链管理能力的严重质疑。 (

正式在 AWS 上推出 Claude Platform,使企业能在自有 AWS 环境中使用与原生 API 相同的模型和功能,包括 Claude Managed Agents。

资讯AI HOT All

Anthropic 正式在 AWS 上推出 Claude Platform,使企业能在自有 AWS 环境中使用与原生 API 相同的模型和功能,包括 Claude Managed Agents。其关键突破在于工作负载、计费和权限管理全部保留在企业自身的 AWS 账户内,无需数据出境。此举直接解决了大型企业在采用前沿 AI 代理时面临的数据安全、采购流程和安全审查等核心障碍。 (

来源Anthropic推出Claude Platform on AWS,消除企业采用障碍
https://x.com/berryxia/status/2053966059015930095

热度:149 分 / 178 评论。

资讯Hacker News Top

Students Boo Commencement Speaker After She Calls AI Next Industrial Revolution – via Hacker News Top,热度:149 分 / 178 评论。

来源Students Boo Commencement Speaker After She Calls AI Next Industrial Revolution
https://www.404media.co/ucf-ai-commencement-speaker-booed/

04

安全、风险与争议

SAFETY & RISK · 6 篇

谷歌宣布,犯罪黑客正在利用人工智能技术寻找并利用重大的软件漏洞,AI 驱动的黑客攻击已成为工业规模的威胁。

资讯来源

谷歌宣布,犯罪黑客正在利用人工智能技术寻找并利用重大的软件漏洞,AI 驱动的黑客攻击已成为工业规模的威胁。这一声明凸显了随着大模型能力的提升,网络安全的攻防平衡正在被打破。攻击者能够以前所未有的速度扫描和识别系统弱点,迫使科技巨头不得不投入更多资源开发相应的防御 AI 系统来应对日益智能化的自动化攻击。 (

的新账户注册流程引发了隐私争议,目前要求用户扫描二维码并从手机发送短信,而不是接收短信。

资讯来源

Gmail 的新账户注册流程引发了隐私争议,目前要求用户扫描二维码并从手机发送短信,而不是接收短信。这一改变可能是为了打击批量注册和机器人账号,但同时也大幅增加了注册门槛,并引发了社区对谷歌过度收集用户手机号码及强制绑定移动设备的隐私担忧,被隐私倡导者批评为对无手机或注重隐私用户的不公平排斥。 (

此前声称发现了一个 FreeBSD 漏洞,但社区揭露该漏洞实际上早已存在于其训练数据中。

资讯来源

Mythos 此前声称发现了一个 FreeBSD 漏洞,但社区揭露该漏洞实际上早已存在于其训练数据中。多位网友指出,LLM 在某种程度上扮演着“超级搜索引擎”的角色,能从晦涩的历史论文中提取信息。社区质疑这更像是一场营销噱头,旨在为 Anthropic 洗刷“供应链风险”标签,同时也揭示了当前 AI 发现真正未知漏洞能力的局限性。 (

彭博社的一项调查揭露了生成式 AI 如何将美国的身份盗用转变为工业规模的运作。

资讯来源

彭博社的一项调查揭露了生成式 AI 如何将美国的身份盗用转变为工业规模的运作。从在暗网查询社会安全号码到制作深度伪造的驾照,自主智能体使得欺诈行为变得更加自动化、低成本且难以追踪。随着 AI 造假技术的普及,传统的身份验证系统正面临前所未有的严峻挑战,亟待引入更高级别的安全防护机制。 (

发布了名为 Daybreak 的新计划,这是针对安全领域推出的一项 AI 新举措。

资讯The Verge

OpenAI 发布了名为 Daybreak 的新计划,这是针对安全领域推出的一项 AI 新举措。Daybreak 专注于在攻击者发现之前检测并修补软件漏洞。它利用 Codex Security AI 智能体,基于组织的代码创建威胁模型,聚焦于可能的攻击路径,验证潜在的漏洞,然后自动化检测最高优先级的安全隐患,开启了 AI 主动防御的新篇章。 (

来源OpenAI just released its answer to Claude Mythos
https://www.theverge.com/ai-artificial-intelligence/928342/openai-daybreak-security-ai

热度:335 分 / 62 评论。

资讯Reddit AI + Programming

Computer build using Intel Optane Persistent Memory – Can run 1 trillion parameter model at over 4 tokens/sec – via Reddit AI + Programming,热度:335 分 / 62 评论。 摘要:As the title states, my build is indeed able to run a 1 trillion parameter model (in this case Kimi K2.5) locally at \~4 tokens/second. I thought r/LocalLLaMA would be interested in the build due to that stat line, and also due to the inclusion of an unusual p

来源Computer build using Intel Optane Persistent Memory – Can run 1 trillion parameter model at over 4 tokens/sec
https://www.reddit.com/r/LocalLLaMA/comments/1taeg8h/computer_build_using_intel_optane_persistent/

05

研究论文与技术趋势

RESEARCH · 7 篇

发布了最新的 Coding Agent 指数,首次将 AI 模型与 Cursor CLI 等具体编码环境组合进行评估。

资讯AI HOT All

Artificial Analysis 发布了最新的 Coding Agent 指数,首次将 AI 模型与 Cursor CLI 等具体编码环境组合进行评估。测试基于 SWE-Bench-Pro 等真实基准,结果显示 Opus 4.7 在 Cursor CLI 上以 61 分领先,而表现最佳的开源模型 GLM-5.1 得分为 53 分。该榜单还揭示了不同组合在成本与效率上的巨大差异,每任务成本最高相差 30 多倍,为开发者选择提供了实用参考。 (

来源Artificial Analysis发布Coding Agent指数,实测模型与编码环境组合表现
https://x.com/berryxia/status/2053972717800702258

在探讨 AI 编程代理时提出深刻洞见:AI 编写的代码必须降低维护成本,而不是仅仅加快编写速度。

资讯Simon Willison

James Shore 在探讨 AI 编程代理时提出深刻洞见:AI 编写的代码必须降低维护成本,而不是仅仅加快编写速度。如果 AI 让编码速度翻倍,它必须将维护成本减半,否则就是用暂时的速度提升换取永久的债务奴役。如果产出翻倍而维护成本不变,最终的维护负担依然翻倍。这一观点直击 AI 辅助编程的核心痛点,提醒团队关注代码质量而非单纯的产出。 (

来源Quoting James Shore
https://simonwillison.net/2026/May/11/james-shore/#atom-everything

一篇题为《LLM 智能体间的自然语言消息传递是一种架构反模式》的文章在技术圈引发热议。

资讯来源

一篇题为《LLM 智能体间的自然语言消息传递是一种架构反模式》的文章在技术圈引发热议。文章指出,在复杂的 AI 工作流中,让智能体之间通过自然语言进行通信不仅效率低下,而且容易产生信息丢失和误解。随着智能体架构的演进,采用结构化的数据交换格式或直接共享内存上下文,将成为构建高效、稳定多智能体系统的必然趋势。 (

撰文抨击 AI 生成内容正在破坏互联网生态,并提出“僵尸互联网”的概念。

资讯Simon Willison

Jason Koebler 撰文抨击 AI 生成内容正在破坏互联网生态,并提出“僵尸互联网”的概念。与仅仅是机器人互相对话的“死互联网”不同,“僵尸互联网”充斥着人利用 AI 与人交流、人管理 AI 智能体与他人互动的场景,甚至包括大量为了赚钱而自动生成的垃圾内容。这种难以辨别且令人心智俱疲的 AI 泛滥,正在严重扭曲人类的正常写作和交流方式。 (

来源Your AI Use Is Breaking My Brain
https://simonwillison.net/2026/May/11/zombie-internet/#atom-everything

热度:135 分 / 61 评论。

资讯github.com

ExLlamaV3 Major Updates! – via Reddit AI + Programming,热度:135 分 / 61 评论。 摘要:Turboderp has a been on [an absolute tear]( recently, in the endless battle to cram new llamas into smaller, faster boxes. We started off last month with the release of [gemma 4 support](

来源github.com
https://github.com/turboderp-org/exllamav3/commits/dev

来源github.com
https://github.com

来源ExLlamaV3 Major Updates!
https://www.reddit.com/r/LocalLLaMA/comments/1t9voxs/exllamav3_major_updates/

热度:237 分 / 32 评论。

资讯Reddit AI + Programming

Looks like the writer accidentally left the ChatGPT AI response in – via Reddit AI + Programming,热度:237 分 / 32 评论。

来源Looks like the writer accidentally left the ChatGPT AI response in
https://www.reddit.com/r/OpenAI/comments/1ta3jrz/looks_like_the_writer_accidentally_left_the/

热度:333 分 / 103 评论。

资讯Reddit AI + Programming

The Qwen 3.6 35B A3B hype is real!!! – via Reddit AI + Programming,热度:333 分 / 103 评论。 摘要:My personal test for small local LLM intelligence is to check whether a model has any ability to understand the code that I write for my own academic research. My research is on some pretty niche topics and I doubt that anything like it is substantively presen

来源The Qwen 3.6 35B A3B hype is real!!!
https://www.reddit.com/r/LocalLLaMA/comments/1t9whrt/the_qwen_36_35b_a3b_hype_is_real/

06

开发者社区讨论

COMMUNITY · 8 篇

上关于“资深工程师是否过度依赖 AI”的讨论引发共鸣。

资讯来源

Reddit 上关于“资深工程师是否过度依赖 AI”的讨论引发共鸣。一位开发者抱怨其技术主管从昔日的问题解决专家,变成了在架构设计甚至生活决策上都极度依赖 AI 的人。许多高赞评论指出,这源于冒名顶替综合征和 AI 带来的便利性,导致批判性思维逐渐消失。社区担忧,如果高级工程师失去了深度推理能力,将对软件行业的长远发展造成负面影响。 (

中佛罗里达大学(UCF)的毕业典礼上,演讲嘉宾在宣称 AI 是下一次工业革命时遭到了台下学生的集体嘘声。

资讯来源

中佛罗里达大学(UCF)的毕业典礼上,演讲嘉宾在宣称 AI 是下一次工业革命时遭到了台下学生的集体嘘声。这一事件在 Hacker News 上引发热议,反映出年轻一代对当前 AI 炒作的厌倦与反感。在学生面临就业压力和 AI 替代威胁的背景下,这种在庆祝学术成就的场合强行推销 AI 革命的行为,显然触碰了毕业生的逆鳞。 (

上关于“如果 AI 写代码,为什么还要用 Python?

资讯来源

Hacker News 上关于“如果 AI 写代码,为什么还要用 Python?”的文章引发了关于编程语言未来的激烈辩论。随着 AI 智能体能够自动生成大量代码,开发者编写代码的负担逐渐减轻。社区讨论的焦点在于,既然 AI 能处理繁琐的语法,人类是否应该转向使用更严谨、性能更好或更适合描述逻辑的语言,而将 Python 这样的胶水语言完全交给机器处理。 (

一篇回顾“电视史上最伟大镜头”的文章在 Hacker News 登顶:James Burke 在 2024 年只有一次机会完成完美的一镜到底场景。

资讯Hacker News Top

一篇回顾“电视史上最伟大镜头”的文章在 Hacker News 登顶:James Burke 在 2024 年只有一次机会完成完美的一镜到底场景。在 AI 和数字化剪辑泛滥的今天,这种依靠纯物理调度、人力配合和极限专注力完成的影视奇迹显得尤为珍贵。开发者们讨论这一话题,也是对当前过度依赖自动化生成内容的一种反思,致敬人类工匠精神的极致体现。 (

来源The greatest shot in television: James Burke had one chance to nail this scene (2024)
https://www.openculture.com/2024/10/the-greatest-shot-in-television.html

首席执行官 Tobias Lütke 分享了他们内部的 AI 编程代理 River 的运作模式,强调“车间学习”。

资讯Simon Willison

Shopify 首席执行官 Tobias Lütke 分享了他们内部的 AI 编程代理 River 的运作模式,强调“车间学习”。River 拒绝私聊,所有代码生成和审查都在公开的 Slack 频道进行。这种高度透明的工作方式不仅让代码可搜索,还允许全公司员工围观、参与讨论和学习。Lütke 将其比作德国传统的“教学车间”,认为这种渗透式学习是打造学习型组织的终极形态。 (

来源Learning on the Shop floor
https://simonwillison.net/2026/May/11/learning-on-the-shop-floor/#atom-everything

热度:77 分 / 69 评论。

资讯Reddit AI + Programming

Openclaw ia trending down and will disappear soon – via Reddit AI + Programming,热度:77 分 / 69 评论。 摘要:热门评论:(132赞,u/KickLassChewGum)“And nothing of value was lost.” (49赞,u/paulqq)“but i think the idea of a personal agent might stay. just not in javascript consuming 200$ + the month. some peeps are building agents soley on ollama or llama.ccp so maybe without th

来源Openclaw ia trending down and will disappear soon
https://www.reddit.com/r/LocalLLaMA/comments/1t9urup/openclaw_ia_trending_down_and_will_disappear_soon/

热度:230 分 / 136 评论。

资讯Hacker News Top

Can someone please explain whether Cloudflare blackmailed Canonical? – via Hacker News Top,热度:230 分 / 136 评论。

来源Can someone please explain whether Cloudflare blackmailed Canonical?
https://www.flyingpenguin.com/can-someone-please-explain-whether-cloudflare-blackmailed-canonical/

热度:230 分 / 130 评论。

资讯Reddit AI + Programming

Anyone else watching senior engineers become overly reliant on AI? – via Reddit AI + Programming,热度:230 分 / 130 评论。 摘要:When I started at my current company, AI tools were still pretty limited. Our tech lead was an excellent engineer with strong problem-solving skills, and it was genuinely inspiring working with him on difficult tasks. Over the last couple of years though, espe

来源Anyone else watching senior engineers become overly reliant on AI?
https://www.reddit.com/r/webdev/comments/1ta2diz/anyone_else_watching_senior_engineers_become/