乐于分享
好东西不私藏

4/19/2026 AI速递 | Anthropic削弱Claude安全能力,谷歌推出AI音乐

4/19/2026 AI速递 | Anthropic削弱Claude安全能力,谷歌推出AI音乐

点击蓝字订阅每日AI速递
文章目录
01. Anthropic采取大胆举措:故意削弱Claude Opus 4.7的网络安全能力
02. 谷歌推出基于Lyria 3 Pro模型的AI音乐生成工具Flow Music
03. 谷歌推出Flow Music:无需乐器即可创作、混音和分享完整音乐
04. 揭秘Claude代码:颠覆传统代理设计
05. 构建高效的大语言模型代理架构
06. Anthropic 设计师分享 Claude Design 使用心得
07. 直接在Codex桌面构建iPhone应用
08. Databricks的Genie Code:数据团队的AI助手
09. 用自然语言在Codex中构建Web应用和游戏:全新设计体验
10. 构建高效代码执行代理:预备控制工作空间的重要性
🚀 今日AI速递
每日自动更新·欢迎订阅
Anthropic采取大胆举措:故意削弱Claude Opus 4.7的网络安全能力
📅 2026/04/18 17:43:34

Anthropic最近做出了一个前所未有的决定,他们在发布Claude Opus 4.7之前,刻意削弱了其在网络安全方面的能力

上周,Anthropic预览了他们迄今为止最强大的模型Mythos。然而,他们并没有立即发布,而是选择暂停,原因是Mythos在网络攻击能力上过于强大,需要进行实际环境中的安全测试。

为了确保安全,Anthropic在训练过程中对Opus 4.7进行了实验,专门减少了其网络攻击能力,并为其配备了运行时分类器,以自动检测和阻止禁止的网络使用提示。Opus 4.7成为了他们的“金丝雀”,而Mythos则继续等待。

与大多数AI实验室追求能力提升并在事后修补安全问题不同,Anthropic选择了一个不同的路径。他们特意发布了一个功能较弱的模型,以便在更强的模型进入生产环境之前,充分测试和验证其安全措施。

此外,Anthropic还启动了一个网络安全验证计划,允许合法的安全研究人员进行漏洞研究、渗透测试和红队演练。这意味着,尽管网络安全能力被限制,但仍然可以通过身份验证来使用。

这种做法展示了负责任的扩展实践,不仅是一个博客帖子或原则,而是通过一个实际发布的、功能减弱的模型来体现。

现在的问题是,其他实验室是否会效仿这一做法,还是Anthropic将成为唯一一家故意设置能力上限的公司?

这是否将成为新的标准,还是商业上的自杀?

···

谷歌推出基于Lyria 3 Pro模型的AI音乐生成工具Flow Music
📅 2026/04/18 06:16:16

谷歌正式宣布推出其最新的AI音乐生成工具Flow Music,该工具由谷歌最新研发的Lyria 3 Pro模型驱动。

Flow Music是建立在谷歌于今年2月收购的ProducerAI平台之上。这一新工具旨在帮助用户通过自然语言提示来创作、分享和混音原创音乐。无论是音乐爱好者还是专业制作人,都可以利用Flow Music将他们的创意转化为完整的音乐作品。

核心功能包括:

  • 使用自然语言输入生成音乐
  • 支持音乐创作与混音
  • 轻松分享和发布音乐作品

此外,Flow Music还提供了一个独立的网站,用户可以在这里创建、编辑和发布自己的音乐作品。通过结合图像和视频处理技术,Flow Music不仅能够生成高质量的音乐,还能为用户提供全面的多媒体创作体验。

谷歌表示,Flow Music将进一步扩展Flow系列产品的生态系统,使其成为一个集图像、视频和音乐于一体的全方位创作平台。

···

谷歌推出Flow Music:无需乐器即可创作、混音和分享完整音乐
📅 2026/04/18 16:44:48

谷歌刚刚宣布了其最新的音乐创作工具Flow Music,用户现在可以通过这一平台生成、混音并分享完整的音乐作品,而无需接触任何传统乐器。Flow Music(前身为ProducerAI)是一个独立的网站,旨在帮助用户通过自然语言提示将创意转化为完全制作的音轨。

该平台不仅支持音乐创作,还提供了一个社区,让用户能够分享和重新混音彼此的作品。此前,谷歌已经推出了Flow系列的图像和视频生成工具,如今,Flow Music的加入进一步扩展了这一生态系统的功能。

对于音乐爱好者和创作者来说,Flow Music无疑是一大福音。它不仅降低了音乐创作的门槛,还为用户提供了一个展示才华的平台。

通过简单的文本输入,用户可以描述他们想要的音乐风格、节奏甚至情感,系统会自动生成相应的音乐作品。此外,用户还可以对生成的音乐进行编辑和调整,以达到理想的效果。

···

揭秘Claude代码:颠覆传统代理设计
📅 2026/04/18 15:30:07

研究人员从UCL对泄露的Claude源代码进行了逆向工程,发现其内部结构彻底改变了我们对代理设计的理解。令人惊讶的是,只有1.6%的代码库用于AI决策逻辑,而剩下的98.4%则专注于操作基础设施。

这些基础设施包括权限门控、工具路由、上下文压缩、恢复逻辑和会话持久化。模型负责推理,而框架则处理所有其他任务。这种设计与目前大多数代理框架形成了鲜明对比。

LangGraph通过显式状态机路由模型输出,Devin将重规划器绑定到操作架构上,而Claude代码则在丰富的确定性框架内给予模型最大的决策自由度,并将所有工程努力集中在该框架上。

核心循环非常简单,即一个while-true循环:调用模型、运行工具、重复。然而,真正复杂的设计在于围绕这个循环的系统:

  • 一个包含7种模式和机器学习分类器的权限系统。用户通常批准了93%的提示,因此架构通过自动化层来补偿,而不是增加更多的警告。
  • 五层上下文压缩管道,每一层仅在更便宜的层失败时才运行。具体包括预算减少、剪切、微压缩、上下文折叠和自动压缩。
  • 四种按上下文成本排序的扩展机制:钩子(零成本)、技能(低成本)、插件(中等成本)和MCP(高成本)。每种机制解决不同的集成问题。
  • 子代理只返回摘要文本给父代理,其完整记录存储在侧链文件中。代理团队的令牌成本大约是标准会话的7倍。

每次会话都需要重新建立信任,这正是设计的一部分。Claude背后的赌注很简单:随着前沿模型在原始编码能力上的趋同,框架的质量将成为区分因素,而不是模型本身。

相关论文:Dive into Claude Code (arXiv:2604.14228)

···

构建高效的大语言模型代理架构
📅 2026/04/18 22:31:57

在设计一个高效的大语言模型(LLM)代理时,许多人可能会将其想象为一个附加了工具的模型。然而,真正的架构却颠覆了这种关系。

模型本身被设计得非常简洁,智能功能被推到了外部,由代理在运行时进行组合。

代理的核心围绕三个维度展开:

  • 记忆:存储模型不应通过权重或上下文携带的状态。工作上下文、语义知识、情节体验和个人记忆各自具有不同的生命周期。
  • 技能:存储程序性知识。操作程序、决策启发式和规范约束使通用模型针对特定任务进行专业化。
  • 协议:规定交互合同。代理与用户、代理与其他代理、以及代理与工具之间的交互都有各自的故障模式。

在核心和这些模块之间,中介层如沙箱、可观察性、压缩、评估、批准循环和子代理编排确保了代理如何对外部资源进行访问以及状态如何回流到系统中。

这种框架有助于明确新功能应放置的位置:稳定的知识存入记忆,学习到的策略存入技能,通信合同存入协议,循环治理则交给中介层。

代理的设计因此成为了一个关于什么应该外化以及如何进行中介的问题。

我正在从零开始构建一个最简化的代理代理,旨在教育且易于阅读,没有复杂的黑盒技术。即将开源,敬请期待。

···

Anthropic 设计师分享 Claude Design 使用心得
📅 2026/04/18 10:23:43

Anthropic 自家设计师 Ryan Mather 负责公司 7 个产品线的设计工作。他在最近分享了几条使用 Claude Design 的心得,结合官方教程,为设计师们提供了宝贵的建议。

首先,Ryan 强调了设计系统的重要性。他建议不要急于开始具体工作,而是先花一小时搭建一个设计系统。将代码库、设计稿和品牌素材全部提供给 Claude,让它抽取并生成一套统一的 UI Kit。这一步骤虽然在初期投入了一定时间,但其带来的长期效益是显著的。通过这种方式,每次生成设计稿时,风格都会自动套用,极大地提高了工作效率。对于公司层面,可以投入一到两周的时间进行系统沉淀,以确保后续工作的规范性和一致性。

其次,Ryan 提倡与工程师协同工作。 传统的“设计师出稿→交给工程师实现→再修改”的模式已经过时。他建议召开会议,让设计师和工程师一起讨论并敲定设计方案,这样可以大大提高开发效率。

  • 结构级大改用聊天:如深色模式的切换、布局的重大调整、新增设置面板等,这些任务通过聊天界面处理最为高效。
  • 细节调整点评论:如按钮 padding 的微调、颜色更改、输入框改为下拉菜单等,直接在元素上评论即可,精准又快速。

反馈要具体。官方举了一个例子:“看着不对劲”是最差的反馈,而“表单字段间距改成 8px”才是明确的指令。Claude 更擅长处理具体的指示,而不是模糊的情绪表达。

Ryan 还提到,通过将会议纪要等文档提供给 Claude,可以让它自动生成解决方案 Deck,从而节省大量时间和精力。此外,他也强调了在关键时刻手工操作的重要性,如新图标、核心插画、产品名字和品牌形象等,这些任务需要个人品味和判断,而非依赖模型。

最后,Ryan 建议将目标组件的文件夹或 package 挂载到 Claude 中,排除无用信息,保持上下文清晰。他还补充了两个小窍门:

  1. 多开几个 Chat 平行探索:同一个想法开 3 个对话,各自往不同方向跑一段,然后再挑精华合并。
  2. 团队 Leader 需要调整审查流程:从“人做、人审”转变为“Claude 做、人审”,确保工具的价值得到最大化利用。

···

直接在Codex桌面构建iPhone应用
📅 2026/04/18 21:13:12

现在,开发人员可以直接在Codex桌面中构建iPhone应用程序,并通过iOS模拟器进行测试。这种新的开发方式极大地简化了移动应用的创建过程。

使用Codex桌面,开发者可以在一个统一的环境中编写、调试和测试代码,无需在多个工具之间切换。这不仅提高了开发效率,还减少了出错的可能性。

主要优势包括:

  • 简化开发流程
  • 提高开发效率
  • 减少错误

对于那些希望快速原型化或迭代应用的开发者来说,这种集成开发环境是一个巨大的福音。此外,它还为初学者提供了一个友好的入门平台,降低了学习门槛。

随着技术的不断进步,这种集成开发环境有望成为未来移动应用开发的标准工具之一。

···

Databricks的Genie Code:数据团队的AI助手
📅 2026/04/19 01:54:35

Databricks推出的Genie Code是一款专为数据处理设计的人工智能代理。它类似于Anthropic的Claude Code,但专门为数据团队打造。

在发布仅一个月后,Genie Code已经超越了人类程序员,在Databricks平台上编写了更多的代码。这种转变表明,人们越来越多地使用自然语言表达意图,而由智能代理来完成实际工作。

具体应用包括:

  • 软件工程中的代码生成
  • 数据工程中的数据处理和分析
  • 其他需要大量编程工作的领域

根据内部邮件,Genie Code首次在代码编写量上超过了人类用户。这不仅展示了人工智能在提高生产力方面的巨大潜力,也预示着未来技术发展的新方向。

···

用自然语言在Codex中构建Web应用和游戏:全新设计体验
📅 2026/04/19 04:05:30

在Codex中,使用自然语言构建Web应用程序和游戏变得极其有趣。

开发人员可以通过这种全新的方式,在Codex环境中进行开发和设计。如果你正在从事Web技术相关的开发工作,这个视频绝对值得一看。

在视频中展示了以下内容:

  • 在Codex中直接运行和测试游戏
  • 使用Codex提供的工具设计建筑,这一功能非常强大
  • 可以请求Codex进行迭代,游戏会即时更新而无需刷新页面
  • 可以直接指出用户界面中的元素进行修改
  • 可以截取屏幕截图以便进一步分析和改进

所有这些操作都在Codex内部完成,极大地提高了设计迭代的效率。这种方式不仅简化了开发流程,还使得开发者能够更专注于创意和功能实现,而不需要过多关注底层技术细节。

对于希望提高生产力并快速迭代设计的开发者来说,Codex提供了一个极具吸引力的解决方案。

···

构建高效代码执行代理:预备控制工作空间的重要性
📅 2026/04/19 01:54:48

在构建能够执行代码的代理时,确保一个受控的工作空间在任务开始前就绪至关重要。这种准备工作不仅能够提高系统的稳定性和安全性,还能显著提升代理的工作效率。

@modal在其分享中强调了规模对于使用Agents SDK构建的长时间运行代理的影响。随着应用规模的扩大,代理需要处理的任务量和复杂度也随之增加,因此,一个预先准备好的、经过优化的工作环境显得尤为重要。

关键点包括:

  • **安全隔离**:通过创建独立的工作空间,可以有效防止不同任务之间的相互干扰。
  • **资源管理**:合理分配计算资源,避免因资源争抢导致的性能瓶颈。
  • **数据保护**:在受控环境中,数据的安全性得到更好的保障,减少信息泄露的风险。

这些措施共同作用,使得代码执行代理能够在大规模应用场景下保持高效且可靠地运行。

如您有更好的建议欢迎您留言