今天的AI行业冰火两重天:一边是OpenAI因隐私问题被推上被告席,另一边是Anthropic与盖茨基金会携手投入2亿美元推动全球健康与教育。与此同时,xAI推出Grok Build编程智能体,Kimi发布网页桥接扩展,AI编程工具竞争进入白热化阶段。
🏛️ OpenAI遭集体诉讼,被指通过追踪代码向Meta泄露用户查询隐私
来源:X (@AYi_AInotes)
南加州联邦法院已受理针对OpenAI的集体诉讼。指控称,OpenAI在ChatGPT网站中嵌入了Facebook Pixel等追踪代码,当用户提交查询时,查询主题会作为浏览器标题与含Facebook唯一ID的cookies一并实时发送给Meta。OpenAI虽称仅分享"有限标识符"用于广告投放,但原告认为查询主题本身就是高度敏感的个人信息。此案揭示了免费AI服务的潜在代价——用户每一次查询及数字身份,可能正在成为被交易的产品。
🔗 查看原文[1]
🌍 Anthropic与盖茨基金会达成2亿美元合作,聚焦全球健康与教育
来源:Anthropic官网
Anthropic与盖茨基金会建立为期四年、总额2亿美元的合作关系。合作重点包括:改善中低收入国家约46亿人口的基本医疗,利用AI加速疫苗与疗法研发;为美国、撒哈拉以南非洲和印度的K-12学生开发AI教学工具;提升小农户生产力及美国职业技能认证。合作将通过资金、Claude使用额度及技术支持三种形式推进,首批成果预计今年晚些时候发布。
🔗 查看原文[2]
⚡ AI热潮引发民怨:七成美国民众反对家门口建数据中心
来源:IT之家
盖洛普调查显示,高达70%的美国民众反对在住宅附近建设数据中心,反对率较去年大幅上升,抵触情绪甚至超过对核电站的接受度。全美已有69个辖区出台暂停令,多地项目因抗议和监管纠纷延期。数据中心建设推高批发电价,引发空气污染、水资源消耗等担忧,尽管白宫要求AI企业承担配套成本,但仅为无约束力承诺,未来审批将更加严苛。
🔗 查看原文[3]
技巧与观点
💰 腾讯开源Agent Memory:Token消耗最高降低61%
来源:IT之家
腾讯云开源了TencentDB Agent Memory,旨在解决Agent长任务中上下文窗口易满、Token成本高的问题。该方案采用"上下文卸载"与"Mermaid任务画布"两项核心技术,将完整信息卸载至外部存储,同时用结构化任务图保留关键状态与执行路径。实验显示,在多任务连续会话中最高可降低61%的Token消耗,并提升任务成功率。项目已适配OpenClaw等主流框架,支持一键集成与本地SQLite存储。
🔗 查看原文[4]
🚀 创始人手册:构建AI原生初创公司
来源:Claude Blog
Anthropic发布了一份面向AI原生初创企业的实用指南,重塑了2026年创业生命周期的四个核心阶段:构思、MVP、发布和规模化。该手册为每个阶段提供了具体目标、退出标准、常见失败模式及AI驱动练习,涵盖如何利用Claude进行问题验证与客户发现、避免AI生成代码的技术债务、区分真实产品市场契合度与早期炒作,并整合了多家初创企业的实践案例。
🔗 查看原文[5]
🛠️ 在大型代码库中高效运用Claude Code:最佳实践与入门指南
来源:Claude Blog
Claude Code已成功部署于数百万行的单体仓库、遗留系统及分布式架构中。其核心在于围绕模型构建的"工具套件",包含五个关键扩展点:CLAUDE.md文件、钩子、技能、插件以及MCP服务器。它采用智能体搜索模式,直接在本地实时代码库上操作,无需构建和维护集中式索引,从而避免了传统RAG系统在活跃大型代码库中索引过时的问题。
🔗 查看原文[6]
⚡ UnslothAI发布Qwen3.6 MTP GGUF模型,推理速度大幅提升
来源:X (@berryxia)
UnslothAI创始人Daniel Han发布了实验性的Qwen3.6 MTP GGUF模型。其中27B模型在单GPU上达到每秒140个token,35B-A3B版本高达每秒220个token,相比原版GGUF速度提升超过1.4倍且精度无损。关键优化在于将draft tokens设置为2,这是性能与接受率的最佳平衡点。这项MTP投机解码技术极大提升了消费级显卡运行大模型的效率。
🔗 查看原文[7]
🔧 开源项目OpenSquilla:智能路由与本地检索,大幅降低LLM使用成本
来源:X (@vista8)
OpenSquilla针对大语言模型Token消耗过高的问题,提出了智能模型路由与本地向量检索相结合的解决方案。系统能自动判断任务复杂度,将简单问题路由至廉价模型,复杂任务分配给更强模型,路由决策在本地完成不消耗Token。通过增量发送与缓存命中机制,实际传输Token减少了90%以上,同时具备成本统计、安全沙箱等功能。
🔗 查看原文[8]
产品发布/更新
🪝 Codex推出自动化钩子与程序化令牌
来源:X (@OpenAIDevs)
Codex迎来重大更新:新增"钩子"功能,允许在任务关键节点运行脚本,用于工作验证、密钥扫描、对话记录或按仓库定制行为。同时面向商业和企业团队推出"程序化访问令牌",提供范围化凭证,可从ChatGPT工作区设置创建,用于CI/CD、发布流程和内部自动化,支持设置过期或撤销,并将使用情况关联回工作区。
🔗 查看原文[9]
🌉 Kimi推出网页桥接扩展,支持多平台交互
来源:X (@Kimi_Moonshot)
Kimi发布了浏览器扩展"网页桥接"(Web Bridge),让智能体可以像人类一样与网站互动:搜索、滚动、点击、输入并完成任务。该扩展支持Kimi Code CLI、Claude Code、Cursor、Codex、Hermes等多个平台,现已在kimi.com和Chrome应用商店上线,标志着AI智能体与浏览器交互能力的重要突破。
🔗 查看原文[10]
🔨 xAI推出Grok Build早期测试版
来源:xAI官网
xAI面向SuperGrok Heavy订阅用户推出Grok Build早期测试版。这是一个直接在终端运行的新型编程智能体与命令行工具,专为专业软件工程设计。核心功能包括:支持"计划模式"让用户审阅修改步骤后再执行;可将大型任务分解交由并行子智能体处理;提供无头模式便于自动化集成。用户可通过单行命令安装使用。
🔗 查看原文[11]
📱 随时随地使用Codex:移动端支持上线
来源:OpenAI官网
用户现可通过ChatGPT移动应用随时随地使用Codex。该功能支持跨设备和远程环境实时监控、引导及批准编码任务,实现了对编程工作的无缝移动端管理。无论在通勤途中还是外出会议,都能随时掌控代码生成与执行进度。
🔗 查看原文[12]
🎁 OpenCode与Qwen 3.6 Plus再度免费开放
来源:X (@opencode)
OpenCode x Qwen 3.6 Plus第二轮免费开放启动。上轮用户消耗了全部容量,此次团队找到了更多GPU资源重新开放。对于想体验Qwen 3.6 Plus编程能力的开发者来说,这是一个不错的免费窗口。
🔗 查看原文[13]
模型发布/更新
🔬 SenseNova U1技术报告发布,基于MoE架构开放模型权重
来源:X (@SenseTime_AI)
商汤联合创始人兼首席科学家李沐博士领导的团队发布了SenseNova U1技术报告,详细阐述了其架构、训练方案与创新突破。此次开源同步发布了基于混合专家模型(MoE)的新权重,旨在推动AI领域的透明度、可复现性与进一步创新。
🔗 查看原文[14]
📊 Granite Embedding Multilingual R2:开源多语言嵌入模型
来源:Hugging Face Blog
IBM Granite团队发布了Granite Embedding Multilingual R2多语言文本嵌入模型。该模型采用Apache 2.0开源协议,上下文长度扩展至32K令牌,参数量低于1亿。在MTEB基准的检索评估中取得了同规模模型的最佳性能,尤其擅长多语言混合检索,为开发者提供了高效、轻量且可商用的嵌入解决方案。
🔗 查看原文[15]
🏆 Kimi K2.6登顶金融智能体基准榜首
来源:X (@Kimi_Moonshot)
Kimi K2.6现已成为Finance Agent Benchmark V2开源权重排名第一。在金融分析智能体能力评估中,K2.6展现出了强大的工具调用和复杂推理能力,进一步证明了国产大模型在垂直领域Agent任务上的竞争力。
🔗 查看原文[16]
🔢 inclusionAI发布Ring-2.6-1T模型
来源:Hugging Face
蚂蚁集团inclusionAI发布了Ring-2.6-1T模型。该模型在Claw-Eval基准测试中取得优异成绩:通用能力评估得分58.4,多轮对话评估得分86.8。作为蚂蚁在通用大模型领域的最新成果,展现了持续的技术积累。
🔗 查看原文[17]
引用链接
[1] 查看原文: https://x.com/AYi_AInotes/status/2054856518185439662
[2] 查看原文: https://www.anthropic.com/news/gates-foundation-partnership
[3] 查看原文: https://www.ithome.com/0/950/598.htm
[4] 查看原文: https://www.ithome.com/0/950/415.htm
[5] 查看原文: https://claude.com/blog/the-founders-playbook
[6] 查看原文: https://claude.com/blog/how-claude-code-works-in-large-codebases-best-practices-and-where-to-start
[7] 查看原文: https://x.com/berryxia/status/2054749585520890314
[8] 查看原文: https://x.com/vista8/status/2054757474100760626
[9] 查看原文: https://x.com/OpenAIDevs/status/2055032115964870838
[10] 查看原文: https://x.com/Kimi_Moonshot/status/2054918374837322140
[11] 查看原文: https://x.ai/news/grok-build-cli
[12] 查看原文: https://openai.com/index/work-with-codex-from-anywhere
[13] 查看原文: https://x.com/opencode/status/2055068702538612784
[14] 查看原文: https://x.com/SenseTime_AI/status/2054876860711149780
[15] 查看原文: https://huggingface.co/blog/ibm-granite/granite-embedding-multilingual-r2
[16] 查看原文: https://x.com/Kimi_Moonshot/status/2054803169994272819
[17] 查看原文: https://huggingface.co/inclusionAI/Ring-2.6-1T
夜雨聆风