
6月份全球AI领域的新工具、新模型、新产品全部梳理了一遍,发现更新了足足有40款以上。

不是那种"修复了几个bug"的小更新,是实打实的重磅发布。大模型、Agent、视频生成、自研芯片、机器人、国家标准……几乎所有赛道同时开火。
以前总觉得AI行业迭代快,但6月这个密度,已经不是"快"了,是"炸"。
我不想做那种干巴巴的工具列表——你看完也不知道哪个跟自己有关系。所以我按"这件事对你意味着什么"来分类,帮你把这40款产品拆开来看。
DeepSeek V4 Flash:程序员的性价比天花板

先说我最想聊的一个。
DeepSeek在4月底就放出了V4预览版,但6月份才算真正进入实战。V4系列分两个规格:Pro是旗舰版,1.6万亿总参数、49B激活参数;Flash是轻量版,284B总参数、13B激活参数。
为什么要单独把Flash拎出来说?因为它的定位太精准了。
Flash的推理能力接近Pro,简单Agent任务甚至和Pro持平,但API价格只有Pro的三分之一。输入最低0.2元/百万token,是海外模型的百分之一。更关键的是,全系标配1M上下文,一次性处理整部《三体》三部曲不在话下。
实测下来,拿324页的上市公司年报做测试,19秒出核心要点,精确到页码定位数据,连藏在第311页的管理人员酬金排名都能找到。代码调试方面,开启深度思考模式后,能识别出超出预设范围6项错误,比预期更细。
6月27日,DeepSeek还联合北大发布了DSpark推理加速框架,实测V4-Flash单用户生成速度提升60%到85%,系统吞吐量最高提升4倍。这个框架已经全量部署到线上服务了。
不过也有坏消息:V4正式版定档7月中旬,同时引入峰谷定价机制,高峰时段(9:00-12:00、14:00-18:00)API价格翻倍。所以如果你现在是重度用户,趁正式版上线前多用用,不亏。
Gemini 3.5 Flash:速度怪兽,Agent 能力的天花板
Google 在5月的 I/O 大会上放出了 Gemini 3.5 Flash,6月24日又追加了 Computer Use 能力——让 AI 直接操控电脑界面。
先看速度:输出 289 tokens/秒,是 GPT-5.5 和 Claude Opus 4.7 的4倍。首 Token 延迟只有65毫秒,基本是"秒回"的体验。
但快只是表面。真正让我惊讶的是它的 Agent 能力。在 MCP Atlas(评估多步骤 Agent 工作流执行能力)评测中,3.5 Flash 拿到 83.6%,大幅领先 GPT-5.5 的 75.3% 和 Claude Opus 4.7 的 79.1%。一个"轻量版"模型把各家旗舰按在地上摩擦。
1M tokens 上下文窗口、65K 最大输出,API 定价输入 $1.50/百万token,输出 $9.00/百万token——大约是 GPT-5.5 的十五分之一。
6月24日更新的 Computer Use 能力更是一个转折点。以前你要让 AI 操作电脑,需要额外调用一个专门的模型。现在 Gemini 3.5 Flash 一个模型就能搞定文本生成 + 界面操控,开发者可以用单一模型构建完整的 AI Agent。
目前它已经是 Gemini App 和 Google 搜索 AI 模式的默认模型。换句话说,全球数亿用户打开 Gemini 或者用 Google 搜索的 AI 模式,背后跑的就是 3.5 Flash。
Trae:字节跳动把 AI 原生 IDE 做到了 600 万用户

如果你是开发者,或者对编程有一丁点兴趣,Trae 值得认真看看。
这是字节跳动做的 AI 原生 IDE,截至2026年Q2已经有600万注册用户。它不是给 VS Code 加个 AI 插件,而是从底层重新设计的——三大核心模式:IDE 模式(日常编码 + AI 对话补全)、SOLO 模式(你描述需求,AI 从零搭建整个项目)、Builder 模式(快速生成项目框架)。
6月24日更新的重头戏是 Design 模式。设计师画完设计稿,用自然语言就能批量修改,还能直接把设计稿转成代码。配合新增的全局记忆功能——Trae 能记住你所有历史对话的上下文——它开始越来越像一个了解你项目全貌的"AI 同事"。
另一个亮点是语音讨论。你可以直接用语音和 AI 讨论需求、分析 Bug、梳理想法,不用打字。在 SOLO 移动端上线后,你还能在手机上远程操控电脑端的开发任务,实时查看进度。
在中文场景下,Trae 的代码生成准确率高达 98%,远超 Cursor 的 75% 和 Copilot 的 70%。而基础版完全免费,覆盖 90% 的个人开发场景。支持 GPT-4o、豆包、DeepSeek 等多模型切换。
对于国内开发者来说,这可能是目前性价比最高的 AI 编程工具,没有之一。
Cline:VS Code 里最强的自主编码 Agent

和 Trae 不同,Cline 不是一个全新的 IDE,而是一个 VS Code 插件——但它可能是目前最强的 AI 编码 Agent。
500万+安装量,GitHub 5.8万 Star,被 Thoughtworks 评为"目前最强的受监督软件工程 Agent 之一"。
Cline 最独特的设计是 Plan/Act 双模式。Plan 模式下,你描述一个复杂任务(比如"把整个 React 项目从 JavaScript 迁移到 TypeScript"),它会先读取代码库、分析依赖关系、制定详细的执行计划,但不动任何文件。你审完计划、确认没问题后,切换到 Act 模式开始执行——每一步文件修改、每一条命令运行,都会弹出差异对比让你审查。
3月份发布的 Cline Kanban 更狠:在同一个代码仓库里并行运行多个 AI Agent。每个任务卡创建独立的 Git worktree,Agent 各自工作互不干扰。你可以同时调度五个 AI 完成五个不同的功能模块。
它采用 BYOK(自带密钥)模式,插件本身免费,你只需要付 API 费用。支持 20 多种模型提供商,包括 Claude、GPT-5.5、DeepSeek V4、Gemini 3.5 Flash。一个有意思的玩法:用 DeepSeek 做计划,用 Claude 做执行,Plan 和 Act 模式可以分别配置不同模型。
最新 v3.85.0 版本已经适配了 GPT-5.5、DeepSeek V4 和 Gemini 3.5 Flash。还有 CLI 版本,可以在无头环境里跑自动化流程。
Claude Tag + Cowork 移动端:AI 终于从工具变成了同事

Anthropic 在6月干了两件大事,放在一起说。
先说 Claude Tag。6月23日上线 Slack,不是机器人,是"同事"。你 @它就行,它能读当前讨论、拆解任务、调用工具,还能持续跟进任务流。开启 ambient 模式后,它不再被动等点名,而是持续关注群聊,主动标记重要信息,甚至提醒你"这个问题三天没跟进了"。
Karpathy 给了极高的评价,说这是 LLM UI/UX 的第三次重大重新设计——第一次是把 LLM 做成网站,第二次是做成桌面应用,第三次是做成一个独立、持久、异步的实体,拥有组织范围内的工具和上下文。Anthropic 内部透露,65%的产品代码已经由内部版 Tag 生成。
再说 Cowork 移动端。6月27日曝光的截图显示,Anthropic 正在测试手机端的 Claude Cowork。定位很明确:不是把桌面端搬到手机上,而是"远程控制器"。你在手机上发起任务、调整方向、查看进度,重活在你的电脑上跑。配合3月就上线的 Dispatch 功能,你可以用语音或文字从手机直接遥控电脑端的 Claude。
移动端 App 本身也在快速迭代:Projects 终于支持移动端了,新增离线草稿功能,手势操作做了优化(左滑复制回复、右滑新建对话)。语音模式也在升级,新增西班牙语、中文、粤语等多语言支持,还增加了"按下通话"模式。
Cowork 的底层是 Claude Opus 4.8,支持 macOS,Windows 版本已预告但还没来。Pro 订阅 $20/月即可使用,Max 订阅有更高的用量上限。
豆包2.1 Pro + Seedance 2.5 + Seedream 5.0 Pro:字节的全家桶摊牌了

6月23日 FORCE 大会上,字节一口气亮了三张牌。
豆包大模型2.1 Pro,编程能力对标 Claude Opus 4.7,在 SciCode 科学计算评测中 59.8 分超过 Opus 4.7 和 GPT-5.5,在 NL2Repo 仓库级代码生成中 47 分明显领先。Agent 能力方面,MCP Atlas 评测覆盖36个真实 MCP Server、220个工具、1000多个任务,得分也超过 Opus 4.7 和 GPT-5.5。
现场演示了个硬核案例:让它围绕一个芯片设计方案连续运行近18小时,经历9轮迭代,跑通仿真、测试、综合检查的完整工程流程。
价格上,输入6元、输出30元每百万token,综合使用成本比 Claude Opus 系列降低接近80%。同步上线的2.1 Turbo 价格只有 Pro 的一半。
视频方面,Seedance 2.5 把单条视频拉到30秒,是目前全球最长的单段原生视频直出。支持最多50个全模态素材联合输入,还新增了3D白模预演能力。
图像方面,Seedream 5.0 Pro 主推三个能力:交互式精准编辑(画箭头、圈选区域、用自然语言描述就能改图)、多图层分离(递归拆分图层,底板自动填充)、高信息密度排版(单张图能承载整页PPT级别的信息,支持10余种语言)。
说白了,字节这次是把从文字到图片到视频到音频的AI创作链路全部打通了。
Flux Pro 1.1:图像生成的"瑞士军刀"

Black Forest Labs 的 Flux 系列在6月持续发力。这个团队的核心成员是原 Stable Diffusion 项目主创,120亿参数的多模态 Transformer + 扩散模型混合架构。
目前 Flux 家族已经形成了完整的产品矩阵:
FLUX1.1 Pro 是高速文生图的主力,对提示词的遵循度极高,生成速度快,适合批量出图。FLUX.1 Kontext Pro 专攻上下文编辑——你给它一张参考图,它能在保持角色一致性的前提下做各种修改,这在需要系列化角色形象的场景下特别有用。FLUX Pro 1.1 Redux 是图生图变换模型,可以快速做风格迁移、光影调整、细节增强,一张图能衍生出多个变体。
更猛的 FLUX.2 Pro 已经在 Microsoft Foundry 和 Adobe Firefly 上线,支持最多8张参考图做多参考编辑,最大输出 4MP 分辨率。FLUX.2 Flex 更进一步,支持10张参考图,参数控制更灵活。
对国内用户来说,Flux 最大的优势是开源生态。dev 版本可以本地部署,6GB 显存就能跑量化版。schnell 版本基于 Apache 2.0 完全开源可商用。在复杂构图场景下,Flux 的提示词跟随度优于同类型主流模型,文字生成和人体结构渲染也有明显改善。
Sakana Marlin:一个能干8小时的虚拟CSO
Sakana AI 是东京的一家AI独角兽,创始人 Llion Jones 是 Transformer 论文的共同作者。他们6月推出了第一款商业产品 Marlin,定位是"虚拟首席战略官"。
跟所有聊天机器人都不一样:你给它一个研究课题,它不是秒回你一段话,而是自己干8个小时。
这8个小时里,它会自己制定假设、上网找数据、交叉验证来源、映射因果关系,最后给你一份60到100页的战略报告和执行摘要幻灯片。引用60到80个来源,带附录、参考文献,直接可以拿去开战略评审会。
底层用的是自研的 AB-MCTS(自适应分支蒙特卡洛树搜索),能动态决定"该拓宽搜索范围还是深挖现有线索",还能在不同 LLM 之间切换——用轻量模型做构思,用重度推理模型做审计和纠错。
定价是企业级 SaaS,按量付费每次100积分(约61美元),专业版每月约936美元含2000积分。
这不是"AI帮你写个摘要",是"AI帮你想清楚一件事"。
Apple Intelligence + 全新Siri:库克的收官之作

6月9日 WWDC 上,苹果发布了 Siri 15年来最大的一次重构。
新版 Siri AI 有了独立 App,支持长上下文多轮对话、跨 App 复杂任务编排,iCloud 同步对话记录,iPhone/Mac/Watch/Vision Pro 无缝接续。
底层架构是"端侧模型 + Private Cloud Compute + Gemini"三层结构。苹果和谷歌深度合作,引入 Gemini 系列模型的技术。端侧模型约30亿参数,推理延迟控制在200毫秒以内。
另外一个值得关注的事:Anthropic 在 WWDC 上宣布 Claude 支持 Apple 的 Foundation Models 框架。开发者可以用 Swift 三行代码调用 Claude,端侧模型处理简单任务,复杂推理自动交给 Claude。这意味着未来的 iOS App 里,AI 能力可能是"苹果管日常 + Claude 管硬核"的组合。
不过有个遗憾:中国大陆暂时用不上 Siri AI 和 Apple Intelligence 全套功能。
其他值得关注的工具
智谱 GLM-5.2(6月17日):1M 上下文,MIT 协议完全开源,Code Arena 全球可用模型排名第一。发布当天就适配了华为昇腾、寒武纪、昆仑芯等全系国产算力。
百度文心一言5.0(6月6日):1.2万亿参数 MoE 架构,中文基准全面超越 GPT-4,API 定价0.08元/千tokens。
OpenAI Jalapeño 芯片(6月24日):首颗自研推理芯片,3nm 制程,从立项到流片只用了9个月。每 Token 推理成本比现有 NVIDIA GPU 降低约50%。
英伟达 Rubin GPU(6月6日Computex):2nm 工艺,单卡 5 PFLOPS FP8,288GB HBM4 显存。配套 NVLink 7 双向带宽 2.4TB/s。
国内还有15款桌面 Agent 集中上线、小米 MiMo-V2.5-Pro-UltraSpeed(1万亿参数,1000 tokens/秒)、云知声 U2 大模型(2660亿参数 MoE,Agent 原生)等等。
这些工具跟你有什么关系?
如果你是开发者,现在选择前所未有的丰富:追求性价比就 DeepSeek V4 Flash + Cline/Trae 的组合,API 成本几乎可以忽略;追求 Agent 自动化就 Gemini 3.5 Flash,一个模型搞定编码 + 界面操控;追求全流程体验就 Trae,从设计到代码到部署一站式搞定。
如果你做内容创作,字节这次的全家桶值得关注。从 Seedream 5.0 Pro 做封面图,到 Seedance 2.5 转30秒视频,再到音频模型一键生成配音,一条完整的内容生产链路全部在豆包里完成。需要高质量配图的话,Flux 系列的开源生态是你的朋友——本地部署、免费商用、风格可控。
如果你在企业里做协同办公,Claude Tag + Cowork 移动端的组合值得尝试。AI 不再是工具,而是 Slack 里的同事,你在手机上就能遥控它干活。
如果你在企业里做决策或研究,Sakana Marlin 的"8小时深度思考"模式值得了解。它输出的不是 AI 摘要,是带引用、带分析框架的战略报告。
这个月最大的变化,不是哪个模型又刷了新纪录。而是 AI 工具从"能聊天"正式进入了"能干活"的阶段——编程、设计、协同办公、战略研究,每条赛道都有了真正可用的 AI 工具。你不需要等明年,现在就能用起来。
你已经开始用哪个了?

夜雨聆风