最新AI工具更新合集:ChatGPT会定位、Claude继续狂飙、Google在追赶-夜雨聆风

最新AI工具更新合集:ChatGPT会定位、Claude继续狂飙、Google在追赶

一句话总结

这期视频主要介绍了ChatGPT、Google Gemini和Claude等主流AI工具本周的重要更新，重点聚焦于它们向“AI超级应用”发展的趋势，并分享了几个实用的新功能和技巧。

核心论点展开

一、OpenAI：迈向AI超级应用

•核心目标：OpenAI正在努力将ChatGPT从一个聊天机器人，扩展成一个统一的“AI超级应用”，目标是覆盖所有功能。

•融资背景：为了这个目标，他们以惊人的八千五百二十亿美元估值，筹集了一千二百二十亿美元，这很可能是风投史上最大的一笔融资。

•收入结构：ChatGPT大部分收入（约三分之二）来自用户订阅，而像Claude这样的公司，收入则主要来自API调用。

二、ChatGPT的新功能详解

•位置共享：现在可以和ChatGPT分享你的实时位置了。开启后，你可以直接问“附近有什么好的咖啡馆？”，它会结合地图、图片和链接给出推荐，体验比单纯用地图App更直观。

•大文本处理优化：当你粘贴超过五千个字符的文本时，它会自动转为附件形式，而不是直接塞进对话。

– 关键区别：附件内容不会全部占用宝贵的“上下文窗口”（可以理解为AI的短期记忆），AI会对附件内容进行摘要处理。如果你需要AI记住每一个细节，最好点击“显示文本字段”按钮，把文本直接放入输入框。

– 背后的原因：公司不希望用户过度消耗上下文窗口，因为这会增加他们的运营成本。

•连接器整合：之前分散的Google Drive、Docs、Sheets等连接器，现在被统一整合到了一个“Google Drive”连接器下，用起来更简洁了。

•其他更新：

– 移动端：界面进行了重新设计，有了全屏菜单，可以通过滑动操作，使用GPT、生成图片或运行应用更方便。

– CarPlay支持：现在可以在支持CarPlay的车里，通过语音模式使用ChatGPT了。

– 购物体验：聊天内的商品浏览界面经过了彻底革新，现在可以直接查看来自不同供应商的最新产品，界面很棒。

三、Google Gemini的强劲追赶

•新模型发布：推出了Gemini 3.1 Flash Live模型，主打极速响应和语音对话。

•体验升级：它的语音对话模式反应非常敏捷，接近ChatGPT-4的水平，并且支持分享屏幕、摄像头画面，拥有更大的上下文窗口（能记住更多内容）。

•开源模型：谷歌发布了新的开源模型系列GMA 4，可以在设备上离线运行。其中310亿参数的版本，性能据说接近当前苹果设备上的黄金标准——DeepSeek 3。

•音乐AI整合：谷歌自家的音乐生成AI“LIA”更新了，能生成长达三分钟的高质量曲目。更重要的是，这项功能被整合进了Gemini，你直接说“创建一条音乐轨道”，它就能调用LIA帮你生成，再次体现了“超级应用”的整合思路。

四、Claude的探索与不足

•“使用电脑”功能：Claude新增了操作电脑屏幕的能力，比如点击按钮、处理表格。但这项功能目前还不太可靠，不能完全依赖，有时需要让它自己检查操作，但这个检查过程也可能出错。

•新模型传闻：有传闻称Claude正在开发下一代旗舰模型（代号可能是Mythos），可能会在不久后发布。

•移动端工具不稳定：视频测试了Claude的手机端网页抓取工具，发现它们像其他AI工具一样，表现很不稳定，时好时坏，因此不推荐依赖。

五、其他重要趋势：AI“委员会”

•微软Copilot的“委员会”功能：这个功能会同时咨询多个AI模型，然后综合出最佳答案。它采用双AI协作：一个负责深度分析，另一个负责验证和梳理结果，形成多次反馈循环，让答案更可靠。

•未来趋势：这种让多个AI协作评估的模式，很可能成为未来AI超级应用的一个标准功能。

关键数据与案例

•OpenAI以八千五百二十亿美元估值，融资一千二百二十亿美元。

•ChatGPT约三分之二的收入来自用户订阅。

•处理文本时，超过五千字符会自动转为附件。

•Google的LIA音乐AI现在可以生成长达三分钟的曲目。

•Claude的“使用电脑”等工具功能，成功率不稳定，无法可靠依赖。

提到的工具/产品/技术

•聊天机器人/大模型：ChatGPT、Claude (3.5 Sonnet, 3 Opus)、Google Gemini (3.1 Flash Live)、传闻中的Claude新模型（Mythos）

•开源模型：Google GMA 4系列、DeepSeek 3

•音乐生成AI：Sunno、Google LIA

•图像生成AI：Midjourney

•其他工具/概念：CarPlay、AI“委员会”（微软Copilot、Perplexity）、上下文窗口（Context Window）、API、连接器（Google Drive, Box, Notion等）

金句

•“这一切，都源于他们要打造一个统一的AI超级应用这个使命。”

•“附件不会直接添加到上下文窗口里……用附件，你有时可能会丢失某些细节。”

•“这再次体现了AI的便利性，一切都往超级应用整合，这是大趋势。”

•“这就形成了一个多次循环的反馈机制。这个功能挺酷的，我估计以后所有AI超级应用里，都会有类似的东西。”

•“我特别反感那种说法，说什么‘天啊，你太落伍了，居然不用这个那个’。不，那种论调只是为了卖课或者博眼球。”

对 Vibe Coder 的价值

1.技术视野拓展：清晰梳理了主流AI平台的最新战略（超级应用化）和核心功能更新，帮助保持技术前沿敏感度。

2.实用技巧获取：深入解释了ChatGPT处理大文本的附件与直接粘贴的区别，这是一个非常实用且容易被忽略的效率技巧，能更好地管理对话上下文，优化使用成本（对OpenAI而言）或效果（对用户而言）。

3.工具选型参考：提供了Gemini、Claude新功能的客观体验评价（如Claude工具的不稳定性），以及开源模型（GMA 4）的性能对比，为技术选型提供了即时参考。

4.趋势预判：指出了“多模型协作评估”（委员会模式）可能成为未来AI应用的标配，这为思考AI应用架构提供了方向。

5.破除焦虑：视频结尾的观点非常中肯——即使是最前沿的用户，大部分时间使用AI的方式也和普通人用ChatGPT聊天类似。这有助于排除噪音，聚焦于用AI真正提升核心工作效率。

建议

1.立即尝试：打开你的ChatGPT，在设置中开启“位置”功能，体验一下基于位置的便捷查询。同时，下次粘贴长文本时，有意识地使用“显示文本字段”按钮，对比一下附件的效果。

2.保持关注：重点关注Google Gemini，尤其是其语音交互和与LIA等工具的深度整合，这代表了更自然的交互和更强的功能融合，是“超级应用”的典型体现。

3.谨慎尝鲜：对于Claude的“使用电脑”等自动化工具，以及各类AI连接器/抓取工具，保持警惕。可以小范围测试，但短期内不要将其用于关键或重复性高的生产流程，它们的可靠性仍需时间验证。

4.探索本地模型：如果你有高性能的Mac设备（如M系列芯片），可以开始关注如Google GMA 4这类能在本地离线运行的高性能开源模型，这对于数据隐私和特定场景下的快速响应有独特价值。

5.聚焦核心需求：不必追逐每一个新发布。理解“AI超级应用”的整合趋势即可。将大部分精力放在用好1-2个核心工具（如ChatGPT/Gemini）来优化你的主要工作流，这比不停切换工具更能产生实际价值。

🎧 扫码收听音频版

扫描下方二维码，收听完整音频 & 查看原文

觉得有用？点个在看和关注支持一下