乐于分享
好东西不私藏

最新AI工具更新合集:ChatGPT会定位、Claude继续狂飙、Google在追赶

最新AI工具更新合集:ChatGPT会定位、Claude继续狂飙、Google在追赶

一句话总结

这期视频主要介绍了ChatGPT、Google Gemini和Claude等主流AI工具本周的重要更新,重点聚焦于它们向“AI超级应用”发展的趋势,并分享了几个实用的新功能和技巧。

核心论点展开

一、OpenAI:迈向AI超级应用

核心目标:OpenAI正在努力将ChatGPT从一个聊天机器人,扩展成一个统一的“AI超级应用”,目标是覆盖所有功能。

融资背景:为了这个目标,他们以惊人的八千五百二十亿美元估值,筹集了一千二百二十亿美元,这很可能是风投史上最大的一笔融资。

收入结构:ChatGPT大部分收入(约三分之二)来自用户订阅,而像Claude这样的公司,收入则主要来自API调用。

二、ChatGPT的新功能详解

位置共享:现在可以和ChatGPT分享你的实时位置了。开启后,你可以直接问“附近有什么好的咖啡馆?”,它会结合地图、图片和链接给出推荐,体验比单纯用地图App更直观。

大文本处理优化:当你粘贴超过五千个字符的文本时,它会自动转为附件形式,而不是直接塞进对话。

  – 关键区别:附件内容不会全部占用宝贵的“上下文窗口”(可以理解为AI的短期记忆),AI会对附件内容进行摘要处理。如果你需要AI记住每一个细节,最好点击“显示文本字段”按钮,把文本直接放入输入框。

  – 背后的原因:公司不希望用户过度消耗上下文窗口,因为这会增加他们的运营成本。

连接器整合:之前分散的Google Drive、Docs、Sheets等连接器,现在被统一整合到了一个“Google Drive”连接器下,用起来更简洁了。

其他更新

  – 移动端:界面进行了重新设计,有了全屏菜单,可以通过滑动操作,使用GPT、生成图片或运行应用更方便。

  – CarPlay支持:现在可以在支持CarPlay的车里,通过语音模式使用ChatGPT了。

  – 购物体验:聊天内的商品浏览界面经过了彻底革新,现在可以直接查看来自不同供应商的最新产品,界面很棒。

三、Google Gemini的强劲追赶

新模型发布:推出了Gemini 3.1 Flash Live模型,主打极速响应和语音对话。

体验升级:它的语音对话模式反应非常敏捷,接近ChatGPT-4的水平,并且支持分享屏幕、摄像头画面,拥有更大的上下文窗口(能记住更多内容)。

开源模型:谷歌发布了新的开源模型系列GMA 4,可以在设备上离线运行。其中310亿参数的版本,性能据说接近当前苹果设备上的黄金标准——DeepSeek 3。

音乐AI整合:谷歌自家的音乐生成AI“LIA”更新了,能生成长达三分钟的高质量曲目。更重要的是,这项功能被整合进了Gemini,你直接说“创建一条音乐轨道”,它就能调用LIA帮你生成,再次体现了“超级应用”的整合思路。

四、Claude的探索与不足

“使用电脑”功能:Claude新增了操作电脑屏幕的能力,比如点击按钮、处理表格。但这项功能目前还不太可靠,不能完全依赖,有时需要让它自己检查操作,但这个检查过程也可能出错。

新模型传闻:有传闻称Claude正在开发下一代旗舰模型(代号可能是Mythos),可能会在不久后发布。

移动端工具不稳定:视频测试了Claude的手机端网页抓取工具,发现它们像其他AI工具一样,表现很不稳定,时好时坏,因此不推荐依赖。

五、其他重要趋势:AI“委员会”

微软Copilot的“委员会”功能:这个功能会同时咨询多个AI模型,然后综合出最佳答案。它采用双AI协作:一个负责深度分析,另一个负责验证和梳理结果,形成多次反馈循环,让答案更可靠。

未来趋势:这种让多个AI协作评估的模式,很可能成为未来AI超级应用的一个标准功能。

关键数据与案例

OpenAI以八千五百二十亿美元估值,融资一千二百二十亿美元

ChatGPT约三分之二的收入来自用户订阅。

处理文本时,超过五千字符会自动转为附件。

Google的LIA音乐AI现在可以生成长达三分钟的曲目。

Claude的“使用电脑”等工具功能,成功率不稳定,无法可靠依赖

提到的工具/产品/技术

聊天机器人/大模型:ChatGPT、Claude (3.5 Sonnet, 3 Opus)、Google Gemini (3.1 Flash Live)、传闻中的Claude新模型(Mythos)

开源模型:Google GMA 4系列、DeepSeek 3

音乐生成AI:Sunno、Google LIA

图像生成AI:Midjourney

其他工具/概念:CarPlay、AI“委员会”(微软Copilot、Perplexity)、上下文窗口(Context Window)、API、连接器(Google Drive, Box, Notion等)

金句

“这一切,都源于他们要打造一个统一的AI超级应用这个使命。”

“附件不会直接添加到上下文窗口里……用附件,你有时可能会丢失某些细节。”

“这再次体现了AI的便利性,一切都往超级应用整合,这是大趋势。”

“这就形成了一个多次循环的反馈机制。这个功能挺酷的,我估计以后所有AI超级应用里,都会有类似的东西。”

“我特别反感那种说法,说什么‘天啊,你太落伍了,居然不用这个那个’。不,那种论调只是为了卖课或者博眼球。”

对 Vibe Coder 的价值

1.技术视野拓展:清晰梳理了主流AI平台的最新战略(超级应用化)和核心功能更新,帮助保持技术前沿敏感度。

2.实用技巧获取:深入解释了ChatGPT处理大文本的附件与直接粘贴的区别,这是一个非常实用且容易被忽略的效率技巧,能更好地管理对话上下文,优化使用成本(对OpenAI而言)或效果(对用户而言)。

3.工具选型参考:提供了Gemini、Claude新功能的客观体验评价(如Claude工具的不稳定性),以及开源模型(GMA 4)的性能对比,为技术选型提供了即时参考。

4.趋势预判:指出了“多模型协作评估”(委员会模式)可能成为未来AI应用的标配,这为思考AI应用架构提供了方向。

5.破除焦虑:视频结尾的观点非常中肯——即使是最前沿的用户,大部分时间使用AI的方式也和普通人用ChatGPT聊天类似。这有助于排除噪音,聚焦于用AI真正提升核心工作效率。

建议

1.立即尝试:打开你的ChatGPT,在设置中开启“位置”功能,体验一下基于位置的便捷查询。同时,下次粘贴长文本时,有意识地使用“显示文本字段”按钮,对比一下附件的效果。

2.保持关注:重点关注Google Gemini,尤其是其语音交互和与LIA等工具的深度整合,这代表了更自然的交互和更强的功能融合,是“超级应用”的典型体现。

3.谨慎尝鲜:对于Claude的“使用电脑”等自动化工具,以及各类AI连接器/抓取工具,保持警惕。可以小范围测试,但短期内不要将其用于关键或重复性高的生产流程,它们的可靠性仍需时间验证。

4.探索本地模型:如果你有高性能的Mac设备(如M系列芯片),可以开始关注如Google GMA 4这类能在本地离线运行的高性能开源模型,这对于数据隐私和特定场景下的快速响应有独特价值。

5.聚焦核心需求:不必追逐每一个新发布。理解“AI超级应用”的整合趋势即可。将大部分精力放在用好1-2个核心工具(如ChatGPT/Gemini)来优化你的主要工作流,这比不停切换工具更能产生实际价值。

🎧 扫码收听音频版

扫描下方二维码,收听完整音频 & 查看原文

觉得有用?点个 在看 和 关注 支持一下