最新AI工具更新合集:ChatGPT会定位、Claude继续狂飙、Google在追赶

一句话总结
这期视频主要介绍了ChatGPT、Google Gemini和Claude等主流AI工具本周的重要更新,重点聚焦于它们向“AI超级应用”发展的趋势,并分享了几个实用的新功能和技巧。
核心论点展开
一、OpenAI:迈向AI超级应用
•核心目标:OpenAI正在努力将ChatGPT从一个聊天机器人,扩展成一个统一的“AI超级应用”,目标是覆盖所有功能。
•融资背景:为了这个目标,他们以惊人的八千五百二十亿美元估值,筹集了一千二百二十亿美元,这很可能是风投史上最大的一笔融资。
•收入结构:ChatGPT大部分收入(约三分之二)来自用户订阅,而像Claude这样的公司,收入则主要来自API调用。
二、ChatGPT的新功能详解
•位置共享:现在可以和ChatGPT分享你的实时位置了。开启后,你可以直接问“附近有什么好的咖啡馆?”,它会结合地图、图片和链接给出推荐,体验比单纯用地图App更直观。
•大文本处理优化:当你粘贴超过五千个字符的文本时,它会自动转为附件形式,而不是直接塞进对话。
– 关键区别:附件内容不会全部占用宝贵的“上下文窗口”(可以理解为AI的短期记忆),AI会对附件内容进行摘要处理。如果你需要AI记住每一个细节,最好点击“显示文本字段”按钮,把文本直接放入输入框。
– 背后的原因:公司不希望用户过度消耗上下文窗口,因为这会增加他们的运营成本。
•连接器整合:之前分散的Google Drive、Docs、Sheets等连接器,现在被统一整合到了一个“Google Drive”连接器下,用起来更简洁了。
•其他更新:
– 移动端:界面进行了重新设计,有了全屏菜单,可以通过滑动操作,使用GPT、生成图片或运行应用更方便。
– CarPlay支持:现在可以在支持CarPlay的车里,通过语音模式使用ChatGPT了。
– 购物体验:聊天内的商品浏览界面经过了彻底革新,现在可以直接查看来自不同供应商的最新产品,界面很棒。
三、Google Gemini的强劲追赶
•新模型发布:推出了Gemini 3.1 Flash Live模型,主打极速响应和语音对话。
•体验升级:它的语音对话模式反应非常敏捷,接近ChatGPT-4的水平,并且支持分享屏幕、摄像头画面,拥有更大的上下文窗口(能记住更多内容)。
•开源模型:谷歌发布了新的开源模型系列GMA 4,可以在设备上离线运行。其中310亿参数的版本,性能据说接近当前苹果设备上的黄金标准——DeepSeek 3。
•音乐AI整合:谷歌自家的音乐生成AI“LIA”更新了,能生成长达三分钟的高质量曲目。更重要的是,这项功能被整合进了Gemini,你直接说“创建一条音乐轨道”,它就能调用LIA帮你生成,再次体现了“超级应用”的整合思路。
四、Claude的探索与不足
•“使用电脑”功能:Claude新增了操作电脑屏幕的能力,比如点击按钮、处理表格。但这项功能目前还不太可靠,不能完全依赖,有时需要让它自己检查操作,但这个检查过程也可能出错。
•新模型传闻:有传闻称Claude正在开发下一代旗舰模型(代号可能是Mythos),可能会在不久后发布。
•移动端工具不稳定:视频测试了Claude的手机端网页抓取工具,发现它们像其他AI工具一样,表现很不稳定,时好时坏,因此不推荐依赖。
五、其他重要趋势:AI“委员会”
•微软Copilot的“委员会”功能:这个功能会同时咨询多个AI模型,然后综合出最佳答案。它采用双AI协作:一个负责深度分析,另一个负责验证和梳理结果,形成多次反馈循环,让答案更可靠。
•未来趋势:这种让多个AI协作评估的模式,很可能成为未来AI超级应用的一个标准功能。
关键数据与案例
•OpenAI以八千五百二十亿美元估值,融资一千二百二十亿美元。
•ChatGPT约三分之二的收入来自用户订阅。
•处理文本时,超过五千字符会自动转为附件。
•Google的LIA音乐AI现在可以生成长达三分钟的曲目。
•Claude的“使用电脑”等工具功能,成功率不稳定,无法可靠依赖。
提到的工具/产品/技术
•聊天机器人/大模型:ChatGPT、Claude (3.5 Sonnet, 3 Opus)、Google Gemini (3.1 Flash Live)、传闻中的Claude新模型(Mythos)
•开源模型:Google GMA 4系列、DeepSeek 3
•音乐生成AI:Sunno、Google LIA
•图像生成AI:Midjourney
•其他工具/概念:CarPlay、AI“委员会”(微软Copilot、Perplexity)、上下文窗口(Context Window)、API、连接器(Google Drive, Box, Notion等)
金句
•“这一切,都源于他们要打造一个统一的AI超级应用这个使命。”
•“附件不会直接添加到上下文窗口里……用附件,你有时可能会丢失某些细节。”
•“这再次体现了AI的便利性,一切都往超级应用整合,这是大趋势。”
•“这就形成了一个多次循环的反馈机制。这个功能挺酷的,我估计以后所有AI超级应用里,都会有类似的东西。”
•“我特别反感那种说法,说什么‘天啊,你太落伍了,居然不用这个那个’。不,那种论调只是为了卖课或者博眼球。”
对 Vibe Coder 的价值
1.技术视野拓展:清晰梳理了主流AI平台的最新战略(超级应用化)和核心功能更新,帮助保持技术前沿敏感度。
2.实用技巧获取:深入解释了ChatGPT处理大文本的附件与直接粘贴的区别,这是一个非常实用且容易被忽略的效率技巧,能更好地管理对话上下文,优化使用成本(对OpenAI而言)或效果(对用户而言)。
3.工具选型参考:提供了Gemini、Claude新功能的客观体验评价(如Claude工具的不稳定性),以及开源模型(GMA 4)的性能对比,为技术选型提供了即时参考。
4.趋势预判:指出了“多模型协作评估”(委员会模式)可能成为未来AI应用的标配,这为思考AI应用架构提供了方向。
5.破除焦虑:视频结尾的观点非常中肯——即使是最前沿的用户,大部分时间使用AI的方式也和普通人用ChatGPT聊天类似。这有助于排除噪音,聚焦于用AI真正提升核心工作效率。
建议
1.立即尝试:打开你的ChatGPT,在设置中开启“位置”功能,体验一下基于位置的便捷查询。同时,下次粘贴长文本时,有意识地使用“显示文本字段”按钮,对比一下附件的效果。
2.保持关注:重点关注Google Gemini,尤其是其语音交互和与LIA等工具的深度整合,这代表了更自然的交互和更强的功能融合,是“超级应用”的典型体现。
3.谨慎尝鲜:对于Claude的“使用电脑”等自动化工具,以及各类AI连接器/抓取工具,保持警惕。可以小范围测试,但短期内不要将其用于关键或重复性高的生产流程,它们的可靠性仍需时间验证。
4.探索本地模型:如果你有高性能的Mac设备(如M系列芯片),可以开始关注如Google GMA 4这类能在本地离线运行的高性能开源模型,这对于数据隐私和特定场景下的快速响应有独特价值。
5.聚焦核心需求:不必追逐每一个新发布。理解“AI超级应用”的整合趋势即可。将大部分精力放在用好1-2个核心工具(如ChatGPT/Gemini)来优化你的主要工作流,这比不停切换工具更能产生实际价值。
🎧 扫码收听音频版
扫描下方二维码,收听完整音频 & 查看原文

觉得有用?点个 在看 和 关注 支持一下
夜雨聆风