去年的诉求是如何提升学习效率,于是圈内好友推荐NotebookLM。当时观看了一下实时操作:时长1小时的视频输入进去后,约3分钟内生成了一个15页的PPT,当然还有音频和视频。但当时那一刻,让我意识到“力量感”的是,它这“瞬间浏览”、“瞬间提炼”、然后“瞬间输入”的能力,还是很惊艳。
对比过往10多年里写过的无数PPT,那曾经四处搜索材料、精心挑选图标,以及斟酌过的文案,突然觉得这些过往的操作能力,是会被接下来进化过的AI碾压。虽然我不完全认同AI会替代人的工作,但被会使用AI的人替代是有可能的。
回到NotebookLM,它是什么?
它是Google的一款基于AI的学习辅助工具,关键流程是阅读资料、提炼内容、输出重点。它与普通 AI 聊天工具的区别在于:它的输出完全基于你提供的资料(Sources),而不是它本身的知识库。
输入能力涵盖:处理文档、音频文件、视频内容、PDF等。这一套流程能将原本预估需要 几小时的分析和排版工作,缩短至 15 分钟以内。
输出能力包括:从复杂的文档、音频、视频、到稍微简洁的PPT、思维导图等形式,我个人最喜欢的还是音频和PPT,尤其10分钟左右的双人音频,类播客对话,其次需要复查内容的时候就会看详细的文档。
我最喜欢的使用场景:
第一个场景:分析视频内容
使用频次最高的是分析视频内容,把看到不错的视频且时长2小时往后的,我基本上都会发给NotebookLM去分析提炼一下,然后根据提炼的内容再决定我要重点看哪些部分。当然,整体经验来看,音频的准确度最高,文档和其他材料的弱一些,所以不能全信,关键内容还需要溯源看原材料。
第二个场景:拆解书籍
官方说NotebookLM支持约 50 万字的来源,这意味着一次可以处理相当于4-5本中等长度书的信息量,我曾经尝试丢过一本890页的经济学书籍进去,15分钟左右输出结果。当然有些PDF版的文档,来不及阅读的,也会同样操作。我平时的使用习惯是一般睡前把材料丢进去,第二天早上再来看输出结果。
第三个场景:总结Gemini的对话内容
这几天发现,Gemini接入了NotebookLM,于是就把对话内容按类型归档,丢给NotebookLM总结这一段时间内的对话内容。从输出结果看,还是蛮提升效率的,因为有些前几天的对话内容可能已经忘记了。也是因为Gemini这个接入了这个功能,让我有了记录的想法。
我标题之所以说它小众,是因为我们平时接触到动辄数亿用户的平台来说,MAU 2000 万至 3000 万的确不算多,官方没找到准确数据,以下我AI问到的数据情况:
●用户规模估算: 预计其全球月访问量已突破 2,000 万至 3,000 万人次。虽然这与 ChatGPT 的数亿用户无法相比,但在垂直生产力工具(Vertical Productivity Tools)领域,这已经是顶尖水平。
● 第一次大增长: 2024 年底推出 Audio Overviews(音频深度对话)功能后,NotebookLM 的访问量经历了指数级增长。
● 高黏性用户: 用户群体高度集中在 Higher Education(高等教育)、Research(研究) 以及 Content Creation(内容创作) 领域。
另外,从最新消息来看,Google已开放NotebookLM给大学生及以上的学生作为学习工具:“Google has opened up NotebookLM inside Google Classroom to higher education students, allowing those aged 18 and older to create their own AI-powered notebooks for the first time. ” 那么基于嵌入Gemini和面向大学生群体开放这些推广手段,用户规模应该会有个快速增长。
关于团队信息,AI整理的消息:
这个团队的特色在于:它不是单纯由“程序员”组成的,而是由产品经理、作家、设计师和AI 研究员构成。
产品主管:Raiza Martin
愿景: 她一直强调 NotebookLM 不仅仅是一个 AI 聊天机器人,而是一个“思维伙伴(Thinking Partner)”。
策略: 她主导了“源扎根(Source Grounding)”的开发逻辑,坚持 AI 的回答必须有据可查,这与当时主流大模型的“自由发挥”风格截然不同。
编辑总监:Steven Johnson
他不是程序员,而是一位著名的科普作家和科技思想家(代表作《好主意从哪里来》)。
贡献: 他将人类写作、调研和联想的心理过程引入了产品设计。著名的 Audio Overview(音频综述) 功能,很大程度上源于他对于如何将枯燥资料转化为“迷人叙事”的理解。他认为 AI 应该帮助人类连接碎片化的灵感,而不是替代人类思考。
技术支撑:Google Labs & Gemini Team
技术底层:调用了 Gemini 1.5 Pro 的超长上下文处理能力。
长文本技术: 实验室团队与 Gemini 模型团队紧密合作,使得 NotebookLM 能够一次性处理多达 50 万甚至上百万字的参考资料,这在 2024-2025 年的技术竞赛中处于领先地位。
夜雨聆风