旅行 / 信息压缩 / Agent 工作流
一次逃离: AI 之快与生活之慢
Volodymyr · 2026-05-14
这是一场伟大的逃离。这是一场思想的盛宴。
01 说走就走,是一次伟大的逃离
5 月 12 日晚上,听说刘波第二天要去环球影城玩,已经连续无休工作半个多月的我,忽然也萌生了一个很清晰的念头:走,立刻走。
To be frank,这是一次伟大的逃离,也是一场伟大的胜利。
在出发之前,我的 mind 基本处在一种 constantly active 的状态里。每天输入和输出的信息量都很大,和不同 agent 的对话可能超过 60 次,输入文字动辄 3000 到 5000 字。以前我会觉得 multi-tasking 在任务切换时有明显的大脑阻力,但最近好像线路跑多了,反而被打通了,一切丝滑得有点不可思议。
这当然很 amazing。效率很高,生活也显得极其充实。但这种状态同样极其费脑。昨天从大同回来后,我又赶工 6 线并行连续工作 4 小时,明显感觉到大脑宕机、处理器过热,加载不了一点新信息,只能被迫休息。
所以这次逃离的意义,不只是去了哪里、看了什么,而是它在一个 perfect timing 把我带回了更能思考的状态里。多年以后,我或许不会准确记得应县木塔的每一层纹理,但我应该忘不了从应县回到大同的路上,轿车奔驰时强劲的风扑打在侧脸上的那种心境。
02 AI 之快,与生活之慢
在应县时,我第一次摘下了习惯性用来隔离自我的耳机。不是因为虔诚,而是我选择去聆听这份喧嚣。
走出木塔时,我看到路边有个摆摊的姑娘。她五官很标志,穿着朴素,很安静地坐着。大概是被太阳晒得有些烦躁,但她身上又有一种平和感,仿佛并不关心外面的世界正在发生怎样翻天覆地的变化。
那一刻我忽然觉得,社会的惯性其实很大。也许 AI 带来的结构性冲击,没有我在办公室里想象得那么迅猛。也许等 AI 的风波真正影响到这座偏僻的小县城,还需要很久很久。
当 Agent 席卷社会方方面面时,这里的人依然保持着朴素的生活。司机师傅依旧不依赖导航就能认清各条路,依旧每天守在净土寺旁;出租车司机依旧等待每一班抵达应县西站的高铁,吆喝着游客上车去木塔;那个姑娘也许明天依旧会出来摆摊,不太费力地招揽顾客,一切随缘。
这一刻,AI 之快与生活之慢被放在同一块阳光下。这样的感受,是我坐在西楼办公室里不会有的。
左右滑动浏览大同旅途切片

01 / 10

02 / 10

03 / 10

04 / 10

05 / 10

06 / 10

07 / 10

08 / 10

09 / 10

10 / 10
03 最近,我用另一种方式“读”完了很多书
最近我体验了一种新的阅读方式:通过高度压缩的讲解视频,了解一本名著的背景、故事、主旨和人物命运。短短几天里,我像是“读”完了很多本之前屯着没时间看的书。
这当然不是传统意义上的阅读。但很奇妙的是,当我听 up 主口播一本名著时,我一样会被吸引、被感动、被启发。我“读”到了狄更斯笔下或许最伟大也最悲情的人物卡顿;“读”到了拉斯洛笔下的荒诞与真实;会为刘慈欣笔下那位耗尽心血让孩子们背下牛顿三定律、以此挽救人类文明的乡村教师而感动和惋惜;也会为马尔克斯笔下长达半个世纪的爱情发出一声惊叹。
《红与黑》《罪与罚》《包法利夫人》《尼尔斯骑鹅历险记》……这些名字从书架上的“待读”状态,被压缩成一段段可以进入我脑海的故事。

Book Feast
04 信息压缩:有损,但不一定无用
这种体验引发了我对信息与压缩的思考。
前段时间我读到一篇数学方向的论文,具体细节已经不太记得了,但大致印象是:形式化的数学命题空间非常庞大,而人类近几百年的主要数学工作,其实就是在这个巨大的命题空间里不断做“压缩”和“整理”。最后形成的数学系统,像是落在一个低维的形式化流形上。
这和近两年 LLM、CV 领域反复讨论的“高维空间”和“低维流形”有相通之处。世界的信息很庞杂,人类理解世界的方式,常常不是把所有细节都保留下来,而是不断寻找结构、提取主干、压缩成能够被心智处理的形态。
当然,信息压缩显然是有损的。短短的视频讲不清作者的文风、叙事节奏、细节控制,也不是所有书都适合这么快节奏地读。但对于一个每日精力有限、时间有限、任务繁重的人来说,这不失为一种选择。
更好的做法也许是:先通过压缩内容建立地图,再在真正感兴趣的片段上下载原书精读。Anyway,这只是我选择的一种方式。
05 从阅读,到 Agent 辅助学习
最近我还在做一件很有意思的事:用 Agent 帮我解析目标学习资料,根据我的 personalized 要求规划学习路线,每天整理出今日学习内容,再用对话的方式把知识传递给我。
这和自己从头翻几本书相比,更高效,也更有目的性。比如我想学泛函分析里的半群理论,是为了后续看随机过程和随机分析;我并不想把大量时间花在一些暂时无关的 PDE 用途、拓扑用途上。但问题在于,当我还不具备这个领域的宏观理解时,我并不知道眼前这一章会对后续学习产生多大影响。
所以,如果有一个至少具备宏观理解的 Agent 先行介入学习过程,它就可以帮我把路线从“从第一页开始啃”改造成“围绕目标建立必要知识结构”。再比如 Quantum Computing,如果最终目的不是成为量子力学专家,而是理解并应用不同的 QC 算法,那学习路径就应该围绕算法理解和领域迁移来组织。
这也是我最近越来越想强调的 CCSS mindset:Critical, Creative, Systematic, Strategic。最后一个 S 也可以理解为 Solution-oriented。新时代要求我们不只是努力学习,更要学会设计自己的学习系统。
06 最近一周,我捣鼓成了什么
简单记录一下最近一周折腾过的 ai-related 玩意。它们看起来零散,但其实都指向同一个方向:让个人工作流变得可交互、可迁移、可自我演化。
01 Daily Arxiv 文献推送
尝试了 zotero-arxiv-daily 的每日 arxiv 文献推送。本来想重新构建一个能周转于 arxiv、Zotero 和飞书推送之间的 workflow,并完成其中的交互层,后来失败了。失败本身也有价值,它让我更清楚哪些环节不能只靠热情硬接。
02 Self-Evolving 个人知识库
在第一次失败后,我转向新的方案,搭建了基于 Obsidian、Zotero、Claude Code、Openclaw、Hermes Agent 和 LLM Wiki 的多维 Self-Evolving 个人知识库。它可以智能管理、多维交互,我认为非常强大。
03 微信端的生活助理
并行地,我养了一只“小龙虾”,并接入微信。她能每天中午根据我的 personalized 兴趣抓取时政、金融、AI 科技圈新闻,生成每日简报;也能在微信端管理同步知识库,例如回答完金融问题后,自动整理成知识卡片存进 Obsidian。每周日,她还会检查我本周对知识库的更新,给出 review feedback。
04 StudyAgent 与移动办公
重新启动 Hermes Agent 后,我添加了若干 tools 和 skills 外挂,并建立了 StudyAgent 的 profile。起初我想做一个网页交互式对话学习平台,后来发现 PDF 解析和数学公式展示会让平台复杂化,暂时搁置。但用 Codex 直接辅助学习 QC 的测试效果不错。之后 Sherlock 自然成了科研助手,Openclaw 管生活,Sherlock 管工作。这周也切切实实实现了飞书交互式移动办公,我非常惊讶,这种 work mode 放在一两年前几乎像科幻电影。
05 全自动科研的试验
近期尝试了多个基于 Feynman 的全自动科研。至少代码层面我一点没看,但效果一般。可能是 deepseek-v4-pro 的基座模型限制了上限,导致 Feynman 发挥不出全部性能。作为 deep research 工具它还不错,但 scheming 和 coding 能力还没到让我惊艳的程度。更理想的组合也许是:让 Feynman 做测试,让 GPT-5.5 做大脑。
06 粒子模拟听歌环境
还搭了一个粒子模拟的网页听歌环境,第一次知道听歌软件背后常用的 .lyc 歌词格式。后来想做黑洞模拟器,但一个 HTML 页面很难渲染出《星际穿越》里那种黑洞效果,最后只能先用视频材料模拟。
07 新范式里的自己
回头看,这里其实能看到技术力发展带来的范式革新。
最近我越来越觉得自己像老板,管着好几个博士生 Agent:我要点评他们的工作,指导他们的方向,规划他们的任务。但与此同时,我又像一个受老板点评、指导、规划的本科生。偶尔也觉得自己是在赛博养猫,每天固定投喂十元多的 API 额度。
anyway,新范式、新方法、新技术、新思想,总归是好事。我们需要积极地拥抱变化,适应变化,也要记得偶尔从高速运转里走出来,看看慢下来的生活究竟长什么样。
夜雨聆风