从硅谷一线的“三个月太久”“许愿式工作”,到“Tokens are not equal”、“to human还是to agent”的新判断标准,再到留给CEO们的组织拷问、源码的投资思考,韩光试图回答的不是“AI会不会来”,而是它已经来了——时代的大船三年前就已经启航,创业者是站在旧大陆上看着它走掉,还是跳上去。
主要观点:
信scaling law的人和不信的人,过去几年的行动完全不同,收益也完全不同。
Frontier lab 的 CEO 们不是在吹牛,他们是在描述一个fact。
工业革命商品化了机械能;这一次,我们有可能工业化了智力本身。
我们要为智能搭建一个新世界。
Tokens are not equal——有像钻石一样值钱的token,也有像水一样不值钱的token。
过去我们用to C、to B划分公司;现在边界正在模糊—— 你是一家 to human 还是 to agent的公司?
Dario说会出现powerful AI,在大多数相关领域都比诺贝尔奖得主更聪明,一到两年内、极大概率未来几年内会出现,会有“a country of geniuses in a data center”;到今年年底,全世界一半的人都会谈论AI;他们推荐读《原子弹秘史》,因为这事跟原子弹一样重要。Sam Altman说,距离真正超级智能的早期形态可能只有几年之遥,他的定义是:能做一家大公司的CEO,或者做出比最顶尖科学家更出色的研究。Demis是三个人里最保守的,今年一月他说有50%的概率AGI会在十年内实现,而他的标准高得多:给AI一个1911年以前的所有知识,看它能不能独立做出广义相对论。哪怕只有50%的概率,也足够可怕而令人兴奋。我们是不是已经看到了AI scientist的微光?前几天,OpenAI一个没有经过专门训练的通用reasoning模型,独立做出了1946年提出的单位距离猜想的一个证明,经过四位数学家审定。这个证明不算超级难,是个构造类的证明,但它让我们看到了AI scientist出现的微光——他们描述的那个世界,是有可能的。
一是“三个月太久了”。我问一线researcher今年年底会发生什么,他反问:到年底还有九个月,这么长时间会发生太多事,我怎么知道?在前沿实验室里,他们已经不讨论四个月以后的事,因为时间被压缩了。我们今天讨论事情用的时间跨度,可能都需要被重新质疑。二是“许愿”。我问另一位研究员,你们离AI最近,你平时怎么指挥AI干活?他说我哪是指挥它啊,我是跟它学啊——我每天上班就许三个愿望,“AI啊,今天帮我实现这三个愿望吧”,然后今天它就帮我实现了。许愿,这是我最近最喜欢的一个词了。三是“两小时后拿结果”。一个researcher说他老板布置工作的用词变了:this is very promising, I want to see results in two hours——不是等你做完,也不是明天。我们组织的血液流通速度、迭代速度的基准线,到底在哪里?那怎么做AI时代的超级个体?我们给自己提了几个关键词:第一是dive in,这个时候别站在岸边看,要跳下去。第二是unlearn,忘掉以前的判断标准、判断的metrics、熟悉的工具和程序,从事实出发、从逻辑出发。第三是be open,在这个时代里我们全是初学者,没有人天生懂得更多,态度会决定行动。第四是enjoy,这是一个物质丰饶、充满新玩意儿的时代,整个世界就像一个pupils' playground,我们应该享受它。
所以我也常问自己:is AI always on?我们都是管理者,天天在管理,但今天你亲自玩电脑了吗?遇到问题,你的第一反应是找AI,还是找人?是找熟悉的工具,还是看看新工具能不能解决?这里也有负面作用:沉迷coding、沉迷工具之后,重要的事反而解决不了,把自己弄得很累——你是不是陷入了负向循环?
我们要做好准备,迎来和agent共存的新世界。agent能完成的任务长度,每四个月翻一倍。两年前chatbot和tab补全的时候,人和agent的比例是1:1;现在有的人一个人带着10个agent上班;再过一段时间,也许这10个里有一个能被提升成“CEO”,替你管团队,你就拥有了一家agent的公司,一个人带50个 agent;最后,我们甚至一个agent都不用管,他们自动运行,会有一个"黑灯工厂"——一个data center里的workforce,你不用管它们,他们交给你一个结果就行。1937年科斯写《企业的性质》,那在这个时代,会不会出现某种“agent时代企业的性质”?我有点期待那个时刻。所以请在座的 CEO 们想几个问题:如果三年后你每个员工都带着5到10个agent,你的组织架构还成立吗?你公司里哪些岗位,本质上只是搬运信息、推进流程?你下一个senior想招谁?如果 junior 的活都被智能做了,你的 senior又怎么培养?你最核心的十条workflow里,哪一条已经能让AI跑个七七八八,它的bottleneck又在哪里?以及,如果执行的门槛极大降低了,你的护城河是什么?
同时我们觉得,这是两种不同的革命。在座的人包括我自己这代人,其实都没真正见过生产力革命,我们见过的都是通信革命。通信革命加速信息的流通和分发效率;而智能生产力革命,产生了新的智力商品,把“智力”从珍贵、稀少、手工的状态,变成了工业化的。这里要戴上不同的眼镜去看。通信时代,我们贩卖的是注意力——我是亿万富翁,他是普通白领,我们的注意力大体等价,“Attention is more or less equal”,我们卖广告、卖抽成,希望用户在平台里多留一会儿、别去干别的。但今天,“Tokens are not equal”:有高价值的、像钻石一样值钱的token,也有commoditize、像水一样不值钱的token;有高毛利的,有黏性强的,也有用完就走的。所以判断标准很可能也要变:通信时代我们看DAU、看时长、看cohort retention,现在要看token的量,将来会不会要看token的“价值密度”,或者我们现在还想象不到的指标?我觉得一定会。过去我们习惯用to C、to B划分公司,现在这个边界正在模糊,都是人在用,哪些用量算 2B,哪些算 2C?相对应的,大家已经在说,“我是一家to human的公司,还是一家to agent的公司”。还有一个我们也没有答案的难题:模型公司这么强,应用公司怎么办?几点可以思考。
第二,好产品会说话,老生常谈,但依然成立:就像我两岁多的女儿都知道把四个手指伸进马克杯的杯柄、用大拇指扶住,一个好产品不需要解释;你把杯柄转个90度,用户立刻知道这是个坏产品。相似的产品很多,用户会知道哪个好。第三,last mile is important,模型公司会吃掉一些vertical,但不会吃掉所有,在几十万亿的市场里,总有一些vertical能做到intelligence works、workflow acts——二次创业时,是不是要go deep before you go wide。第四,护城河怎么建立这个问题特别难答,因为发展太快了, all the parts are moving,但从用户角度而不是技术角度去想可能更重要:怎么嵌入用户的业务流,domain knowledge怎么获得,另外软性的能力,组织的学习速度,等等,可能比以前更重要。第五,be imaginative。十九世纪末刚有电的时候,我们只能想到电灯泡(1879年)和电话(1876年),谁能想到接下来一百年是一个充满各种电器的世界?今天,我们也能想到chatbot、coding agent,谁能保证五十年后不是一个充斥着各种智能应用的时代?这是一个冒险家的时代,一个天才产品经理的时代。我们投什么?智力本身就是这一轮最大的赢家之一,在美国格局已经开始清晰;硬件,因为指数级投入和线性增长之间的矛盾,可能是近期最重要的主题;后面会有为智力建设的基础设施,为智能搭建新世界的基建;最后是应用——这会慢慢跑出来,不是几年的事,是一件十年二十年的事,我们会持续寻找那些用好智能、把高价值智力解决方案提供给用户的天才产品经理。