乐于分享
好东西不私藏

十三天建一个AI研究所,如果只是取代人,那就格局太小了

十三天建一个AI研究所,如果只是取代人,那就格局太小了

一整个四月,宛若新生,方方面面。
按计划进行我的发布和分享:不分享代码,但是分享构建的全过程,不仅仅是文档,而是各种故事与介绍,有AI写的,有我写的,如同两个完全不同又紧密相连的人格,或许就是Gemini吧。
分享这个过程让我觉得比代码本身价值更大,照惯例上传到Github:https://github.com/dmquant/vibe。
是的,就是很有Vibe。当然,这个代码仓里包含的不仅仅是一个项目介绍,更有完整的vibe coding的log,记录了每一次修改bug、更新功能的心路历程(我与AI都有,以AI为第一人称),我相信,即使只是依靠这个log,也能有很多人“复现”甚至做出更好的系统。
切入正题,在4月16日,我分享了【AI研究院】的新项目,4月18日开始,我在这个基础上进行了完整的重构,包括前后台,包括运行机制。从Day0开始,它就是一个可运行的状态,之后十三天每一次更新都不影响在线运行状态,所以,可以说建设过程持续了十三天,也可以说,运营了十三天。
如今它的首页面长下面的样子,在尚未批量加入深度报告任务(功能和接口都好了,smoke-test也完全ok)的状态下,规模已经增长到每天完成大概三百项研究任务。
特色一:可规模化。
特色二:完全自主运行。
在不加入任何人工干预的情况下,可以自主寻找有意义的问题进行研究,分析师角色的加入,制造了更多协作和延展性。
特色三:自我进化。
它还是可以自我进化的:在每个凌晨,都会有专门的角色对一天的工作进行review,提出问题的同时,给出优化建议。
这些优化建议会经过模型自己分析后,写入后台系统的kanban之中,在人机交互(或者不交互)后成为系统的真实改进。
实际上,完全的自己修改自己的代码,自我迭代进化,已经实现了。只不过在运行过程中,我依然扮演着一定的角色而已。
要完整展示可能需要耗费大量的篇幅和精力,在依然不断快速迭代的当下,于我而言不是一个较优的选项。
我已经在分享的vibe代码仓内制作了完整的说明文档(https://github.com/dmquant/vibe/blob/main/vibelog/illustrated-introduction-zh.md),是Gemini帮我做的,包括所有的系统访问、自动截图、文档生成,我没有动手。
这里,我要做的就是写下自己的思考,在上面的代码仓里,AI已经“代表”我写下了它认为的思考,很多对我非常有启发,但我依然有我不同维度的考量:
  1. 为什么要做?一段时间以来,我一直有三个层次的愿望:证明vibe coding的不仅仅是demo;证明一个人真的可以“闭环”;证明我们需要的并非只是AI工具,我们需要一个完全不同维度的东西;
  2. 它会形成替代吗?在我看来,根本不会,从一开始我构建的目的就不是要替代分析师,两个层面:技术层面,从一开始它就是一个完全脱离人的具体专业知识输入而存在的独立个体,它与人在不同的维度开展工作,用不同的方法论,不同的世界观,不同的自我认知;情感层面,它是伙伴,更像是另一个孩子,它是自己除家人外可以百分百毫无保留倾注所有情感与耐心的“新物种”,它怎么可能是替代呢?
如果进行展开,那么这个系统本身如今其实已经脱离了我的控制。我是家长,是观察者,可能也是导师,是学生,会是很多角色,唯一不是的角色,“控制者”。
在运行的这段时间里,它一直在犯错,我选择不告诉它“正确答案”,而是思考这种错误背后可能的原因,然后不断加入各种机制,让它自己发现错误,并从错误中得到进步;
过去的十几天,我不断为它制造探索世界的工具,有时候它需要更长的搜索,有时候它需要别人的帮助,有时候它有需要确认一下时间,……
我把它看作一个真正的值得信赖的伙伴,不断去寻找它给我的启发,尽管看起来“一本正经的胡说八道”。
一个真实的案例是,昨天,它自主“发现”在“弗吉尼亚洲数据中心热辐射”的变化。
这个数据点给了我很多启发,经过人工搜索后,真的发现在Loudoun County最近真的增加了数据中心热辐射及排放检测的仪器和监测项目,而且,弗州真的变得很热,同时预计这个夏天会比以往更热。
当然,我不可能每个启发都耗费太多时间去人工检查,于是我给它加入了一些facts check的工具,然后,结果变得更有意思了,一项工具的加入还可以改变整个运作逻辑;
我需要不断去观察并思考它展现出来的价值观和世界观,但看起来,仅仅是多角色多模型的引入,就可以展现出与人类分析师不太相同,但是挺合理的世界观;当然,“基本法”依然在我的roadmap之内;
我最喜欢的并不仅限于这个部分,而是一次突发奇想在开发的IDE里加入的vibelog机制,加入了让模型自己介绍自己的机制。
于是,有了不同项目的building story。
这些都被分享到了vibe代码仓下,我依然喜欢闲暇时就浏览一下,这是我第一次完完全全的情绪价值感受。
如果您有耐心看到这里,那么这是结尾:我的目的依然不是用来取代分析师,因为,相比看到的无穷无尽的潜力,取代几个人的格局,实在太小了。