2022年12月,OpenAI推出GPT-3的升级版ChatGPT,第一时间就上手把玩一下。
问了三个问题(图一):
问:周杰伦发布过多少新歌?
答:我不清楚周杰伦发布了多少新歌。我是一个语言模型,我并不能知道任何与当前日期之后的信息。
问:梵高画过多少幅画?
答:梵高是一位非常著名的画家,他创作了许多杰出的作品。但是我并不能回答你的问题,因为我是一个语言模型,我无法提供关于现实世界的信息。
问:如何哄老婆开心?
答:error。。。。

在戏谑的嘲讽中(ChatGPT:一个语言模型的自我修养),AI时代已经在不知不觉间持续了三年半。
今天(2026年5月27日),再问GPT5.5同样的问题,AI的回复不仅十分严谨专业,而且还特别有人性温度。




同时,不仅是语言,AI还在方方面面改变了我的生活,从日常工作的科研,到放松时的短视频动漫。
所以,今天便来回顾一下我在AI时代这三年半的一些成长经验。

虽然我是2022年12月,ChatGPT上线后的第一周便登录体验,但当时感觉其智商捉急,便放弃使用。
一直到2023年2月,GPT推出每月20美元套餐,3月,发布GPT-4,大幅提高模型智能与回复质量后。我再次上手使用,发现确实能助力我的科研与工作(AI杂感)。从此,便每月付费使用,直至今天。
当时,GPT主要是用来修改语言,比如写邮件,还帮我发散科研想法,逐步落实实验细节。虽然现在看来,我的这些使用还是太过简单。但在三年前还在用Grammarly改病句的年代,GPT的出现确实提高了不少效率,再也不用为英文辞藻匮乏发愁了。
除了GPT,我当时也付费了Midjourney,高强度使用AI绘图,给日常提供一些小情趣《AI绘画时代下的艺术》。
我当时很满意的是这幅《江城子·乙卯正月二十日夜记梦》,画中老人的情感正是“十年生死两茫茫,不思量,自难忘”那种强烈的思念。

然后这种状态持续到2023年7月,GPT-4的代码解释器(Code Interpreter)对所有付费用户开放,能上传文件给AI分析,帮忙写代码。
我的小宇宙顿时被点燃了,开始疯狂写代码(从代码恐惧到编程春天-我的14年编程之路)。
虽然以前学过编程,但奈何水平有限,同时学得也不够系统完善。便借助AI工具先帮我把教科书的工程项目全部过了一遍,每个函数都给我解释,还利用当时VS code的GitHub copilot帮我自动纠错。
从那时起,我的编程春天真正到来,我把数据科学,数据挖掘,机器学习,再到元学习,计算机视觉,全都过了一遍,让自己的功力大增。
三年后再回看2023年的AI编程,那时,已经相当于半自动的Vibe Coding,但AI的代码水平还是太弱,各种bug错误频现,第一遍基本都是跑不通,需要不断进行纠错迭代。
写代码一时爽,修bug火葬场,我的工作流是写代码之余,会让AI帮我把所有的流程pipeline都解释一遍,同时每个函数都给我详细说明功能,写成md文件,每次都要迭代很多次才能全部跑通。
不过,恰恰是因为AI代码水平差,才锻炼了我的代码审阅能力。
2023年10月,ChatGPT的多模态能力终于开放给所有的付费用户(通往人工智能机器人之路),模型终于能看,能听,能说,能画。
我进行了特别多的测试,我发现大模型只要开启了听说,回复质量就会断崖下降。所以一直到今天,我也很少跟AI进行听说对话。
虽然听说依然鸡肋,但GPT-4V的视觉能力,还是特别有时代意义的。我可以直接截图或拍照,不用费力描述,AI便能理解我的意思,也能看懂插图与论文。

当时我使用AI的程度更深一些,不仅让AI帮我写工作中的硬件与软件的代码,还让AI帮我修改语言,给我解释论文,给我更多的科研思路。
2023年10月到2024年中的大半年时间,AI的进展不再像2023年初那般眼花缭乱,除了2024年5月GPT-4o推出外,并没有太多记忆点。
这种状态持续到2024年的夏天,Cursor因为Claude 3.5 Sonnet的进步,一跃成为编程界的当红炸子鸡。
因为AI编程已经成为我工作的重要组成部分,所以我没有犹豫观望太久,2024年的8月便付费(我仍在订阅的十个付费软件),成为最早的一批500次对话额度的会员(直到今天依然是500次对话额度)。
不得不说,Cursor真是太好用了,代码几秒钟就可以同时更改几个文件,操作非常流畅,通常两三次对话就能完美满足我的需求。
霎那间,编程的春天再次降临,我甚至放弃了VS Code,所有代码文件都默认用Cursor打开。
因为软件太过强大,我终于开启了期盼已久的大模型API的学习,本着来者不拒的原则,给OpenAI和Claude的API都充了钱,对着《大模型应用开发极简入门》的内容,让Cursor把每一章的代码都重写了一遍。
同时继续进阶,学习Android手机应用开发,以及Chrome浏览器插件编写,帮我撰写科技新闻总结。

当时,我学会了如何自动化大规模分析文章,从各种线上杂志进行爬取,结合自动化工具以及大模型API,精准总结,翻译,生成pdf,给我定制私人杂志(浅谈办公自动化)。
不得不说,这全套流程在2024年绝对是屠龙之术,但当时我已经要离开芝加哥,准备去香港做教职了。因此,我并没有把这套技术用在科研上。就这样,技术就被雪藏蛰伏,直到2026年的春天。
2025年1月,时隔快七年再回国,春节期间,DeepSeek-R1 发布,我也第一时间上手把玩,感觉国产大模型,中文水平确实胜过外国模型,但编程能力一般。因此,Deepseek只是平常用来写诗,测试中文能力的时候,才拿来使用。
那时,GPT的Sora终于开放给公众使用,AI生成视频变成了热门领域。我上手后发现,效果不尽如人意,只用了几次,便弃之不用(Sora视频生成初体验:有惊喜,但不多)。
2025年一年,主要是教职第一年(入职半年),上课与带娃都很累,虽然GPT推出了GPT-o3跟GPT-5,但效果也没特别惊艳。
2025年夏天,Google为了拉拢用户,推出巨大优惠,用学校邮箱注册,可以享受一年的免费,赶紧拿邮箱去白嫖,上手体验了刚推出的Gemini 2.5 Pro,发现效果比GPT好太多。
后续,Gemini又推出了Nano Banana模型,画图能力显著提高,我便退订了Midjourney,AI绘图全靠Gemini了。
因为Gemini写作绘图都完胜GPT,当时GPT除了Deep Research还能帮我升华科研思路外,日常基本就不用了,一度想要退订。
2025一整年,我的代码工作仍然是靠Cursor的Claude模型,把实验室所有仪器都写完了控制代码,还让大部分数据分析更加智能化,还买了各种硬件,用Ollama在英伟达Jetson上部属了各种开源AI模型。
2025,是编程智能体(Agent)风起云涌的一年,体验了编程智能体之后,便发现再也回不去了。跟古法编程相比,Agent写代码特别丝滑顺畅,编程效率显著提高。
不过当时觉得Cursor已经够好了,就没有订阅Claude Code。
那时,MCP以及Skills的概念大火,但因为我的AI工作流已经能满足我的全部需求,所以除了官方自带的技能外,并没有体验太多。
就这样持续到2026年初,小龙虾OpenClaw大火,我并没有立即尝试,而是看了一圈小龙虾的使用体验视频,感受便是小龙虾对我帮助不大,不值得装。本质就是换了皮能用手机控制的cursor?而且特别费钱,烧token,没必要花钱尝鲜。
虽然没有直接用OpenClaw,但思路还是值得借鉴的。我研读了代码,借此学习了一波大火的AI智能体,写了自己的AI bot,学会了用手机控制智能体,以及各种驾驭智能体(harness engineering)的技术。
同时,智能体的长期记忆对我帮助不大,我便全部重头去写,用了种特别省钱的方法,只靠Gemini的API,实现了OpenClaw同样的效果,同时严格限制其安全性,只能在某个文件夹中进行操作。
2026年2月,我跟老婆刚生了二胎(生娃记2.0),全家搬到深圳,而我驻扎香港。
周中不用带娃,这学期还不用上课后,我的科研时间一下子多了很多。
为了更好科研,2026年3月,斥巨资买了英伟达4090 GPU工作站,配合Cursor外加OpenAI的Codex,靠着AI代码,我的科研效率直线提升。
空闲之余,捡回了我2024年开发的屠龙之术,开了两个新课题,自动化大规模分析成千上万篇论文。
毫不夸张地说,因为技术沉淀了几年,我的AI工作流不仅效果不错,同时特别省钱,而且还在持续进化。效率从第一个新课题超过10个博士,到第二个新课题超过100个博士,同时完成一个课题的成本只需一个博士的一天工资。
AI分析配合上自动化做实验的大潮(十六载化学从业的自动化变迁),我觉得5-10年后,AI科学家确实要革了整个科研界的命了。
为了紧跟AI的发展,实验室的课题,从硬件到软件,也主动向AI靠拢。
因为之前写过“养生化学”系列,还没入职的时候,我便把谷歌学术主页的第一个关键词改成了AI in healthcare,现在正在做两个特别庞大的AI养生科研课题。
当然,AI太过好用,工作生活已经完全离不开。为了防止自己的思维退化,防止自己被AI过早蒸馏,我现在所有的中文写作,虽然写得依旧很烂,已经不再用AI进行任何的修改润色(当然,前两年会用,我老婆经常批评说没有人味),全靠手敲,自己一行一行的改。
英文写作上,首先感慨自己的本科和博士期间,完全没有AI工具,进行了完备的学术训练。现在再看学生的邮件与报告,几乎全是AI直接生成,没几个学生会去仔细修改。而且学生课上的报告演讲,大多不进行练习,而是直接拿着手机对着AI生成的逐字稿去念,虽然几分钟就能搞定,很省事,但学习的本质是在舒适区的边缘痛苦成长。
我不知道这样省事的学习,除了浪费时间混学分外,还有什么意义。
对于英文邮件和论文,虽然AI也是必不可少,但我使用了几年,依旧感慨AI的论文写作质量很差,没法直接拿来用。因此,我会先把每句话的意思都确定好,每段之间的逻辑捋顺,然后让AI帮我修改语言。
写代码上,我觉得Codex虽然很好用,但会让我写代码的能力下降。日常,我有一个专门的文件夹,每次想到一个有趣的小项目,就去创建一个工程,把基本功能都实现,就这样,日积月累了三年,我攒下特别多的代码范例。
遇到大工程,我会把任务拆分成非常具体的细节,告诉AI,环境装到哪个文件夹,如果要WSL,装到哪里。第一步要做什么,参考什么代码与论文,第二步要做什么,参考什么代码与论文。
AI完成每一步后,我会让其写详细的md文件,把所有的函数功能与流程都给我说清楚,写完后,我再去评估生成的md文件,把握方向,进行修改。
AI生图方面,现在的GPT Image 2.0特别优秀,我主要是让其给我提供论文插图的思路,生成很多论文配图的元素,后面我再用adobe illustrator转成矢量图。此外,我魔改了西湖大学出的autofigure,将图能自动保存为pptx的版本。
除了以上的AI使用,最后来讲讲AI娱乐,2024年3月suno推出v3版本,可以自动生成歌曲。第一时间上手把玩,十分惊艳,创作了不少歌曲。
比如阿拉伯风格的《冬天里的一把火》。
还有演唱会风格的《Last Dance》。
现在suno已经不能根据有版权的歌词再魔改了,不免有些遗憾。
除了AI歌曲,AI视频已经发生多轮迭代,从2023、2024年试用的Runway,Pika,效果都特别一般。
然后是2025年OpenAI的Sora,Gemini的veo,虽然进步不少,但仍然只是玩票。
直到国产巨头推出可灵,Seedance,小云雀,配合上红果平台的推出,才让这个领域真正有可用性。
2026,可谓是AI视频最重要的一年,从“你是否在雪山救过一只狐狸”的火爆出圈。

再到现在的AI漫剧。
当我看完了两季《西游,错把玉帝当亲爹》,感觉惊为天人。

动漫行业完全变天了,以前那些网文小说,在AI的加持下,每周一季的迭代,完全焕发新生机,国外根本竞争不过。
以上的种种,竟发生在短短三年半,我很难想,到一下个三年半,2030年,AI推动的“第四次工业革命”,又会对生活产生什么影响。
AI发展太快,只能寄希望于自己的技能不会被AI蒸馏,三年后,还能有份工作,养家糊口罢了!

夜雨聆风