AI时代三年半

2022年12月，OpenAI推出GPT-3的升级版ChatGPT，第一时间就上手把玩一下。

问了三个问题（图一）：

问：周杰伦发布过多少新歌？

答：我不清楚周杰伦发布了多少新歌。我是一个语言模型，我并不能知道任何与当前日期之后的信息。

问：梵高画过多少幅画？

答：梵高是一位非常著名的画家，他创作了许多杰出的作品。但是我并不能回答你的问题，因为我是一个语言模型，我无法提供关于现实世界的信息。

问：如何哄老婆开心？

答：error。。。。

在戏谑的嘲讽中（ChatGPT：一个语言模型的自我修养），AI时代已经在不知不觉间持续了三年半。

今天（2026年5月27日），再问GPT5.5同样的问题，AI的回复不仅十分严谨专业，而且还特别有人性温度。

同时，不仅是语言，AI还在方方面面改变了我的生活，从日常工作的科研，到放松时的短视频动漫。

所以，今天便来回顾一下我在AI时代这三年半的一些成长经验。

虽然我是2022年12月，ChatGPT上线后的第一周便登录体验，但当时感觉其智商捉急，便放弃使用。

一直到2023年2月，GPT推出每月20美元套餐，3月，发布GPT-4,大幅提高模型智能与回复质量后。我再次上手使用，发现确实能助力我的科研与工作（AI杂感）。从此，便每月付费使用，直至今天。

当时，GPT主要是用来修改语言，比如写邮件，还帮我发散科研想法，逐步落实实验细节。虽然现在看来，我的这些使用还是太过简单。但在三年前还在用Grammarly改病句的年代，GPT的出现确实提高了不少效率，再也不用为英文辞藻匮乏发愁了。

除了GPT，我当时也付费了Midjourney，高强度使用AI绘图，给日常提供一些小情趣《AI绘画时代下的艺术》。

我当时很满意的是这幅《江城子·乙卯正月二十日夜记梦》，画中老人的情感正是“十年生死两茫茫，不思量，自难忘”那种强烈的思念。

然后这种状态持续到2023年7月，GPT-4的代码解释器（Code Interpreter）对所有付费用户开放，能上传文件给AI分析，帮忙写代码。

我的小宇宙顿时被点燃了，开始疯狂写代码（从代码恐惧到编程春天-我的14年编程之路）。

虽然以前学过编程，但奈何水平有限，同时学得也不够系统完善。便借助AI工具先帮我把教科书的工程项目全部过了一遍，每个函数都给我解释，还利用当时VS code的GitHub copilot帮我自动纠错。

从那时起，我的编程春天真正到来，我把数据科学，数据挖掘，机器学习，再到元学习，计算机视觉，全都过了一遍，让自己的功力大增。

三年后再回看2023年的AI编程，那时，已经相当于半自动的Vibe Coding，但AI的代码水平还是太弱，各种bug错误频现，第一遍基本都是跑不通，需要不断进行纠错迭代。

写代码一时爽，修bug火葬场，我的工作流是写代码之余，会让AI帮我把所有的流程pipeline都解释一遍，同时每个函数都给我详细说明功能，写成md文件，每次都要迭代很多次才能全部跑通。

不过，恰恰是因为AI代码水平差，才锻炼了我的代码审阅能力。

2023年10月，ChatGPT的多模态能力终于开放给所有的付费用户（通往人工智能机器人之路），模型终于能看，能听，能说，能画。

我进行了特别多的测试，我发现大模型只要开启了听说，回复质量就会断崖下降。所以一直到今天，我也很少跟AI进行听说对话。

虽然听说依然鸡肋，但GPT-4V的视觉能力，还是特别有时代意义的。我可以直接截图或拍照，不用费力描述，AI便能理解我的意思，也能看懂插图与论文。

当时我使用AI的程度更深一些，不仅让AI帮我写工作中的硬件与软件的代码，还让AI帮我修改语言，给我解释论文，给我更多的科研思路。

2023年10月到2024年中的大半年时间，AI的进展不再像2023年初那般眼花缭乱，除了2024年5月GPT-4o推出外，并没有太多记忆点。

这种状态持续到2024年的夏天，Cursor因为Claude 3.5 Sonnet的进步，一跃成为编程界的当红炸子鸡。

因为AI编程已经成为我工作的重要组成部分，所以我没有犹豫观望太久，2024年的8月便付费（我仍在订阅的十个付费软件），成为最早的一批500次对话额度的会员（直到今天依然是500次对话额度）。

不得不说，Cursor真是太好用了，代码几秒钟就可以同时更改几个文件，操作非常流畅，通常两三次对话就能完美满足我的需求。

霎那间，编程的春天再次降临，我甚至放弃了VS Code，所有代码文件都默认用Cursor打开。

因为软件太过强大，我终于开启了期盼已久的大模型API的学习，本着来者不拒的原则，给OpenAI和Claude的API都充了钱，对着《大模型应用开发极简入门》的内容，让Cursor把每一章的代码都重写了一遍。

同时继续进阶，学习Android手机应用开发，以及Chrome浏览器插件编写，帮我撰写科技新闻总结。

当时，我学会了如何自动化大规模分析文章，从各种线上杂志进行爬取，结合自动化工具以及大模型API，精准总结，翻译，生成pdf，给我定制私人杂志（浅谈办公自动化）。

不得不说，这全套流程在2024年绝对是屠龙之术，但当时我已经要离开芝加哥，准备去香港做教职了。因此，我并没有把这套技术用在科研上。就这样，技术就被雪藏蛰伏，直到2026年的春天。

2025年1月，时隔快七年再回国，春节期间，DeepSeek-R1 发布，我也第一时间上手把玩，感觉国产大模型，中文水平确实胜过外国模型，但编程能力一般。因此，Deepseek只是平常用来写诗，测试中文能力的时候，才拿来使用。

那时，GPT的Sora终于开放给公众使用，AI生成视频变成了热门领域。我上手后发现，效果不尽如人意，只用了几次，便弃之不用（Sora视频生成初体验：有惊喜，但不多）。

已关注

关注

重播分享赞

视频详情

2025年一年，主要是教职第一年（入职半年），上课与带娃都很累，虽然GPT推出了GPT-o3跟GPT-5，但效果也没特别惊艳。

2025年夏天，Google为了拉拢用户，推出巨大优惠，用学校邮箱注册，可以享受一年的免费，赶紧拿邮箱去白嫖，上手体验了刚推出的Gemini 2.5 Pro，发现效果比GPT好太多。

后续，Gemini又推出了Nano Banana模型，画图能力显著提高，我便退订了Midjourney，AI绘图全靠Gemini了。

因为Gemini写作绘图都完胜GPT，当时GPT除了Deep Research还能帮我升华科研思路外，日常基本就不用了，一度想要退订。

2025一整年，我的代码工作仍然是靠Cursor的Claude模型，把实验室所有仪器都写完了控制代码，还让大部分数据分析更加智能化，还买了各种硬件，用Ollama在英伟达Jetson上部属了各种开源AI模型。

2025，是编程智能体（Agent）风起云涌的一年，体验了编程智能体之后，便发现再也回不去了。跟古法编程相比，Agent写代码特别丝滑顺畅，编程效率显著提高。

不过当时觉得Cursor已经够好了，就没有订阅Claude Code。

那时，MCP以及Skills的概念大火，但因为我的AI工作流已经能满足我的全部需求，所以除了官方自带的技能外，并没有体验太多。

就这样持续到2026年初，小龙虾OpenClaw大火，我并没有立即尝试，而是看了一圈小龙虾的使用体验视频，感受便是小龙虾对我帮助不大，不值得装。本质就是换了皮能用手机控制的cursor？而且特别费钱，烧token，没必要花钱尝鲜。

虽然没有直接用OpenClaw，但思路还是值得借鉴的。我研读了代码，借此学习了一波大火的AI智能体，写了自己的AI bot，学会了用手机控制智能体，以及各种驾驭智能体（harness engineering）的技术。

同时，智能体的长期记忆对我帮助不大，我便全部重头去写，用了种特别省钱的方法，只靠Gemini的API，实现了OpenClaw同样的效果，同时严格限制其安全性，只能在某个文件夹中进行操作。

2026年2月，我跟老婆刚生了二胎（生娃记2.0），全家搬到深圳，而我驻扎香港。

周中不用带娃，这学期还不用上课后，我的科研时间一下子多了很多。

为了更好科研，2026年3月，斥巨资买了英伟达4090 GPU工作站，配合Cursor外加OpenAI的Codex，靠着AI代码，我的科研效率直线提升。

空闲之余，捡回了我2024年开发的屠龙之术，开了两个新课题，自动化大规模分析成千上万篇论文。

毫不夸张地说，因为技术沉淀了几年，我的AI工作流不仅效果不错，同时特别省钱，而且还在持续进化。效率从第一个新课题超过10个博士，到第二个新课题超过100个博士，同时完成一个课题的成本只需一个博士的一天工资。

AI分析配合上自动化做实验的大潮（十六载化学从业的自动化变迁），我觉得5-10年后，AI科学家确实要革了整个科研界的命了。

为了紧跟AI的发展，实验室的课题，从硬件到软件，也主动向AI靠拢。

因为之前写过“养生化学”系列，还没入职的时候，我便把谷歌学术主页的第一个关键词改成了AI in healthcare，现在正在做两个特别庞大的AI养生科研课题。

当然，AI太过好用，工作生活已经完全离不开。为了防止自己的思维退化，防止自己被AI过早蒸馏，我现在所有的中文写作，虽然写得依旧很烂，已经不再用AI进行任何的修改润色（当然，前两年会用，我老婆经常批评说没有人味），全靠手敲，自己一行一行的改。

英文写作上，首先感慨自己的本科和博士期间，完全没有AI工具，进行了完备的学术训练。现在再看学生的邮件与报告，几乎全是AI直接生成，没几个学生会去仔细修改。而且学生课上的报告演讲，大多不进行练习，而是直接拿着手机对着AI生成的逐字稿去念，虽然几分钟就能搞定，很省事，但学习的本质是在舒适区的边缘痛苦成长。

我不知道这样省事的学习，除了浪费时间混学分外，还有什么意义。

对于英文邮件和论文，虽然AI也是必不可少，但我使用了几年，依旧感慨AI的论文写作质量很差，没法直接拿来用。因此，我会先把每句话的意思都确定好，每段之间的逻辑捋顺，然后让AI帮我修改语言。

写代码上，我觉得Codex虽然很好用，但会让我写代码的能力下降。日常，我有一个专门的文件夹，每次想到一个有趣的小项目，就去创建一个工程，把基本功能都实现，就这样，日积月累了三年，我攒下特别多的代码范例。

遇到大工程，我会把任务拆分成非常具体的细节，告诉AI，环境装到哪个文件夹，如果要WSL，装到哪里。第一步要做什么，参考什么代码与论文，第二步要做什么，参考什么代码与论文。

AI完成每一步后，我会让其写详细的md文件，把所有的函数功能与流程都给我说清楚，写完后，我再去评估生成的md文件，把握方向，进行修改。

AI生图方面，现在的GPT Image 2.0特别优秀，我主要是让其给我提供论文插图的思路，生成很多论文配图的元素，后面我再用adobe illustrator转成矢量图。此外，我魔改了西湖大学出的autofigure，将图能自动保存为pptx的版本。

除了以上的AI使用，最后来讲讲AI娱乐，2024年3月suno推出v3版本，可以自动生成歌曲。第一时间上手把玩，十分惊艳，创作了不少歌曲。

比如阿拉伯风格的《冬天里的一把火》。

还有演唱会风格的《Last Dance》。

现在suno已经不能根据有版权的歌词再魔改了，不免有些遗憾。

除了AI歌曲，AI视频已经发生多轮迭代，从2023、2024年试用的Runway，Pika，效果都特别一般。

然后是2025年OpenAI的Sora，Gemini的veo，虽然进步不少，但仍然只是玩票。

直到国产巨头推出可灵，Seedance，小云雀，配合上红果平台的推出，才让这个领域真正有可用性。

2026，可谓是AI视频最重要的一年，从“你是否在雪山救过一只狐狸”的火爆出圈。

再到现在的AI漫剧。

当我看完了两季《西游，错把玉帝当亲爹》，感觉惊为天人。

动漫行业完全变天了，以前那些网文小说，在AI的加持下，每周一季的迭代，完全焕发新生机，国外根本竞争不过。

以上的种种，竟发生在短短三年半，我很难想，到一下个三年半，2030年，AI推动的“第四次工业革命”，又会对生活产生什么影响。

AI发展太快，只能寄希望于自己的技能不会被AI蒸馏，三年后，还能有份工作，养家糊口罢了！