

4月10日,杭州,有“热浪”。受访者供图
人人都在说AI正改变甚至重塑着各行各业,但AI到底改变了什么?真讨论起来,往往会觉得有些抽象。
4月10日,一席联合阿里通义实验室在杭州举办了一场演讲。这场演讲的主题叫“热浪中的每个‘我’”。五个普通人,分享了他们和AI的故事。
当我们把视角聚焦到一个个具体的人,一个个真实的需求,技术的温度、力量就被真实地感知到了:无论你身处何地,无论你懂不懂技术,无论你年轻还是老去,拥抱浪潮的人,正在定义属于自己的新世界。
话不多说,咱们来听故事吧。
01
第一个故事,来自从新加坡远道而来的Jian Gang Ngui。
市面上有很多先进的大模型,但Jian Gang Ngui一直有个疑问:顶尖大模型,真的足够多语言、多文化吗?
印尼语、马来语、泰语……东南亚地区语言多样性惊人,拥有超过1200多种语言。他们能用大模型吗?当然能。用什么?用英语。

SEA-LION模型开发负责人Jian Gang Ngui。受访者供图
可是,不同语言与文化相连,“调性”不同。比如,菲律宾语对部分词语就会有一些委婉的表达方式,大模型能“听懂”吗?
Jian Gang Ngui认为,这让相当比例的人无法从技术变革中受益。
7亿东南亚人,能不能有懂自己语言的大模型?
基于全球主流大模型架构,Jian Gang Ngui和团队开发了SEA-LION系列,一个专为东南亚设计的大模型家族。
团队邀请母语者参与数据质量评估与文化筛选,还为新加坡外籍劳工部署了母语聊天机器人。
“很多来新加坡的外籍劳工很难了解自己能获得的权益和资源。”Jian Gang Ngui说,测试时,一位劳工说,“SEA-LION说到了我心里。”
那一刻,Jian Gang Ngui也听到了回响。
02
第二个故事,来自AI产品经理、独立开发者戴嘉玮。
作为慢性病患者家属,戴嘉玮辗转过北京、上海多家医院。这十几年下来,手术、治疗、化验、诊断……积累了厚厚一摞的纸质报告、化验单和手术记录。
每踏入一家新医院,戴嘉玮都得深吸一口气,做一下心理建设。
他手上常备一个厚厚的文件夹,加上手机里的照片、截图,只为在有限的时间内,向医生尽可能清楚地介绍家人的患病史、治疗方案的关键转变、近期指标的变化、未来对治疗的期许。

AI产品经理、独立开发者戴嘉玮。受访者供图
能不能有一个软件,可以帮患者自动管理病历,在问诊时清晰地呈现病情?戴嘉玮搜遍应用市场,没有。
若是几年前,这个故事或许无解,但AI的发展改变了一切。
去年,戴嘉玮基于Qwen3-VL的多模态能力,在AI编程工具的辅助下开发了“Aura”智能健康助手。
这是一个能流畅跑在他笔记本电脑上的工具:可以自动识别药物名称,解析复杂的化验单,把零散的、碎片化的信息整理成一份有病程时间线、条理清晰的就诊简报。
这几年,很多人在讨论AI的边界问题,担心AI带来的冲击。但戴嘉玮选择用“释放”两个字来概括技术带来的改变——
AI正以前所未有的方式,释放那些长尾的、个性化的需求。
传统的软件开发设计聚焦“共性需求”,寻找不同领域的普适性,把很多需求抽象、归纳出来,产品是标准化的,交由用户去学习、适应。——这是一个以“软件为中心”的世界,力求实现规模增长、利润最大化。
而AI打破了这个规则。每个人、每家企业都有机会以极低的成本开发出满足自己个性化需求的软件。一个“以人为中心”的数字世界正在加速形成。
戴嘉玮认为,当“大规模个性化”成为可能,每一个个体的需求都不再需要为了适应而被“合并、抽象、兼容”。
“你用 AI 做的工具,也许永远不会在应用商店上架,也许永远不会有成千上万的用户。但对于你,和那些你在乎的人来说,它就是这个世界上,最有价值的软件。”戴嘉玮说,技术的温度,或许不在于它能实现多伟大的叙事,而在于它愿意为多小的需求弯腰。
对了,去年开发工具时,戴嘉玮用了两天。今年“龙虾”出现后,这位非专业程序员又试了试手——这次开发只用了2小时。
03
“你可以慢一点 但不是学不会”
第三个故事,来自今年63岁的赵伟程。
在建筑行业工作了将近四十年,老赵退休了。但他没闲着,而是琢磨起了AI。
“很多人以为建筑就是画图,但做久了就会发现,建筑要处理的是很多复杂条件的平衡。规范、技术、功能、成本、效率……”老赵说,从业者需要在很多矛盾的条件关系里,找到更优解。
比如,如何用最少的标准化构件,搭建最多的户型,还要让组合方式足够灵活?
搁在以前,这项工作靠人工,得一张张研究五千份以上的图纸,把数据抄下来、研究不同空间的关系,一个个步骤推下去。更崩溃的是,有时候一个条件变了,前面很多工作也得推倒重来。
老赵开始训练AI。他发现,AI可以自己提取图纸数据,按自己设定的规则分类。但这些规则AI自己不知道,是老赵基于自己的专业积累和经验形成的。
他有一个强烈的感受:AI 很像一个脑子很快、手也很快,但完全没有现场经验的实习生。它反应快,执行也快,有时候还能给你一点启发。“但方向要你来定,规则要你来给,结果要你来判断。这些事,最后还是要靠人。”

AI创作者、面向退休人群的AI公益讲师赵伟程。受访者供图
后来,老赵站上社区大学公益讲台。发现一个新问题:下载、注册、登录、上传,这些年轻人习以为常的词汇、操作,对老年群体来说就是一道坎儿。
网络上,这样的论调也不少:AI加速了社会进步,但老年人却被时代抛弃。
果真如此吗?老赵认为,让老年人用AI,不能从术语开始,要从生活开始。
不先讲提示词、工作流、多模态。一上课,老赵先讲这些——
能不能让 AI 给旅游照片配一段文字?
能不能帮你解读体检报告?
能不能把老同学聚会整理成一篇朋友圈?
能不能给孩子做个故事绘本?
能不能把自己一直想写、但不知道怎么开头的人生经历,先理出一个提纲?

赵伟程。祝梅 摄
“很多老人不是不想学,而是他们这一生,已经很多次被技术挡在门外了。所以他们默认自己不会,默认自己学不会,默认这不是自己的世界。”老赵说,每次上课,自己最想先让大家知道的,不是今天你必须学会几个功能,而是一句话:你可以慢一点,但你不是学不会。
“AI对退休人群的帮助,远不只是学会一个新工具。它更重要的地方在于,很多人退休以后,会慢慢觉得自己退出了。退出工作,退出公共话题,慢慢退到生活的背景板后面去了。但有了AI以后,他们开始重新表达。”老赵说。
老赵有个学生参与小区里的工作,常感觉很多意见说不清。后来,这个学生用AI整理了一份方案。
“我问他发出去后效果怎么样,他回了我四个字:‘特别轰动’。”
04
学习,学的是解决问题的能力
第四个故事,来自现场最年轻的分享者,还在上大四的00后范文涵。
范文涵就读于郑州轻工业大学机械设计及自动化专业,但他用AI忙活的是另一摊事儿:AI辅助小麦育种。
范文涵有个朋友上了农学院,有次聊天和他吐槽:
有个实验需要每隔两个小时去测小麦生长的叶茎、叶宽、叶面积等表型数据,为了凑一组数据,还需要熬夜搭班测量。
这还不算完。大家还得对着手写的表格一行一行敲到excel里,一个小数点标错,都可能导致整个实验数据的计算结果失败。
这个过程能不能借助AI简化过程,帮大家省点力气?通过传感器解决了数据采集问题后,最大的挑战就是如何教AI看懂这些小麦数据。

00后开发者、郑州轻工业大学机械工程专业大四学生范文涵。受访者供图
基于Qwen3-1.7B模型,大家收集了大量的实验数据并通过Lora微调的方式为Qwen3注入了育种实验室的真实经验,让Qwen学习育种专家的分析逻辑和判断标准。
“大模型微调的过程中,开发者社区给了我们很大帮助,整个技术链条非常清晰。我们遇到的一些问题,都能在前人的一些案例或者一些开源的文章里找到影子。”小范说,前人填平的“坑”,让大家能一步步往下尝试。
“现在,我们只需要输入环境数据和小麦的实际生长数据,它就能仿照专家的思路,输出实验麦种抗干旱能力的综合评价,还有后续的建议。”小范说。

00后开发者、郑州轻工业大学机械工程专业大四学生范文涵。受访者供图
为什么会跨专业去做这样的研究?小范大一就加入了学校的创新创业工作室,接受过机械建模、电子电路设计、代码编程等培训,打下了基础。
“刚入学老师就告诉我,大学期间最忌讳的就是受到专业限制,被困住手脚。”小范认为,学习,真正意义上应该做的是结合各个专业的技术,最终学习到解决问题的能力。
“之前可能一个专业就是一个圈子。学机械的就应该去搞设备、搞机床,学农的就应该在大田里、待在实验室里,而写代码的就在电脑前写代码就可以。”小范说,但随着大模型、开源工具的出现,“我们发现这层窗户纸它其实一戳就破。”
小范说,AI不应该是某一个行业的专属。无论什么专业,只要你有问题,只要你想做,都可以想办法试着用AI去解决,用开源工具去实现。
00后,AI时代的原住民,这或许就是青春该有的样子吧。
05
“让每一种声音,都被听见”
第五个故事,来自28岁的邱生峰。这是他人生中第一次公开演讲。
出生时因缺氧导致脑瘫,邱生峰发音有些不清,但勤奋好学的他,克服重重障碍考上了重庆大学数学系,毕业后进入一家公司担任感知算法工程师。
可是,职场里,效率是第一语言。在开会、谈合作的很多瞬间,邱生峰逐渐意识到一个更根本的问题:最大的困难,从来不是生理上的“说不清”,而是环境里的“不愿等”。

上海生声不息科技公司创始人邱生峰。受访者供图
去年,邱生峰参加了通义实验室发起的“小有可为”AI向善比赛。主题是用AI赋能残障生活场景。
“我看到了助盲眼镜、智能轮椅,开发者的故事给了我很多启发。当时就想:能不能做一款解决发音不清人群表达问题的产品?”
市面上绝大多数AI语音工具,只能识别标准发音,很难听懂构音障碍者在说什么。这次,邱生峰把自己开发的无障碍交流AI产品“燃言”带到了现场。
“此刻你们看到屏幕两边的字幕,是我做的AI工具‘燃言’。这个诞生3个月的产品还远不够完善,但已经可以给我带来一些真实的帮助。”邱生峰说话时,两侧屏幕上跃动的声波,能听懂他的话。
开发产品时,邱生峰和两位伙伴把全球60多篇关于构音障碍的论文,整理成了一个开源仓库。基于Fun-ASR和Qwen3-ASR等开源模型搭建语音agent架构,能把构音障碍者的语音转成文字。

“燃言”的声波跃动,听懂了邱生峰。祝梅 摄
不过,开发的最大难点并不在算法,而在数据——中文构音数据极其稀缺。
团队尝试用合成数据缓解了一部分问题,邱生峰自己和30多位种子用户每天坚持录音、标注、迭代。
为解决算力问题,他又独自带着项目去北京路演,换来了训练资源。
“有用户说他讨厌在外面被家人替代表达自己的想法,有用户说他希望能够用自己的声音主动参与到社交中。这些需求定义了我们的产品。”邱生峰认为,在AI时代,想办法把需求转化为产品是一项很重要的能力。
现在,站在台上的邱生峰,另一个身份是上海生声不息科技创始人。他希望通过打磨“燃言”,“让每一种声音,都被听见”。
“过去我常想:如果有一天,我能流畅地表达,我想说什么?现在我觉得,说什么没那么重要。重要的是,我终于可以说了。”邱生峰说。
往期回顾
夜雨聆风