1990年代的软件设计师在硬件性能极其有限的条件下,构建出了内容密度相当高的学习系统。到了2020年代,技术能力已经提升了数个数量级,但语言学习软件的整体课程深度反而出现了下降趋势。这一观察并非怀旧情绪的产物,而是可以通过产品内容量进行横向比较的事实。以下两组对比所涉及的课程时长、词汇量、练习类型等数据,系基于各产品公开资料与课程内容分析的综合估算,反映量级差异而非精确统计。
对比案例一:Rosetta Stone 2000 版vs Duolingo 2020 版

维度 | Rosetta Stone2000 | Duolingo 2020 | 变化 |
课程总时长 | 200+小时 | 约50 小时 | 减少 75% |
词汇量 | 3000+核心词汇 | 1500-2000常用词 | 减少 40% |
语法讲解 | 隐性习得(通过图片和语境自然理解) | 碎片化提示(每课一句简单说明) | 从系统到碎片 |
练习类型 | 20+种(四图选一、听音识图、看图选词、听音打字、语音评测、放慢语速、字符块式写作……) | 5-8 种(翻译、配对、排序、选择、口语跟读) | 减少 70% |
课程结构 | 螺旋式上升,同一主题反复出现 | 线性推进,每个主题只出现一次 | 从重复到一次 |
学习路径 | 系统化分级,从初级到专家级 | 碎片化单元,用户可任意跳转 | 从系统到碎片 |
先看Rosetta Stone 2000版与Duolingo 2020版的对比。Rosetta Stone在世纪之交的版本提供了超过200小时的系统课程,核心词汇量在3000以上,练习类型多达20种以上——从四图选一、听音识图、看图选词,到听音打字、语音评测、放慢语速和字符块式写作,覆盖了多种认知层次的训练。课程采用螺旋式上升结构,同一主题会在不同阶段反复出现,学习路径从初级到专家级逐级推进,用户不能随意跳转。
Duolingo 2020版的情况则大不相同。其纯教学内容约50小时即可完成,核心词汇量在1500到2000常用词之间,练习类型集中在翻译、配对、排序、选择和口语跟读这五六种核心模板上。课程以线性推进为主,每个主题通常只出现一次,间隔重复机制负责后续的复习巩固。学习路径由大量碎片化单元组成,用户可以自由选择跳转到任意位置。
值得注意的是,这种差异并不直接等同于学习效果的高低。Duolingo官方efficacy研究(Jiang et al., 2021)显示,完成西班牙语或法语课程前7个单元的学习者,中位学习时间约为203小时——这意味着大量时间消耗在复习和重复练习中,而非新内容的摄入。Rosetta Stone的设计初衷是让用户“掌握一门语言”,200小时的课程是紧凑的新内容;Duolingo的设计初衷是让用户“每天投入5分钟”,同样的200小时中,有相当比例是在巩固已有知识。
对比案例二:Tell Me More 2002 版vs ELSA Speak 2023 版
发音训练的系统性 | 完整音标体系,逐个音素练习 | 纠音为主,无系统音标训练 | 从系统到纠错 |
课程体系 | 2000+小时结构化课程,9-10个级别 | 功能点训练,无完整课程体系 | 从系统到碎片 |
反馈方式 | 波形对比+3D口型动画+错误定位 | AI 实时评分+发音纠正 | 反馈更即时,但解释更少 |
练习类型 | 37 种练习类型,覆盖听说读写 | 以跟读为主,类型单一 | 从多元到单一 |
文化内容 | 丰富的文化知识模块 | 基本无文化内容 | 从文化到纯语言 |
再看Tell Me More与ELSA Speak 2023版的对比。需要说明的是,这一对比并不完全对称:Tell Me More是覆盖听说读写的综合型课程软件,而ELSA Speak是聚焦发音矫正的专项工具。但正是这种“综合课程”与“专项工具”的此消彼长,折射出行业在过去二十年间的定位迁移。
Tell Me More在2000年代提供了超过2000小时的结构化课程,划分为9到10个级别,发音训练从完整音标体系入手,逐个音素进行系统练习。练习类型超过30种,覆盖听说读写各个维度,课程中还嵌入了丰富的文化知识模块。反馈方式包括波形对比、3D口型动画和错误定位,用户可以看到自己的发音与标准发音之间的视觉差异。ELSA Speak 2023版则以纠音为核心,覆盖英语的44个音素,但音标训练相对分散,更偏向按需纠错而非系统教学。课程缺乏传统的分级体系,练习以跟读为主,AI实时评分和发音纠正取代了详细的波形分析和口型展示。文化内容基本没有涉及。
Tell Me More的设计团队将发音视为需要从音标开始逐步构建的系统能力,而ELSA Speak的设计团队则将发音视为可以逐个解决的即时问题——前者是教学逻辑,后者更像诊断逻辑。两种思路各有适用场景,但综合型课程的消失与专项工具的崛起本身,就说明了市场对“深度”的需求正在被对“效率”的需求所替代。

21.2结构性因素分析
软件课程深度的下降,不能简单归因于设计师个人能力的退化。多重结构性因素共同作用,才塑造了今天的产品形态。这些因素可以大致分为两层:底层是产品运行的外部约束环境,上层是设计师在这些约束之下做出的决策逻辑。
商业模式变化
先看约束环境。商业模式的迁移是最根本的一股力量。
1990年代的主流模式是一次性付费,用户以大约200美元购买一套软件,企业获得充足收入来支撑2000小时级别的课程开发,用户因为已经付了钱,也自然有动力把课程学完。到了2020年代,免费加订阅模式取而代之:用户先免费下载App,企业再通过内购或订阅实现转化。
这套模式带来了连锁反应:
• 获客成本被推高,企业需要海量免费用户才能支撑付费转化率;
• 内容必须足够轻量,过于厚重的课程会让免费用户在试用阶段就流失;
• 付费点必须前置,用户需要在几天内感受到产品的价值,否则根本不会考虑掏钱。
一套需要数月才能体现价值的深度课程,在免费模式下几乎没有生存空间,产品因此被压缩到几天内就可以“体验”完毕。
用户行为变化

• 单元长度必须更短:从 1 小时的课程,压缩到5 分钟的单元
• 反馈必须即时:用户没有耐心等待课后的延迟结果,必须即时获得成就感
• 学习目标必须更小:从“掌握一门语言”分解为“完成今日的打卡任务 ”
设备限制变化
设备和分发技术的约束同样不可忽视。标准CD-ROM的容量是650MB,可以存放约70分钟的MPEG-1视频或数百兆的高保真音频,开发团队有充裕的空间在本地填充内容。移动App的安装包一旦超过100MB,蜂窝网络下载就会触发警告,直接导致用户流失。
开发团队不得不在工程上做出取舍:
•音频必须压缩:音质下降、时长受限
•图片必须优化:数量减少,分辨率降低
•视频必须牺牲:很多 App 干脆整体放弃视频内容
新技术的支持下,语音识别模型可以部署在云端,但会引入网络延迟;3D动画资源包需要额外下载,用户很可能拒绝。这些技术约束层层叠加,最终反映在内容的深度和丰富度的压缩上。
注意力经济
在约束环境之上,设计师的决策逻辑也在发挥作用。注意力经济的竞争逻辑重新定义了产品设计的目标。1990年代的软件运行在一个相对封闭的环境中,用户打开电脑、运行软件之后处于沉浸状态,没有外部通知来打断。2020年代的软件不过是众多注意力争夺者中的一个——用户可能在Duolingo上学习五分钟,然后切换到Instagram浏览十五分钟,再查看几条通知,再打开TikTok。软件必须在最短时间内抓住用户,否则就被划走了。
这种竞争环境催生了一套即时满足的产品机制:连胜数字制造中断焦虑,勋章系统提供即时奖励,排行榜激发社会比较。
•连胜机制:连胜数字制造中断焦虑
• 勋章系统:提供完成任务的即时奖励
• 排行榜:激发社群比较的竞争心
这些游戏化手段在留存数据上确实有效,但它们同时也在潜移默化地改变学习的本质——行为从“理解意义”逐渐滑向“获取奖励”,从“深度掌握”变成“完成任务”。
技术乐观主义
技术乐观主义则是另一个让设计团队低估人工设计价值的因素。
1990年代的设计师对技术的边界有清醒的认知,知道技术弥补不了设计上的偷懒,所以必须反复打磨每一个细节——Tell Me More的三十多种练习类型是系统思考的结果,Rosetta Stone的四图选一经过了多轮测试和验证。
2020年代的设计师手握AI内容生成、语音识别和个性化推荐这些强大的工具,容易产生一种信念,认为技术可以在很大程度上替代精心设计。
然而AI可以生成无限量的语法练习题,却判断不了哪一道题对特定用户最有价值;可以识别发音错误,却解释不了为什么某个音发不准;可以推荐学习路径,却理解不了用户真正的学习目标。对技术能力的过度信赖,使整个行业在一定程度上忽视了教学设计本身的专业价值。

语言学视角
从语言学理论的视角来审视这一趋势,情况同样值得关注。
Rod Ellis在2003年出版的著作中指出,任务型语言教学需要精心设计的课程框架,而非零散的练习堆积——框架应包含明确的任务目标、真实的任务情境、分阶段的任务实施以及系统的任务反馈。
Jane Willis在1996年进一步强调,有效的语言学习应当围绕真实世界的任务来组织,任务需要具备清晰的目标、过程和成果。Tell Me More中的情景对话与角色扮演模块,正是这套框架在软件中的早期实践,让学习者在模拟任务中自然整合听说读写。
Merrill Swain在1995年提出的输出假说则指出,单纯的可理解输入不足以促成完整的语言习得,学习者必须通过可理解输出来检验自己的语言假设。Pronunciation Power和Tell Me More的录音对比功能,就是这一理论在工程上的早期实现,强迫学习者开口并自我对比。
当前许多碎片化软件虽然也包含跟读等口语练习,但开放式对话、命题演讲、自由写作这类不受限的输出训练明显减少了。用户进行了大量输入,却很少有机会自由输出;即便输出了,也缺乏系统的错误分析与反馈。输入与输出之间的失衡,正是“浅”的一个核心表现。

21.3浅层设计的代价
软件停留在浅层,用户停留在“游玩”状态,会付出的实实在在的代价。
学习效果的结构性落差
语言能力的“虚假繁荣”
一个用户完全可能维持365天连胜、积累10万经验值、解锁全部勋章,但出国去旅行时可能仍然听不懂服务员的询问,看原声电影需要不停地跟踪字幕,写邮件仍然经常出现明显的语法错误。这并不是个例,而是大量用户的真实体验:哪怕拿满了软件内的成就标志,真实场景中的语言能力却还是比较匮乏。
原因在于,软件中定义的成功并不等同于真实语言能力。能够正确完成“苹果→apple”的配对,不等于能在对话中听懂“I'd like an apple”;能够记住“跑”对应的英文是“run”,不等于能在跑步时自然说出“I'm running”。游戏化机制创造的成就感与真实能力的提升之间,存在一个用户日常难以察觉的缺口。
更深层的问题:学习者的系统性迷失
当用户长期习惯了碎片化学习之后,往往难以再适应系统训练。
有学习者反映,使用某款碎片化App学了两年法语,掌握了几百个单词,能看懂简单句子,但无法造句,不懂时态变化,不能组织段落——知识像一堆无法拼接的碎片。
这种迷失是碎片化学习的结构性后果:缺乏语法框架,缺乏螺旋式复现,缺乏从简单到复杂的渐进路径,学习者最终只能获得孤立的单词和句子,无法将它们组装成完整的语言能力。

21.4例外:坚持深度的产品
碎片化的大潮中,仍然有一些产品保持了课程的深度。

Babbel:基于 CEFR 的系统化课程
Babbel选择了一条不同的路。
它基于欧洲语言共同参考框架(CEFR)构建系统化课程,从A1到C1每个级别都有明确的目标和结构化的内容。用户不能像在某些App里那样随意跳转,必须按顺序完成每个单元。
Babbel的创始团队曾深入研究过Rosetta Stone的沉浸式理念,发现纯粹的无翻译沉浸对初学者来说门槛太高,于是在沉浸式基础上增加了明确的语法讲解和母语翻译,既降低了认知负担,又保留了系统的骨架。
根据Babbel官方引用的独立研究(Vesselinov & Grego, 2016),92%的参与者在两个月学习后提高了语言水平,45%提升了一个大学学期级别——虽然这不是严格的B1通过率统计,但方向性数据远好于碎片化产品的平均表现。
Busuu:社交+系统化
Busuu的付费版同样基于CEFR设计,提供系统化的语法讲解和练习。它的独特之处在于社交功能:用户可以将写作练习或口语录音提交给母语者批改。
这个设计正好呼应了Swain的输出假说——输出需要被检验才能提升准确性,母语者的批改提供了宝贵的反馈。社交功能本身也创造了额外的学习动机。
Busuu的课程更注重围绕真实场景展开,像餐厅点餐、酒店入住、同事闲聊等等场景,每个场景用户的任务明确,情境也更加真实。
Lingoda:真人教师+系统化课程
Lingoda则用真人教师来弥补软件的不足。课程同样基于CEFR设计,由真人在线上小班课讲授,学生可以实时提问、获得即时反馈、与其他学习者互动。
完成课程的学员可以获得官方认可的语言证书。据其官方宣传,完成课程的大部分学员能够通过对应的CEFR水平测试,具体通过率因级别和语言而异。
这三款产品的共同之处,在于它们都保留了系统化的课程设计。不管有没有用AI,不管有没有加游戏化,它们都坚持了一个核心理念:学习是需要系统的。

21.5深度与浅度的平衡
深度与浅度并非非此即彼的选择,而应根据学习目标进行动态调整。

入门者:浅度软件足够
进阶者:需要深度课程+真人互动
对于希望真正掌握语言的进阶者,深度课程是不可替代的。系统化的语法讲解、螺旋式的课程结构、丰富的练习类型、真实的情景模拟,都需要精心设计的课程体系来支撑。
与此同时,真人互动同样不可或缺——语言终究是交流工具,只有在真实的交流中才能内化。Babbel的社交批改、Lingoda的真人课程、italki的母语者对话,都是进阶阶段很有价值的补充手段。
专业者:必须回到系统化学习
对于需要达到高级水平的专业者——比如翻译、教师或学术研究者——系统化学习几乎是唯一的路径。他们需要的不仅是“会用”,而是“精通”,这需要数百小时的系统训练、深度的语法分析以及大量的阅读和写作练习。
这类学习者通常不会依赖单一软件,而是组合多种工具:用Anki记忆词汇,用播客训练听力,用Kindle阅读原著,用italki练习口语,用教科书系统学习语法。
平衡深度与浅度
平衡深度与浅度可以从两个维度来考量。一个是学习阶段:入门期可以浅,进阶期必须深。另一个是学习目标:日常会话可以浅,专业交流必须深。理解了这个平衡,才能选择适合自己的工具,而不是被工具塑造。

21.6 设计反思:技术、深度与遗忘的智慧
技术进步并不总是等同于学习进步。我们拥有了更强大的技术能力,却可能退化了某些更深刻的设计智慧。
90年代的设计师在技术极其受限的条件下,创造了深度惊人的学习系统。他们必须精心设计每一个细节,因为技术本身弥补不了设计的缺陷;必须系统思考学习的全过程,因为用户除了这套软件之外没有其他资源可以依赖。
今天的设计师拥有近乎无限的技术可能,但设计本身的价值有时反而被忽略了。AI可以生成海量内容,但生成的内容是否构成了系统?语音识别可以即时反馈,但反馈是否真正帮助用户理解了问题所在?游戏化可以维持动机,但这股动机是否指向了真正的学习?
现代软件的优势是不可否认的:便捷、免费、游戏化、社交化,它们让更多人有机会接触语言学习,也让更多人能够坚持下来。但深度与便捷之间存在结构性的张力,这一点也应当被正视。2000小时的课程深度与5分钟的学习单元很难共存,系统化的语法讲解与碎片化的任务设计不太容易兼容,深度的输出训练与即时满足的游戏化机制之间也存在着矛盾。
理解这些张力,才有可能设计出更好的产品,选择更适合自己的工具,避免被数据上的虚假繁荣所迷惑,真正朝着掌握一门语言的方向前进。

本章小结
当代软件变浅,并不是设计师个人的失败,而是商业模式、用户行为、设备限制、注意力经济和技术乐观主义这些结构性因素共同塑造的结果。浅层设计有它的价值,系统深度也有它的必要。入门者需要浅度,日常会话可以碎片化,而进阶者需要深度,专业交流必须系统化。
语言学研究者早已指出了方向:Ellis的任务型教学框架、Willis的任务实施模式、Swain的输出假说,都在强调系统化、结构化和输出导向的学习才是语言习得的正途。90年代的软件在精心设计中实践了这些理念,而当代软件却可能在时代新浪潮的冲击下不经意间忽视了它们。
技术提供了前所未有的可能性,但它不能替代教学设计本身。未来的设计师需要重新审视那些被遗忘的智慧,在深度与便捷、系统与碎片、输出与输入之间找到新的平衡点,才能创造出既易于坚持、又真正有效的学习工具。

本章完结
《学习软件进化论》 | 按章节更新
下一篇:《学习软件进化论》第二十二章 从黄金时代到 AI 时代

参考文献:
1.Ellis, R. (2003). Task-based Language Learning and Teaching. Oxford: Oxford University Press.
2.Willis, J. (1996). A Framework for Task-Based Learning. London: Longman.
3.Swain, M. (1995). Three functions of output in second language learning. In G. Cook & B. Seidlhofer (Eds.),Principle and Practice in Applied Linguistics. Oxford: OxfordUniversity Press.
4.Krashen, S. (1982).Principles and Practice in Second Language Acquisition. Oxford: Pergamon Press.
5.Nunan, D. (2004). Task-Based Language Teaching. Cambridge: Cambridge University Press.
6.Long, M. H. (2015).Second Language Acquisition and Task-Based Language Teaching. Malden, MA: Wiley-Blackwell.
7.Duolingo. (2021).Duolingo Language Report 2021. Duolingo Inc.
8. Jiang, X., Chen, H., Portnoff, L., Gustafson, E., Rollinson, J., Plonsky, L., & Pajak, B. (2021). Finishing half of B1 on Duolingo comparable to five university semesters in reading and listening. *Duolingo Research Report DRR-21-03*.
9. Vesselinov, R., & Grego, J. (2016). The Babbel Efficacy Study. New York: Babbel GmbH.
10. Lingoda. (2022). Learning Outcomes and CEFR Certification. Lingoda GmbH. [官方宣传材料]
end
夜雨聆风