
1980年,一本中国自己的学术杂志,白纸黑字地写下了这样一句话:电子计算机,将是汉字的掘墓人。
这话不是外国人说的,是我们自己说的。
说这话的时候,不是悲观,是真的绝望——因为当时能看到的所有证据,都在指向同一个结论:汉字,可能真的要被这个时代淘汰了。
那后来呢?后来发生了一件大事。
一、这道墙,横在这里已经一百年了
要理解这件事有多难,得先搞清楚一个基本矛盾。

英文有多少字母?26个。加上大小写、标点、数字,撑死了两三百个符号。计算机里一个8位字节,最多能表示256种状态——英文往里一装,刚刚好。
汉字呢?常用字就有六七千个,要把所有字都存进去,一个字节根本不够,得用两个,甚至更多。这还只是"装得进"的问题,还没说怎么显示。
打印一个汉字,需要用点阵来描绘它的形状。一个标准字号的汉字,大概要用一百乘一百的点阵,也就是一万个点。把常见的字体、字号全部存下来,信息量能到几百亿字节。而当时中国最好的国产计算机,存储量不到7兆。
这不是技术难不难的问题,这是数量级的不匹配。

这道墙不是从电脑时代才有的。往前翻,1876年,清朝官员李圭去美国费城参加世界博览会,在展馆里看到了打字机。他看了半天,只说了一句话——"惜不能印华文"。
那年是1876年。
这四个字,像一道长达百年的判决书。打字机发明之后,英文可以打,法文可以打,德文可以打,就连日文假名都造出了打字机。唯独汉字,全世界都说"不可能"。

因为打字机这个东西,从机械结构到设计逻辑,就是为字母文字量身定制的——你只需要一排键盘,几十个键,就能把整门语言打出来。但汉字有几千个,你得造个什么东西?一张桌子大的键盘?
事情发展到后来,越来越悲观。二十世纪初,中国顶尖的知识分子开始认真讨论一件事:要不要把汉字废掉,改用拼音?这不是激进分子的奇谈怪论,钱玄同、陈独秀、鲁迅,这些人都说过类似的话。
背后的逻辑很简单:如果汉字用不了打字机、进不了计算机,它就会在信息时代彻底掉队,带着中华文明一起掉队。

所以才有了1980年那句话。那时计算机已经在全球普及,而汉字依然无法被计算机处理,学者们下了一个他们认为已经经过充分论证的结论。
从李圭的叹气,到这句宣判,整整一百年。
二、他们有多努力,就有多惨
当然,一百年里没有人什么都不干。
试过的人里,有一个绕不开的名字:林语堂。你可能知道他是作家,写过《京华烟云》。但他还有另一个身份——他在1940年代,把自己所有的钱都砸进了一台中文打字机。
他造出来的这台机器,在当时算是一个奇迹。键盘只有七十多个键,但能打出几万个汉字,靠的是一套他发明的"字形检索法"——把每个汉字的形状拆成上半部分和下半部分,分别对应不同的键,打两个键,机器自动匹配。

逻辑上没有问题。实物造出来了,能用。
但问题是:这台机器太贵了。而且他造它的时候,中国正打仗,美国的投资人看不到前景,没人愿意量产。
林语堂为了造这台打字机,卖掉了他在曼哈顿的房子,背了一身债,总共花掉了十二万美元。 那是1947年,十二万美元是什么概念,你自己想象吧。
最后这台打字机送进了美国一家公司的仓库。二十年后,林语堂的女儿专门去美国找这台机器,公司员工告诉她:早就当垃圾扔掉了。
林语堂是失败者里最有名的一个,但不是唯一一个。往前追,从1888年开始,已经有好几代人前赴后继地尝试过中文打字机。最接近成功的,是一个叫舒震东的工程师,在商务印书馆造出了一台相对实用的机器,二十年卖出去了两千台。

但它本质上仍然是一张铺满铅字的盘,操作员要用一根棍子在几千个字里扒拉,找到要打的字,再按下去。这不是打字,这是体力活。
机械时代给了汉字的答案就是:这辈子可能就这样了。
三、那这群中国人,是怎么把墙凿穿的
1974年,中国启动了一个国家级工程,代号"748"。目标只有一个:让汉字进入计算机。
五个部委联合申报,国家计委批准立项。这个规格,说明上面已经下定了决心——这不是科研项目,这是一场必须打赢的仗。
承接核心任务的,是北京大学一个研究室。主要负责人叫王选,当时是个助教,而且正在病休。

就是这个病休在家的人,做了一个后来被证明极其关键的判断。
当时国内外普遍的技术路线,是照排机的二代、三代方案,王选看完这些方案,认为它们都是死路——等你把这条路走完,人家已经走到更远了。他的选择是直接跳过这两代,去研究当时国际上根本没有成熟商品的第四代激光照排系统。
这个判断的底气,来自他对汉字存储问题提出的一个解法。
普通方法是把每个汉字的点阵直接存进去,存量太大,装不下。王选用的是一套数学方法,把每个汉字的笔画用轮廓和参数来描述,不存图,存的是"规律"。这样把信息量压缩了五百倍以上,原来要几百亿字节的东西,4兆就能存下来。

算法有了,还得有软件把算法变成真正能用的系统。这件事主要是他的妻子陈堃銶在做。她负责统筹全部软件开发,写了十四万行代码,期间高强度工作导致血压一度低到五十五,几乎要晕倒。
1979年7月,系统输出了历史上第一张用激光照排技术印出的中文报纸样张。
但样张是样张,距离真正能用,还差得远。
真正的考验在1987年。《经济日报》决定用他们的系统出报,结果头几天,系统问题不断,报纸出错,报社每天登道歉声明,员工联名写信要求"下马",最后通牒是:十天内彻底跑通,否则退回铅排。
十天。

王选团队连夜排查故障,最后在期限内稳住了。这张报纸,成了世界上第一张整版用激光照排印出的中文报纸。
这之后,故事就好看多了。
当时国内也引进过外国的照排系统,美国某公司的产品,价格是华光系统的十五倍,调试了很久,结果死活跑不起来。王选带着几个人去看,把那台"死机"给修好了——用他自己研发的技术,修好了价格是他十五倍的竞争对手的机器。
1989年底,英国、美国、日本几个主要的照排厂商,陆续宣布退出中国市场。临走的时候,美国那家公司的总裁说了一句话:"今后,地球上再没有HTS公司了。"

与此同时,另一条战线上,一个叫王永民的人花了将近五年,整理了十二万张卡片,把汉字的所有笔画结构重新拆解了一遍,发明了五笔字型输入法。
1983年公开演示时,打字员一分钟打出了136个汉字——第一次有人在电脑上证明,汉字输入不比英文慢多少。
到1993年,全国百分之九十九的报社,用的都是国产激光照排系统。
激光照排、汉字输入、编码标准——输出、输入、字符集,三条线全部打通,汉字正式成了数字世界里的合法居民。
1980年那本杂志说"电子计算机将是汉字的掘墓人",说这话的人不是坏人,他们只是被眼前的困难吓到了。

但有些墙,不是因为它不能被凿穿,而是凿它的人还没出现。

扫码关注我们
夜雨聆风