70年代汉字信息化困境:看北大王选如何打破日本字库垄断

1876年费城世博会,清朝官员李圭盯着那台叫“打字机”的西洋玩意,憋出一句:“惜不能印华文。”

这话像个魔咒,困了汉字一百年。到了70年代,西方人更狂了,直接断言:“计算机是汉字的掘墓人。”

理由很简单:26个字母就能玩转的代码世界,容不下几万个方块字。要么废除汉字走拼音化,要么被信息时代开除球籍。路被堵死了?这群中国人偏要把墙撞塌。

汉字信息化_王选激光照排_字库打包下载

内存只有64K?那就把汉字像“压缩饼干”一样捏碎!

70年代搞汉字信息化,简直是在“螺蛳壳里做道场”。当时的计算机内存小得可怜,普遍只有64KB。这是什么概念?今天随便一张手机照片,都能把当年的电脑撑爆一千次。

西方专家和日本厂商早就给汉字判了死刑,或者说是“无期徒刑”。日本当时走的是“点阵字库”的路子,把一个汉字看成一张图,密密麻麻打上点。

要存下几千个常用字,光存储器就得几十公斤重,成本高到天际。日本写研公司甚至把这种落后的二代机、三代机打包,准备以此垄断中国市场,他们赌定中国搞不出自己的技术。

王选激光照排_汉字信息化_字库打包下载

就在这时,北大的王选站了出来。他是个数学家,而且是个身体极差、长期病休的“边缘人”。但他做了一个让所有人都觉得疯了的决定:跳过日本人的二代、三代机,直接搞第四代激光照排。

王选的逻辑很冷酷:汉字不是死的图,是活的线。他没有一个个去存点阵,而是用数学公式去描述汉字的轮廓。

把“横竖撇捺”变成了“参数和指令”,把汉字变成了矢量图形。这一招“轮廓+参数”的数学描述法,直接把汉字信息的压缩倍率干到了500倍以上!

王选激光照排_汉字信息化_字库打包下载

这就好比日本人在搬运一整座大山,而王选把山画成了图纸,卷起来揣兜里就走。

1979年7月27日,当那张用国产激光照排系统输出的《汉字信息处理》样张摆在桌上时,那些准备倾销设备的英国、美国HTS、日本写研全都傻了眼。

他们引以为傲的庞大字库设备,在中国人的数学压缩算法面前,瞬间成了废铜烂铁。

字库打包下载_汉字信息化_王选激光照排

王选这一把,不仅省下了几十亿的外汇,更重要的是,他守住了汉字在数字世界的“户口本”。从此,中国印刷业彻底告别了“铅与火”,直接跨入了“光与电”。这不是技术的微调,这是维度的碾压。

把汉字当“积木”拆?为了能盲打,这群人差点把字典撕了

解决了“存”和“输”,还有一个更要命的问题:怎么“入”?计算机键盘是给英文设计的,一共就26个字母键。

英文单词是线性的,一个个字母敲就行。可汉字是方块字,成千上万个字,怎么塞进这小小的键盘里?

汉字信息化_王选激光照排_字库打包下载

IBM曾经试图用“暴力美学”解决这个问题。他们搞出了一个“中文字处理机”,那个键盘大得像一张餐桌,上面密密麻麻排了一千多个键。

打字员不像是坐办公室的,倒像是弹钢琴的,找一个字得满桌子乱摸,效率低得令人发指。这种机器,除了证明“汉字不仅难学还难打”之外,毫无用处。

汉字信息化_王选激光照排_字库打包下载

那时候,国内还有一种“三角编号法”,把汉字看成三角形取角,逻辑复杂到能把人逼疯,根本没法普及。

这时候,一个叫王永民的河南人,把自己关在南阳的一间小黑屋里,干了一件“拆骨吸髓”的事。

他把《新华字典》里的几千个汉字,全部拆散、打碎。他发现,汉字再复杂,也不过是由100多个基本字根组成的。

王选激光照排_字库打包下载_汉字信息化

王永民就像玩乐高积木一样,把这些字根进行了几百万次的排列组合,最后硬是把它们科学地映射到了25个字母键上(Z键作为万能键)。

这就是后来让无数80后背得滚瓜烂熟的“五笔字型”。

汉字信息化_王选激光照排_字库打包下载

“王旁青头兼五一,土士二干十寸雨……”这枯燥的口诀背后,是汉字逻辑的胜利。五笔输入法让汉字第一次实现了“盲打”。熟练的打字员,每分钟能敲出160个字,这个速度直接秒杀了一众英文打字员!

1983年,五笔字型正式诞生。它狠狠地抽了那些“汉字落后论”者一记耳光。它证明了:不需要把键盘变成餐桌,也不需要废除汉字。

只要懂汉字的结构,26个键照样能敲出五千年文明。王永民不是在发明输入法,他是在给汉字做“拆骨手术”,让它换了一副骨架,挤进了信息时代的窄门。

字库打包下载_汉字信息化_王选激光照排

谁说方块字是累赘?在信息高速公路上,我们飙车比谁都快

王选解决了“让汉字出来”,王永民解决了“让汉字进去”。这两步走完,局面彻底反转。

字库打包下载_汉字信息化_王选激光照排

80年代末,随着国产激光照排系统的商用,中国彻底拿回了中文信息处理标准的制定权。我们制定了,后来又升级到。

那些曾经想让中国“削足适履”的外国巨头,要么倒闭,要么被迫遵守中国的标准。想挣中国的钱?那就得按中国的码来编。

这不仅仅是商业的胜利,更是“高熵文明”对“低熵文明”的逆袭。

王选激光照排_汉字信息化_字库打包下载

信息论告诉我们,英文是线性的、低熵的文字,为了表达一个意思,往往需要很长的字符序列。而汉字是二维的、高熵的文字,信息密度极大。在同样的屏幕面积上,汉字能承载的信息量是英文的1.5倍甚至更多。

当年那些因为“内存太小”而嫌弃汉字的理由,现在看来简直是笑话。随着硬件算力的指数级爆炸,汉字“图形化”的劣势被无限缩小,而“高密度”的优势被无限放大。

王选激光照排_汉字信息化_字库打包下载

你看现在的AI时代,语音输入、OCR识别,哪一个不是汉字占优?甚至在脑机接口的未来,汉字这种“意音结合”的思维方式,可能比纯表音的英文更接近人类大脑的底层代码。

字库打包下载_王选激光照排_汉字信息化

回过头看,1900年打字机前的绝望,1974年“748工程”的悲壮,都是值得的。

我们没有像越南那样废除汉字去迎合西方,也没有像日本那样搞得不伦不类。我们硬是在只有0和1的二进制世界里,给方块字杀出了一条血路。

汉字信息化_王选激光照排_字库打包下载

这不是汉字适应了电脑,而是中国人改造了电脑。

今天,当我们在键盘上运指如飞,在屏幕上看着流淌的中文时,别忘了,这一切的起点,是那群在64KB内存里“螺蛳壳做道场”的疯子。

他们证明了一件事:文明的载体不需要更换,需要的只是驾驭工具的智慧。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注