克劳德·香农如何发明未来

2020年底,斯坦福大学工程学院的 David Tse 教授在知名的在线科普出版物《量子杂志》(Quanta Magazine)上发表专栏文章,纪念美国数学家、电子工程师和密码学家、信息论的创始人克劳德·香农(Claude Shannon)博士。确实,给我们今天的生活带来极大便利的全球互联网和高速无线通信网络的开创和发展,都要归功于香农于1948年创立的现代信息理论。香农如此大名鼎鼎,却又异常低调,乃至许多学生和学者误以为他早已作古。在1985年的IEEE信息学年会上,当与会者得知香农现身在会议中时,会场一片轰动。当年的会议主席回忆:“就好像牛顿出现在物理学会议中。”香农最终于2001年去世,终年84岁。巨星陨落,但他的学术遗产已经由一代又一代的科学家、数学家和工程师所继承和发扬,继续照耀人类前进的道路。特此翻译此文,向先驱致敬!


感谢一位独到的天才的开创性工作,让今天的信息时代成为可能。

科学寻求自然的基本定律。数学在旧的基础上寻找新的定理。工程学构建解决人类需求的系统。这三个学科相互依存但又截然不同。很少有个人同时在这三个学科做出核心贡献 — 但是克劳德·香农就是这样一个难得的个人。

虽然是最近的纪录片《比特玩家》(The Bit Player) 的主角 — 而他的工作和研究理念也激发了我自己的职业生涯 — 香农并不是一个家喻户晓的人物。他从未获得过诺贝尔奖,而且在2001年去世前后,他都不是像阿尔伯特·爱因斯坦或理查德·费曼那样的名人。然而70多年前,在一篇划时代的论文中,他为构成现代信息时代根本的通信基础设施奠基。

香农于1916年出生于密歇根州的盖洛德市,是一位当地商人和一名教师的儿子。从密歇根大学获得电气工程和数学学位后,他在麻省理工学院撰写了一篇硕士论文,将名为布尔代数的数学理论应用于开关电路的分析和综合。这是一项变革性的工作,将电路设计从一门艺术变成了科学,现在被认为是数字电路设计的起点。

年轻的克劳德·香农

接下来,香农将目光投向了一个更大的目标:通信。

通信是人类最基本的需求之一。从烟雾信号到信鸽,再到电话和电视,人类一直在寻求更远、更快和更可靠的通信方法。但是,通信系统的工程学过去总是与特定的信息源和物理介质相关联。而香农提出的问题是:“是否有一个大一统的通信理论?”1939年,在给导师万尼瓦尔·布什(Vannevar Bush)的信中,香农概述了他关于“用于情报传递的通用系统的基本特性”的一些初步想法。经过十年的研究,香农终于在1948年发表了他的开创性杰作《通信的数学理论》。

他的理论的核心是一个简单但非常通用的通信模型:发送器将信息编码为信号,该信号会被噪声破坏,然后被接收器解码。虽然简单,香农的模型融合了两个关键见解:将信息源和噪声源与要设计的通信系统隔离开来,并对这两个源进行概率建模。他设想信息源会生成许多可能的消息来进行通信,每条消息都有一定的概率。概率化噪声进一步增加了接收器解析的随机性。

在香农之前,通信问题主要被视为确定性信号重建问题:如何转换被物理介质扭曲的接收信号,以尽可能准确地重建原始信号。香农的天才在于,他洞察到通信的关键是不确定性。毕竟,如果你提前知道了我在本专栏中对你说的话,那么还有什么必要写它呢?

香农的通信模型示意图

这一观察将通信从实体问题转向到抽象问题,从而使香农可以使用概率对不确定性进行建模。这给当时的通信工程师们带来了极大的冲击。

确定了不确定性和概率论的框架,香农在其具有里程碑意义的论文中着手系统地确定通信的基本限定。他的回答分为三个部分。在这三个方面都扮演着重要角色的,是信息“比特”(bit) 的概念。香农将其用作不确定性的基本单位。 比特好比是“二进制数字”的两格式旅行箱,可以是1或0,香农的论文是第一个使用该词的人(尽管他说数学家约翰·图基(John Tukey)先在一个备忘录中用到了该词)。

首先,香农提出了一个用于表示信息量的每秒最少比特数的公式,这个数字他称之为熵率 \(H\)。该数字量化了确定信息源将生成哪个消息所涉及的不确定性。熵率越低,不确定性越小,因此将消息压缩成较短的内容越容易。例如,以每分钟100个英文字母的速率发送短信,意味着每分钟发送有\(26^{100}\)种可能的消息,每条消息均由100个字母的序列表示。因为\(2^{470}≈26^{100}\),人们可以将所有这些可能性编码为470比特。如果所有序列的可能性相同,那么香农的公式表明熵率确切值是每分钟470比特。现实中,由于某些序列比其他序列出现的可能性高得多,所以熵率要低得多,可以进行更大的压缩。

其次,他给出了一个噪声条件下可以可靠通信的每秒最大比特数的公式,他将其称为系统的容量 \(C\)。这是接收机可以有效解析消息不确定性的最大速率,也就是实际上的通信速度的上限。

最后,他表明当且只当 \(H<C\) 时,来自信息源的信息才能在噪声条件下进行可靠的通信。因此,信息就像水一样:如果流量小于管道的容量,就能可靠地通过。

虽然这是一种通信理论,但同时也是一种有关信息如何产生和转换的理论 — 信息论。因此,香农现在被誉为“信息论之父”。

他的定理得出了一些与直觉相反的结论。假设你在嘈杂的地方讲话,确保你的消息能够传达的最佳方法是什么?也许重复多次?当然,这是每个人在喧哗的餐厅中的第一个本能,但事实证明这不是很有效。当然,你重复自己的次数越多,通信越可靠。但是你牺牲了速度来换取可靠性。香农向我们展示了我们可以做得更好。重复消息只是使用编码传输消息的一个例子,通过使用不同且更复杂的编码,可以在维持既定可靠性的同时,快速地通信 — 直到速度上限 \(C\)

香农的理论得出的另一个意外结论是,无论信息的特质是什么 — 莎士比亚十四行诗、贝多芬第五交响曲的录音、还是黑泽明的电影 — 在传输之前,将其编码为比特总是最有效的。因此以无线电系统为例,即使初始的声音和通过空中发送的电磁信号都是模拟波形式的,香农定理也表明最好先将声波数字化为比特,然后将这些比特映射到电磁波。这一令人惊讶的结果是现代数字信息时代的基石,在这个时代里,作为信息通用货币的比特无所不在。

香农的通用信息理论是如此自然,以至于他似乎发现了宇宙的通信定律,而不是发明了它们。他的理论与自然界的物理定律一样基本。从这个意义上说,他是一名科学家。

香农发明了新的数学来描述通信定律。他引入了一些新思想,比如概率模型的熵率,这些新思想已应用于研究动力学系统长期行为的遍历数学等广泛的数学分支。从这个意义上说,香农是一个数学家。

但最重要的是,香农是一名工程师。他的理论受到实际工程问题的启发。尽管对当时的工程师来说是深奥的,但香农的理论现已成为所有现代通信系统(光学、水下、甚至行星际)基础的标准框架。就我个人而言,我很幸运地参与了将香农的理论应用和扩展到无线通信的全球性努力中,历经几代标准将通信速度提高了两个数量级。确实,当前推出的5G标准使用的不是一种而是两种实用的编码,它们被证明可以达到香农的速度上限。

晚年香农手持土星的照片

香农在70多年前就为所有这一切奠定了基础。他是怎么做到的?通过不懈地专注于问题的根本特征,忽略所有其它方面。他的通信模型的简单性就是这种风格的很好例证。他还知道要专注于可能,而不是立即可行的事情。

香农的工作说明了顶级科学研究的真正作用。当我开始读研究生时,我的导师告诉我,最好的工作是修剪知识树,而不是扩张知识树。那时候我不知道该怎么做;我一直认为研究人员的工作就是添加自己的树枝。但是在我的职业生涯中,由于我有机会在自己的工作中运用这种思想,我开始理解了。

当香农开始研究通信时,工程师已经掌握了大量技术。正是他的统一工作,将所有这些知识枝条修剪成了一棵贯通而优美的树 — 这棵树为几代科学家、数学家和工程师带来了累累硕果。