第一部分 熵的故事
随机性、无序性、不确定性
目录
第一部分 熵的故事
第一部分 熵的故事
随机性、无序性、不确定性
第一部分 熵的故事
第二部分 21点的故事
第二部分 21点的故事
第三部分 套利的故事
第三部分 套利的故事
第三部分 套利的故事
第四部分 圣彼得堡悖论的故事
第四部分 圣彼得堡悖论的故事
第四部分 圣彼得堡悖论的故事
第五部分 《反诈骗腐败组织集团犯罪法》的故事
第五部分 《反诈骗腐败组织集团犯罪法》的故事
第五部分 《反诈骗腐败组织集团犯罪法》的故事
第六部分 大爆炸的故事
第六部分 大爆炸的故事
第七部分 信号与噪音的故事
第七部分 信号与噪音的故事
上一页下一页
只有第三个行为是荒谬可笑的。之所以荒谬,是因为“买头杀人鲸”这条信息出现的可能性极低。在现实对话中,我们总是努力猜透彼此的意思。我们对对话发生地点、接下来可能会说的话以及哪些是完全不合逻辑的推论等的认知总是在不断更新。两个人的联系越紧密(人际关系或者文化),推测就越容易。一对结婚很久的夫妇可以把对方想说的话补充完整。儿时最好的朋友之间可能发送的信息里只有三个字,也能让对方兴奋得歇斯底里。
香农则提出了最激进的观点,他认为含义是无关紧要的。用拉普拉斯(Laplace)的话解释,也就是含义只是一种假设,香农并不需要。香农认为信息反而是与“随机性”相关。这不仅是因为噪音会随意扰乱信息。只有当发送者所说的是接收者原本不知道并且无法预知的信息时,信息才有存在的意义。因为真正的信息是无法预知的,本质上只是一系列随机事件,就像赌博轮盘的旋转或者骰子的滚动一样。
相对来说,摩尔斯设计的电报代码就很好,因为最常见的字母“E”由最短的代码代替,就是一个小圆点“.”。像“Z”这样的不常见字母的代码稍长一些,由多个点和长线组成。这使得大部分信息都比用早期的一些电报代码更加简明。这种原理和很多其他更加微妙的原理都应用到了现在的代码中,用于压缩电子图片、音频和视频。
九*九*藏*书*网通过水管的水流是有限的,与容量和摩擦力都有关系。水接触水管内壁产生阻力和紊流,削弱了水的流动。通信通道受噪音影响同样会扰乱信息传递。工程师们推理出的一个经验法则就是噪音会减弱信息流。如果存在大量噪音,甚至可能无法进行信息传输。
假设你真的想让你的配偶买回家一头杀人鲸,你也不能只说“买头杀人鲸”,你需要进一步解释原因。信息的不可能性越高,“可压缩性”就越低,需要的带宽就越多。这就是香农的观点:信息的精华在于其“不可能性”。
冯·诺依曼告诉香农如果采用“熵”这个词,将让别人无力质疑,因为没有人真正了解“熵”的含义。冯·诺依曼的建议并不完全是随口一说。物理学中熵的方程式形式和香农理论中信息的方程式形式一致(都是概率测度的对数)。
罗伯特·法诺说:“我不喜欢信息论(information theory)这种叫法,克劳德也不喜欢。”但事实证明人们对“信息”这个词实在太着迷,因此连信息内容的概念也用信息这个词来表示了。
香农的前辈们想要解决的问题是:信息中的“物质”,也就是不能被去除的必要部分是什么?大多数人认为是信息的“含义”。除了“含义”以外,信息中的任何东西都可以去掉。如果没有含义,那么也就没有通信的必要了。
有一个非常重要www.99lib.net的方法,可以使光纤电缆(或者任何通信通道)与水管区别开来。水不能被压缩,至少在家庭管道中的压力下不会压缩太多。一加仑水总是占据一加仑水所需的水管。你无法为了在同样的水管里放更多的水而将一加仑水压缩成一品脱。信息则不同,将信息缩短或者压缩而又不改变信息的意义通常是很容易做到的。
在1939年写给范内瓦·布什的一封信中,香农写道:“我断断续续地一直在研究分析信息传递通用系统的一些基本属性,其中包括电话、收音机、电视、电报等。”这封信中的描述正是信息论的开端。正如香农最终所意识到的,他的通信理论和赌徒的覆灭问题之间居然有着出乎意料的联系。
前阵子,一家电话公司的广告中向人们展示了由于手机噪音而引起的诙谐的误会。一个农场主打电话订购200头牛(oxen)。由于音质不好,对方没有听清,他最后收到200只达克斯猎狗(dachshund)——猎狗根本无法拉犁耕地。还有一个妻子给上班的丈夫打电话,让他回家时带瓶洗发水(shampoo),结果他带回来一头杀人鲸(shamu)!
这些压缩项目的成功说明信息就像海绵——大部分都是“空气”,只有少量“物质”。只要你保存好其中的物质,就可以将空气挤出去。
与陌生人或者不了解你的文化的人说话时使99lib•net用简略的表达方式是非常不明智的。当传达的是无法预料的信息时,即使接收者是自己的配偶,简明的表达方式也是行不通的。
普林斯顿高等研究院的约翰·冯·诺依曼建议香农采用“熵”(entropy)这个词。“熵”是一个物理学术语,宽泛地讲就是表示随机性、无序性或者不确定性程度的函数。熵的概念源自蒸汽机的研究。据了解,要想将所有随机热能都转化成有用的能量是不可能的。蒸汽机运行时需要有温度差(热蒸汽将活塞推向冷却空气)。随着时间的变化,温度差会渐渐消失,蒸汽机便会停止工作。物理学家将其描述为熵的增加。著名的热力学第二定律中说,宇宙的熵值一直在增加。事物会停止运动、分裂,然后殆尽。
或许我们还没意识到,在理解这些广告的幽默之处时,我们其实已经认同了香农的观点。试试分析一下杀人鲸广告中发生的事情:⑴妻子说“买瓶洗发水”。⑵丈夫听成了“买头杀人鲸”。⑶丈夫结束通话,说了声再见,然后回家路上买了一头杀人鲸。
香农意识到这个领域应该重新整合。他显然是在没有布什辅导的情况下,而且是在为贝尔实验室工作之前就已经开始了这个课题的研究,否则这项研究将会为AT&T公司创造明显的经济价值。
如果把含义从香农的理论中去除,那么存在于每条信息中不能压缩的物质到底指的是什么呢?香农的结九九藏书网论是这种物质可以用统计学术语来表述。这种物质只与信息符号的不可预知程度有关。
香农采纳了冯·诺依曼的建议。他既采用了“熵”这个词,也采用了这个词常用的代数符号“H”。后来香农给自己在马萨诸塞州的家起名叫“熵之屋”(Entropy House)——所有看过房子室内的人都会认为这个名字非常贴切。
在香农之前,大多数工程师并没有发现不同的通信媒介之间有什么联系。电视能应用的东西都不能应用到电报中。通信工程师们通过反复实验了解了一些技术层面的知识,这种学习方式和中世纪教堂建造者们了解建筑工程学的一些知识的方式类似。通过反复尝试错误方法,他们了解到哪些是行不通的。
你家里可能有光纤电缆入户,传递电视频道、音乐、网页、语音和所有我们宽泛地称为信息的其他内容。这根电缆就是一个“通信通道”,是传递信息的管道。从某些角度来看,它就像通向你家里的水管一样。无论是管道还是电缆,都已经达到了最大承载量。就水管而言,能够容纳的也就只是水管孔那个宽度的水量。通信通道也是如此,它的容量被称为“带宽”。
香农不是第一个如此给信息下定义的人。他的两个最重要的前辈都是20世纪20年代在贝尔实验室工作的科学家:哈利·奈奎斯特(Harry Nyquist)和拉尔夫·哈特利(Ralph Hartle九_九_藏_书_网y)。香农上大学时曾读过哈特利的论文,高度称赞其“对我的生活有重要的影响”。
19世纪时,电报线是非常珍贵的。因此为了节省带宽,报务员们发报时会将不必要的词、字母和标点符号全部去掉。即使到了今天,手机用户为了节省,发短信的时候也会发送各种缩写词或者代表某些俗语的代码。只要接收者能够明白信息的意思就可以了。
随着这些想法的发展,香农需要给信息中这些不可压缩的物质起个名字。奈奎斯特曾用“情报”(intelligence)来表示,哈特利用的是“信息”(information)。在早期的论文中,香农更倾向于奈奎斯特的用词。“情报”暗含军事情报含义,正好符合这项与密码有关的研究工作。“情报”还暗指“含义”,然而,香农的理论恰恰于含义无关。
一个特别强大的信息压缩方式就是给信息编码。移动电话和网络连接都能自动编码,不需要我们考虑。一个好的编码程序能够极大地压缩信息,比一些缩略词的压缩效果好很多。
你可以把信息比作橘子汁。巴西的橘子汁生产商将果汁制成浓缩原浆,然后将浓缩原浆运到美国,节省了不少运费。最后,美国的消费者在浓缩原浆中加入水,混合成大约和生产商最初生产的果汁同等浓度。有效地发送信息也需要压缩和重组的过程。当然,信息和果汁一样,问题在于传递过程中是否丢失了某些微妙的东西。
更多内容...
上一页