Ⅰ 信息量是怎么计算的
假设我错过了某年的世界杯比赛,现在要去问一个知道比赛结果的朋友“哪支球队最终获得世界杯冠军”?他要求我猜,猜完会告诉我是对还是错,但我每猜一次就要给他一块钱。那么我需要付给他多少钱才能知道谁是冠军?我可以把球队编号,从1到32,然后问“冠军的球队在1-16号中吗?”。假如他告诉我对了,我就问“冠军的球队在1-8号中吗?”。如果他告诉我不对,我就自然就知道冠军队在9-16号中。这样我只需要猜5次就可以知道哪支球队是冠军了。所以,“谁是世界杯冠军”这个问题的答案的信息量只值5块钱。香农用“比特”(bit)来作为信息量的单位。像上边“谁是世界杯冠军”这个问题的答案的信息量是5比特。如果是64支球队,“谁是世界杯冠军”这个问题的答案的信息量就是6比特,因为要多猜一次。
对足球了解的朋友看到这有疑问了,他觉得他不需要5次来猜。因为他知道巴西,西班牙,德国等这些强队夺冠的可能性比日本,韩国等球队大的多。所以他可以先把强队分成一组,剩下的其它队伍一组。然后问冠军是否在夺冠热门组里边。重复这样的过程,根据夺冠的概率对剩下的候选球队分组,直至找到冠军队,这样也许三次或四次就猜出结果了。因此,当每支球队夺冠的可能性(概率)不一样时,“谁是世界杯冠军”这个问题的答案的信息量比5比特少。
香农指出,“谁是世界杯冠军”这个问题的答案的信息量是:
H = -(p1*log(p1) + p2 * log(p2) + ... + p32 * log(32))
其中log是以2为底数的对数,以下本文中的log都是以2为底的对数,下边不再特别说明。
这就是衡量信息量多少的公式,它的单位是比特。之所以称为熵是因为它的定义形式和热力学的熵有很大的相似性。对于一个随机变量X的信息熵的定义公式为:
H(X)=-∑P(xi)logP(xi)
其中xi是随机变量X的可能取值。
更多计算信息量的例子可以看这篇文章:信息怎么衡量多少?
Ⅱ 如何量化人类接触到的信息
量化信息,最基本的学科当然是数学,先援引一段<数学之美>中的看法:
那么究竟每一条信息应该怎样度量呢?
信息是个很抽象的概念。我们常常说信息很多,或者信息较少,但却很难说清楚信息到底有多少。比如一本五十万字的中文书到底有多少信息量。直到 1948 年,香农提出了“信息熵”(shāng) 的概念,才解决了对信息的量化度量问题。
一条信息的信息量大小和它的不确定性有直接的关系。比如说,我们要搞清楚一件非常非常不确定的事,或是我们一无所知的事情,就需要了解大量的信息。相反,如果我们对某件事已经有了较多的了解,我们不需要太多的信息就能把它搞清楚。所以,从这个角度,我们可以认为,信息量的度量就等于不确定性的多少。
那么我们如何量化的度量信息量呢?我们来看一个例子,马上要举行世界杯赛了。大家都很关心谁会是冠军。假如我错过了看世界杯,赛后我问一个知道比赛结果的观众“哪支球队是冠军”? 他不愿意直接告诉我, 而要让我猜,并且我每猜一次,他要收一元钱才肯告诉我是否猜对了,那么我需要付给他多少钱才能知道谁是冠军呢? 我可以把球队编上号,从 1 到 32, 然后提问: “冠军的球队在 1-16 号中吗?” 假如他告诉我猜对了, 我会接着问: “冠军在 1-8 号中吗?” 假如他告诉我猜错了, 我自然知道冠军队在 9-16 中。 这样只需要五次, 我就能知道哪支球队是冠军。所以,谁是世界杯冠军这条消息的信息量只值五块钱。
当然,香农不是用钱,而是用 “比特”(bit)这个概念来度量信息量。 一个比特是一位二进制数,计算机中的一个字节是八个比特。在上面的例子中,这条消息的信息量是五比特。(如果有朝一日有六十四个队进入决赛阶段的比赛,那么“谁世界杯冠军”的信息量就是六比特,因为我们要多猜一次。) 读者可能已经发现, 信息量的比特数和所有可能情况的对数函数 log 有关。 (log32=5, log64=6。)
有些读者此时可能会发现我们实际上可能不需要猜五次就能猜出谁是冠军,因为象巴西、德国、意大利这样的球队得冠军的可能性比日本、美国、韩国等队大的多。因此,我们第一次猜测时不需要把 32 个球队等分成两个组,而可以把少数几个最可能的球队分成一组,把其它队分成另一组。然后我们猜冠军球队是否在那几只热门队中。我们重复这样的过程,根据夺冠概率对剩下的候选球队分组,直到找到冠军队。这样,我们也许三次或四次就猜出结果。因此,当每个球队夺冠的可能性(概率)不等时,“谁世界杯冠军”的信息量的信息量比五比特少。香农指出,它的准确信息量应该是
= -(p1*log p1 + p2 * log p2 + ... +p32 *log p32),
其中,p1,p2 , ...,p32 分别是这 32 个球队夺冠的概率。香农把它称为“信息熵” (Entropy),一般用符号 H 表示,单位是比特。有兴趣的读者可以推算一下当 32 个球队夺冠概率相同时,对应的信息熵等于五比特。有数学基础的读者还可以证明上面公式的值不可能大于五。对于任意一个随机变量 X(比如得冠军的球队),它的熵定义如下:
变量的不确定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大。
有了“熵”这个概念,我们就可以回答本文开始提出的问题,即一本五十万字的中文书平均有多少信息量。我们知道常用的汉字(一级二级国标)大约有 7000 字。假如每个字等概率,那么我们大约需要 13 个比特(即 13 位二进制数)表示一个汉字。但汉字的使用是不平衡的。实际上,前 10% 的汉字占文本的 95% 以上。因此,即使不考虑上下文的相关性,而只考虑每个汉字的独立的概率,那么,每个汉字的信息熵大约也只有 8-9 个比特。如果我们再考虑上下文相关性,每个汉字的信息熵只有5比特左右。所以,一本五十万字的中文书,信息量大约是 250 万比特。如果用一个好的算法压缩一下,整本书可以存成一个 320KB 的文件。如果我们直接用两字节的国标编码存储这本书,大约需要 1MB 大小,是压缩文件的三倍。这两个数量的差距,在信息论中称作“冗余度”(rendancy)。 需要指出的是我们这里讲的 250 万比特是个平均数,同样长度的书,所含的信息量可以差很多。如果一本书重复的内容很多,它的信息量就小,冗余度就大。
不同语言的冗余度差别很大,而汉语在所有语言中冗余度是相对小的。这和人们普遍的认识“汉语是最简洁的语言”是一致的。
再说一下我对该问题的看法
人类通过记忆储存信息。记忆分为三个储存系统,每个系统又是对信息进行加工的一个阶段。
1.感觉记忆:又叫瞬时记忆,在感觉记忆中材料保持的时间很短,约为0.25~2秒
2.短时记忆:是记忆信息保持的时间在一分钟以内的记忆
3.长时记忆:是指记忆信息的保持从一分钟以上直到许多年甚至保持终身的记忆
长时记忆是一个真正的信息库,记忆容量极大,保持的时间长。
所以我们主要研究如何度量长时记忆。
长时记忆主要发生在顶叶,(1)在情感层面上的度量和输入记忆在边缘系统被处理 (2)海马和杏仁核常和气味相联系 (3)程序性记忆、运动过程,通过学习以后可以无意识地进行。 例如行走,骑自行车,跳舞和开车在基底神经节和小脑进行和肌肉感觉以及平衡觉紧密联系 (4)事件记忆、个人经历的储存、自身历史例如,与女朋友的首次见面,被狗咬…在颞叶和顶叶进行(5)内容记忆,有意识的学习所得的数据和事实,例如:"俄罗斯的首都是哪里?" 在颞叶进行。
通过度量颞叶和顶叶神经元之间突触的数量或者海马内与记忆有关物质的含量就可以了。
还有一种方案,就是将神经递质及其传递过程"翻译"成可以用数学处理的信息。至于"翻译"方法,我想可以通过采样转化成由少量"元素"(解释一下,把0和1看作二进制的"元素",A.T.C.G.看作是DNA的"元素")构成的信息。
以上是我个人一点思路,你可以充分发挥想象力,毕竟现在脑科学的发展还在很低的水平。
Ⅲ 一分钟读24个字,一亿个字需要多长时间
一分钟读24个字,那么1小时可以读24*60=1440个字,读一亿个字需要100000000/1440=69444.44小时=2893.5天=7.927年时间。
Ⅳ 一分钟阅读多少字称为速读
看到很多评论在针对20000字每分钟这个阅读速度进行讨论,其实这个阅读速度的人是有的,只是很少,这部分人可能阅读、注意力等上面比常人好很多,就像一些电视节目上面哪些擅长记忆力、逻辑能力超越常人或者对颜色很敏感的人。我们也一样对他们的能力理解不了。
因为不管是阅读、记忆等都算是一种能力,一些人本身有一定天赋,再经过训练。一分钟看20000字我是相信的,当然,只是特例,不是每个人都能达到。
因为我自己有使用这一类的训练工具,结合我自己的训练,我是这样理解的:
1、常人一分钟看200-500字,阅读习惯比较好的,注意力集中的情况下一分钟看600-800字没问题。
2、经过练习,比如:
你现在一分钟看300字,阅读时不逐字阅读、逐字朗读,你的阅读速度就能翻倍,达到600字一分钟。
你如果阅读时有音读、默读习惯,也可以通过练习消除音读,这样阅读速度又能提升100-200,达到800字一分钟。
根据我的练习,练习中还有一些比如“视幅扩展”、“焦点移动”的练习,这些练习只要稍微有一点理解,阅读速度还能提升几百字,达到1200字一分钟。
所以,一分钟看多少字是速读能?我的回答是1500-2000字是常人很容易达到的速读水平。
上图为证:(本人现在一分钟看2000字左右)
Ⅳ 上网一分钟,流量耗了好几mb
这要看你1分钟内收发信息量多少了,看了1分钟的微信和看了1分钟视频是不一样的。
Ⅵ 如果把传输速率定义为单位时间内传送的信息量多少.关于一下几种典型
USB 2.0的理论传输极限是480Mbps[2],但是按照这个速率就没有选项可选了-.-,所以猜测应该认为是普通U盘写数据的6MB/s,即48Mbps;
100M以太网的速率就是100Mbps;
卡车拉硬盘,1000x1000x8/3600=2222Mbps,这个应该是最快的;
MP3在256kbps码率下也平均只有1分钟2MB,所以不会超过0.3Mbps,所以一定是最慢的。
Ⅶ 新闻联播的语速是多少
《新闻联播》语速是在每分钟290到300字左右。
语速快慢具有相对性。正常情况下使用汉语表达意义和传播信息,语速约为240个音节每分钟,广播电视新闻播音的语速是在每分钟300 字左右。
来自美国纽约的54岁女子Fran Capo是吉尼斯世界纪录中语速最快的女子,曾两次打破吉尼斯“快嘴”记录,她能在一分钟内说出超过600个单词,平均每秒能说大概11个词。
加拿大人西恩·夏农,在1995年以23.8秒背诵完《哈姆雷特》中“生还是死”的独白,入选《吉尼斯世界纪录大全》。
2015年,我国相声演员方清平在BTV春晚《语速达人》节目中以20.5秒狂飙183个字超音速演绎《木兰辞》,登上了《吉尼斯世界纪录》,刷新了之前由西恩·夏农等人创造的纪录。
(7)一分钟信息量多少扩展阅读:
个体的语速受社会文化、社会环境、个人思维和表达能力等方面的限制。据统计,中央电视台部分新闻播音员语每分钟播音字数如下:邢质斌329,张宏民350,李瑞英265,李修平343,罗京280,徐俐340。
《新闻联播》是中国面向世界的一个重要的新闻窗口,因此对主持人的要求也非常苛刻。以前中央人民广播电台的规定,是播音员要在1分钟之内念完180个字,而现在《新闻联播》随着信息量增大,一分钟的要求是300个字。
为《新闻联播》配音更多地向‘说’新闻的方向靠拢,声音要和画面贴合。另外,语言的节奏也与广播不太一样,需要更快、更紧凑。把声音作弱化处理,配合画面提高完整性。总结起来,就是提语速(快)、降语调(稳)、贴画面(准)。
Ⅷ 在微信上发送信息时有没有信息量大小的限制
微信发送文字消息是没有限制的,发送语音消息只能发送一分钟之内的,发送视频文件是有大小限制的,
Ⅸ 什么是信息量和信息熵,它们的用途有哪些
信息是个很抽象的概念。人们常常说信息很多,或者信息较少,但却很难说清楚信息到底有多少。比如一本五十万字的中文书到底有多少信息量。
信息多少的量度。1928年R.V.L.哈特莱首先提出信息定量化的初步设想,他将消息数的对数定义为信息量。若信源有m种消息,且每个消息是以相等可能产生的,则该信源的信息量可表示为I=logm。但对信息量作深入而系统研究,还是从1948年C.E.仙农的奠基性工作开始的。在信息论中,认为信源输出的消息是随机的。即在未收到消息之前,是不能肯定信源到底发送什么样的消息。而通信的目的也就是要使接收者在接收到消息后,尽可能多的解除接收者对信源所存在的疑义(不定度),因此这个被解除的不定度实际上就是在通信中所要传送的信息量。