2.1.1 离散变量的自信息量_信息论与编码原理-QQ阅读中文都市网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

2.1.1 离散变量的自信息量

定义2-1 单符号离散信源的数学模型用离散型概率空间表示为

其中p(xi)满足

式中，X表示信源输出消息的整体，xi表示某个消息，p(xi)表示消息xi出现的概率。n是信源可能输出的消息数，信源可能输出的消息数可以是有限个，也可以是可数无限个，通常是有限个，信源每次输出其中的一个消息。

信源发出的消息是随机的，在没有收到消息之前，收信者不能确定信源发出的是什么消息。只有当收信者收到通过信道传输过来的消息后，才能消除不确定性并获得信息。

1. 自信息量

定义 2-2 一个随机事件发生某一结果后所带来的信息量为自信息量，简称自信息。定义为其发生概率对数的负值。若随机事件发生xi的概率为p(xi)，那么它的自信息量为

I(xi)代表两种含义：在事件xi发生以前，表示事件xi发生的不确定性的大小；在事件xi发生以后，表示事件xi所含有或所能提供的信息量。

自信息量的单位由对数的底来决定：

① 若以2为底，则单位为比特（bit，binary unit）；

② 若以e为底，则单位为奈特（nat，nature unit）；

③ 若以10为底，则单位为哈特（hat，hartley unit），这是由Hartley首先采用的；

④ 若以r为底，则为r进制单位。

应用换底公式log2x=logrx/logr2，r可为e或10，可得到它们之间的关系为：

1 nat=log2e=1.443 bit，1 hat=log210=3.322 bit

比较常用的为log2x=1.443 lnx，可用自然对数来计算bit单位的信息量。

比特是信息论中常用的信息量单位，为了书写简洁，可把底数2省略不写；理论推导中或用于连续信源时用以e为底的对数比较方便；工程上用以10为底的对数较方便。

容易证明，自信息量具有下列性质：

（1）I(xi)是非负值

由于0≤p(xi)≤1，根据对数的性质，log2p(xi)为负值，所以-log2p(xi)为非负值。

（2）当p(xi)=1时，I(xi)=0

概率为1的确定事件，其自信息量为0，即不含有任何信息量，发生以后也不会给人以任何信息量。

（3）当p(xi)=0时，I(xi)=∞

概率为0的不可能事件一旦发生，产生的信息量非常大。

（4）I(xi)是p(xi)的单调递减函数

p(xi)取值于[0, 1]，所以1/p(xi)≥1，它随着p(xi)的增大而减小。根据对数性质可以看出I(xi)=log2[1/p(xi)]随着p(xi)的增大而减小。小概率事件所包含的不确定性大，其自信息量大，一旦出现必然使人感到意外；出现概率大的随机事件所包含的不确定性小，是预料之中的事件，其自信息量小。即使发生，也没什么信息量。