精华区 [关闭][返回]

当前位置:网易精华区>>讨论区精华>>科学大观>>● 自然科学>>物理学>>改造后的熵——张学文(xjzhangxw)>>改造后的熵 .24.-应用.5.---等权分布

主题:改造后的熵 .24.-应用.5.---等权分布
发信人: xjzhangxw()
整理人: bsese(2000-02-26 09:46:59), 站内信件
改造后的熵 .24.-应用.5.---等权分布
上一讲连同前面的斩乱麻问题研究了分布函数恰为负指数函数形状的广义集合。
后面要分析另外一些形状的分布函数。
本讲讨论等权分布。它是最复杂原理用于离散的情况下的一个例子。也可以通过
它复习拉格朗日方法。
新年时收到了100张有数码(有奖)的贺年明信片。如果关心数码的最后一位(0
,1,..),问在最复杂的情况下,不同的数码的明信片各有多少张?
把100张贺卡看成是一个广义集合。最后一位的数码有0,1,…,9 计10种不同的
值(标志值),把最后一位的值是0,…,9的贺卡的张数分别用m0,m1,m2,…
,m9 表示。显然有
m1+m2+…+m9=100张---(1)
成立。
这个广义集合的复杂程度C,根据前面的定义应当等于
C=-m0[ln(m0/100)]-m1[ln(m1/100)]-…-m9[ln(m9/100)]
欲求复杂程度C的最大值(最复杂),根据本问题中仅有的一个约束即公式(1)
利用前面介绍的拉格朗日方法,我们构造一个新函数F
F=C+K(m1+m2+…+m9-100)
K是一个未知的常数。根据(1),与K相乘的数显然是零,所以复杂程度最大与F
最大是一致的。F现在是各个m的函数。求F最大就是把它对mi求偏微熵(在i=0,
1,…9这10个情况下分别做)并且利用F最大时这些偏微熵等于零的条件,有(参
考拉格朗日方法的介绍)
0=-ln(mi/100)-1+K    (i=0,1,…9)
上面的等式实际有10个(i=0,1,…9),由于各个mi都满足相同的关系,显然要
求各个mi的值相等。利用关系(1),得到
mi=(100/10)=10
即无论i等于1或者2或者3…或者9,mi都等于=10
这个结果的含义是复杂性最大、混乱性最大、无序性最大、熵最大、可能性(概
率)最大的结果是末位数为0或者1或者…或者9的明信片都是10张。即每种末位数
码的明信片占的比例或者说权重(百分比)都相同。用我们的术语说就是标志值
为各个值时的个体的数量(分布函数值)都相同(相等)。我们把分布函数的值
不随标志值而变化的这种分布函数称为等权分布(权字的含义就是比例、比重)

如果用横坐标上的一些孤立的点表示标志值,用纵坐标的长度表示广义集合中该
标志值的个体占的数量(或者权重),那么这个图上的等权分布就是立着的一排
小棍,而这些小棍的长度都相等(由于BBS中无法表示图,我们就没有做这个图)

上面用明信片得奖的数码问题为例引出了等权分布。与前面讨论的斩乱麻问题比
,它们都利用了最复杂原理(让复杂程度最大),但是这里得到的分布函数就不
是负指数型的而是等权的。形成这种差别的原因就是约束条件不同。与斩乱麻问
题比这里少了乱麻的总长度为L(常数)这样一个约束条件。于是得到的分布函数
的形状也就不同了。后面还会看到更多的例子。
分布函数与概率分布常常对应,本分布对应于概率分布中的等概率分布。10个学
生谁会考第1?在没有其他约束(知识)的条件下,我们仅能说每个人考第1的概
率是相同的。没有进一步的知识的情况下,有M种可能结局,我们假设每种结局的
出现概率是相同就是一个明智的选择(出错最少)记得这好象称为拉普拉斯原理

气象观测要求把空气温度测量到小数点后面的1位。而这最后1位显然与空气温度
的随机性有关。如果某观测员的1000次观测中最后1位的数码是5的竟然占了40%,
根据最复杂原理,(与明信片问题一个道理)仅数码5 占10%,而他是40%,显然
有弊!
根据最复杂原理求得的不同的末位码的明信片的数量可能与实际有差别。但是当
收到的明信片的数量越大这个结果越符合实际。瓶子里有10个格子,把10的20次
方(10后面加20个零)个气体分子放到瓶子里。每个格子的分子个数是几乎相等
的可能性大还是有的很多,有的几乎没有分子的可能性大?当然是每个格子里的
分子的个数都相等的可能性最大(否则我们住的房子早就爆炸了!)。统计力学
中推导分子在格子中的个数的公式(即分布函数)的过程与这里的明信片末位码
问题是相同的。在统计力学里这被称为微正则分布。不考虑最复杂原理(熵原理
),把各个状态出现的机会都相等作为一个基本假设也可以搭起统计力学的知识
框架。
我们说的等权分布或者称为等概率分布、微正则分布是最基本最简单的一种分布
。我们定义广义集合的个体时强调每个个体的地位相同,也就是要保证每个个体
在总体中的地位相同(等权)。对广义集合的个体做统计抽样时每个个体被抽中
的概率也就必然相等。计算机里常常提供随机数,不同的随机数的出现的次数也
是尽量使它符合等权分布(等概率分布)。
张学文于2000/2/25

--
※ 来源:.月光软件站 http://www.moon-soft.com.[FROM: 202.100.166.85]

[关闭][返回]