发信人: xjzhangxw() 
整理人: bsese(2000-01-07 00:59:43), 站内信件
 | 
 
 
改造后的熵.6.--概念.5.--复杂程度(1)
 
 前面指出每个广义集合都伴有一个分布函数。这里指出利用广义集合的分布函数 都可以求出一个称为复杂程度的特征量。这个量在特定场合与计算机界讲的比特 (或者字节)、信息论中的信息量、信息熵、物理学中的熵是同一个含义。
 1.	把“复杂“定量化
 “复杂”这个词使用的频率很高,小学生都可以理解它。对于这么重要的词汇当 然应当设法让它定量化以发现关于它的定量规律。遗憾的是当今科学界没有一个 公认的定量的计量它的科学方法。这里从广义集合的角度引入复杂程度。后面再 说明它与信息论中计算信息熵的公式对应。
 2.	N个互不相同的个体的复杂程度是 NlogN
 以C表示一个广义集合的内部的各个个体的差异性(即复杂程度),我们规定
 由N个个体组成的广义集合,当其各个个体的标志值不彼此不同时,其复杂程度C 与不相同的个体的总数N的对数即 logN 成正比;
 仿照物理学对广延量的要求,复杂程度还应当与广义集合内的个体总数N 成正比 。
 据此插入一个比例系数k就可以写成等式形式
 C=kNlogN		
 例如由10个颜色不同的球组成的一个广义集合,其复杂程度C=k10log10。规定对 数以2为底,而且k=1时,把计算的复杂程度的单位称为比特(计算机界通用的信 息单位)。于是这个例子的复杂程度为C=10×3.3219=33.219比特
 如果这10个球的颜色都是一个颜色,公式变成了
 C=10log1=0Bit
 这说明清一色的广义集合(个体之间无差别)其复杂程度为零。
 3.广义集合的复杂程度公式
 利用前面的规定很容易推出一般的广义集合的复杂程度公式。可以这么想:
 N个体的标志值都不同的广义集合,其复杂程度是 NlogN ;
 同理,n1个个体的标志值都不同的广义集合,其复杂程度应当是 n1logn1 ;
 如果一个广义集合其N个体由彼此都不同变成了有n1个个体的标志值都一样了。这 表明广义集合的复杂程度减少了。显然
 (现在的复杂程度C)=(原来的复杂程度)-(n1个个体的复杂程度的变化)
 原来的复杂程度是NlogN,所以上式写为
 C= NlogN -[(n1个彼此不同的个体的复杂程度)-(n1个彼此相同的个体的复杂 程度)]
 我们用[(n1个彼此不同的个体的复杂程度)-(n1个彼此相同的个体的复杂程度 )]表示n1个个体的复杂程度的变化,显然是合理的。而根据前面的讨论
 n1个彼此不同的个体的复杂程度=n1logn1
 n1个彼此相同的个体的复杂程度=n1log1=0
 所以C= NlogN-( n1logn1-0)
 仿此,有N的个体的广义集合,不仅有n1个彼此相同还另有n2个彼此相同(又与其 他的不同)、还另有n3个彼此相同(又与其他的不同)…这个广义集合的复杂程 度应当是
 C= NlogN- n1logn1 - n2logn2 - n3logn3…- nklognk
 注意到N=n1+n2+n3+…+nk, 得到
 
 C=-∑nilog(ni/N)	共k项相加
 
 它就是计算广义集合的复杂程度的一般公式。这里的广义集合有N个个体,它有k 个不同的标志值。而每个标志值的个体个数(分布函数值)就是ni。
 对这个复杂程度的公式的进一步说明放到下次再谈。
  -- ※ 来源:.月光软件站 http://www.moon-soft.com.[FROM: 202.100.166.12]
  | 
 
 
 |