发信人: xjzhangxw()
整理人: (2000-01-07 00:57:12), 站内信件
|
改造后的熵.4.--基本概念--分布函数(2)(1999.7)
前面谈了广义集合和分布函数的含义,指出了任何一个广义集合必然都有一个分 布函数,还初步列举了一些广义集合和分布函数的事例。本讲介绍如何从资料中 求广义集合的分布函数以及分布函数的一些性质。
从观测数据中求分布函数
求广义集合的分布函数的途径有两个。一个是从理论上求其分布函数,一个是对 客观事实做观测和统计计算求出它的分布函数。从理论上求分布函数是理论工作 (如熵原理等)的任务,这些以后再谈。现在介绍从观测事实中得到分布函数的 方法。
求分布函数之前先要弄清楚什么是研究的客观事物(广义集合)、什么是它里面 的(我们关注的)个体以及什么是要研究的标志这三个环节。下一步是明确什么 是本问题中的“不同的标志值的个体各有多少”。求其分布函数就是回答上面的 问题,这道理其实很浅显。
选举是现代政治活动的重要一环,大家对选举的过程也比较熟悉。这里就以它为 例说明统计选票也就是求分布函数。首先明确什么是本问题中的广义集合、个体 、标志和分布函数。下表可以把问题提清楚:
广义集合 个体名称 标志名称 分布函数
有效选票 每张选票 候选人 每位候选人选票数
上面的表说明选举过程中投票以后的统计选票的过程就是求分布函数的过程--求 得不同的候选人各有多少张票。看来求分布函数并不神秘也不难。
是的,我们对统计选票过程很熟悉。最笨的统计方法是列出两个表。第一个表是 原始资料表,它给出了每张选票的原始情况:
选票编号 1 2 3 4 5 6 .. .. .. .. 100
被选举人 A B A D A C A
表里共有100张有效选票,而被选举人仅有A、B、C、D四位。利用这个表统计每个 人的得票时我们中国人的做法是在黑板上用正字的多少表示每个候选人的票数( 正字五笔,每笔代表一张选票,每有一张选票加一笔)。于是就有第二个表。例 如它是如下的表:
被选举人 A B C D 标志值
得票数 75 15 10 5 体数量
得票百分比 75% 15% 10% 5% 合计为100%
这个表既是选举结果也是我们的分布函数。它说明了不同的候选人各有多少张票 。而A的票最多,它当选了。
概括地说从资料中求分布函数的步骤是:
1.明确什么是本问题中的广义集合、个体、标志和分布函数的格式
2.把原始资料(每个个体的标志值)整理成表
3.利用表中的原始资料再统计成如下的表:
标志值 x1 x2 x3 .. xi .. xk
个体数量 n1 n2 n3 .. ni .. nk
这个表就给出了不同的标志值的个体各有多少,它就是你要的分布函数。利用数 学的技巧我们还可以把它变成一个曲线或者一个解析公式--这些在这里就不细谈 了。
对于其他的广义集合从资料中求分布函数的道理与此相同,但是实际统计工作可 能要复杂的多(也有更多的窍门)。例如要求不同年龄的中国人各有多少就要用 全国的人口调查资料,这里就不是100个个体而是12亿个个体了,其中的困难可想 而知。在我们写的《熵气象学》一书中(1992年气象出版社)有更多的气象上的 比较复杂的统计分布函数的例子,这里就不一一介绍了。只要读者明确了问题, 而且有实际资料,我们相信你一定可以得到一个统计出分布函数的方法来。
从资料中得到一个分布函数相当与找到了一个经验公式。这本身就是有相当的科 学价值。我们现在有很多工程师,其中很多都可以使用一些书本上现成的公式。 但是自己从客观观测数据中发现一个经验公式的工程师并不多。你有了广义集合 的概念,知道每个广义集合必然伴有一个分布函数,这就为广大的工程师们发现 新的公式(分布函数)提供了清楚的思路。我想读者会从本思路中得到启发从而 自己发现公式(经验方程)。我向读了本文并且利用这里的思路发现了新的经验 方程的读者予致祝贺。
分布函数的一些性质
1.由于分布函数中的函数值(常以Y表示)的物理含义是本广义集合内的与某个标 志值对应的个体的个数,而个体的个数不可能是负数或者有两个值,所以分布函 数的函数值都是单值的正数而没有负数。在前面的例子中就是每个候选人的得票 数不会是负值。
2.每个个体必然有一个确定的标志值,所以各个标志值对应的函数值(即对应的 个体的个数)的合计必然等于本广义集合的含有的个体的总量。在前面的例子中 就是四位候选人的得票总数应当等于有效票的总数100。
3.如果用个体的总数去除每个函数值,我们当然得到了一串新数,它是相对的函 数值,或者说的该种标志值在总体中占的比例(权重、百分比)。我们把这一串 新数称为相对分布函数。在前面的例子中表统计表的最后一行就是相对分布函数 值。显然相对分布函数的合计值应当等于1(在概率论中这被称为归一性)。
4.相对分布函数与概率分布函数是等价的。现在一些城市的天气预告有个新用语 :降水概率。它的含义是发生降水的可能性的大小。如果降水的概率是1(100%) ,就是必然发生降水。在数学里专门有一门学问叫概率论,概率分布函数是它的 重要研究内容。为了避免过多的专业名词,这里仅指出相对分布函数与概率论中 的概率分布函数是等价的(相同的),进一步的说明请参考:
[1]张学文、马力,熵气象学,北京:气象出版社,1992
[2]张学文,相对分布函数与气象熵,气象学报,1986,44:214-219
5.分布函数可以是连续函数也可以是离散的函数。在前面的例子中候选人是标志 ,而各个候选人(标志值)都是单个的个人。这对应于标志值仅能离散的取值。 其分布函数也是一些离散(分立)的数。但是在科学上我们将会看到很多事例其 标志值是连续变量。这时它们的分布函数很可能也是连续函数。例如乌鲁木齐冬 季各个时刻的温度(标志)是个广义集合,人们问不同的温度出现的机会(概率 )如何?这就是问一个关于它的分布函数。这里温度是可以连续变化的,其分布 函数也是个连续函数(可能是个正态分布函数)。在数学里对连续函数有更多的 处理技巧,有时还可以用到微分和积分--这些我们先点到为止以后要用时再补充 。
-- ※ 来源:.月光软件站 http://www.moon-soft.com.[FROM: 202.100.165.155]
|
|