精华区 [关闭][返回]

当前位置:网易精华区>>讨论区精华>>科学大观>>● 自然科学>>物理学>>改造后的熵——张学文(xjzhangxw)>>改造后的熵 .31.-应用.12.--- 汉字笔画的

主题:改造后的熵 .31.-应用.12.--- 汉字笔画的
发信人: xjzhangxw()
整理人: (2000-04-27 01:36:28), 站内信件
改造后的熵 .31.-应用.12.--- 汉字笔画的数学美
介绍幂分布时提到过英文文献中的单词有的由少数字母组成,有的就用了很多字
母。研究发现使用频率最高的英文词汇是字母数量最少的单词(如a,the等)。
频率与词汇用的字母的个数恰好是反比例关系,它是幂分布的一种。我们也可以
说这是英文的数学之美的一个表现。
中国的每个汉字占的面积都相同,它就没有字母多的汉字与字母少的汉字问题。
但是汉字有的笔画多,有的笔画少。于是我就提出了不同笔画汉字各有多少的问
题。它符合分布函数问题的引出模型。它是汉字与英文词汇类似又有区别的问题

结合对对数正态分布的介绍,我猜想汉字笔画多少与该笔画的汉字的数量之间可
能是对数正态关系。于是我就利用辞海中的大量汉字资料做统计分析,发现汉字
的笔画x与该笔画的汉字数量y确实符合下面对数正态公式。

y=16262[1/(x0.3827√2π)]exp{[-(lnx-2.47)^2]/2(0.3827)^2}

上面公式说明汉字笔画的自然对数的平均值为2.47,其标准差为0.3827。汉字的
总个数是16262(辞海中给的简体和繁体)。
你把笔画值带入上式经过计算就得到了y值,它就是该笔画的汉字的数量。
体现公式与实际一致性的最好办法是做两个直方图,一是实际汉字的笔画与汉字
数量的关系一是理论笔画与汉字数量的关系。我们做的图显示出它们都是笔画在
9-14笔的汉字最多,笔画少和笔画多的汉字都比较少,而且两组直方图拟合的很
好(限于本BBS不能显示图,有兴趣者可以到北京大学哲学系的网页上的在线阅读
中找“汉字的数学美”哪篇我写的文章,以后我也要在我的网页上公布它)。
多少人在欣赏书法家写的汉字的体型美,多少人赞叹数学公式之美,把汉字的笔
画数与该笔画的汉字的个数联系在一起的竟然是一个光滑的可以用解析式表达的
数学公式,这就是汉字的数学之美了。
我不是文字学家也不是数学家,我找到(其实首先是想到!)这个公式是基于下
面的猜想
1. 汉字是自发形成的,其笔画应当自动得到最复杂程度,即笔画与个数发关系应
当使其复杂程度最大。
2. 笔画少的汉字和笔画特别多的汉字都比较少,笔画数居中的汉字最多,这意味
着笔画与个数的关系类似于正态分布,即可能某种标准差是常数(一种约束)。

3. 也许汉字的相对个数(数学上可以用dx/x表示--参考我们对幂分布的介绍)服
从正态分布--把笔画取对数以后作为变量考虑--对于另外一个约束。
以上三点恰好对应着上一讲计算的对数正态分布的两个约束条件和一个最复杂原
理。
没有想到资料出来以后的实际分析显示它恰好符合对数正态分布。我又一次感到
最复杂原理在揭示客观规律方面的力量。欢迎大家利用这种思路自己发现关于新
对象的分布函数(我正在分析着英文词汇中的类似问题:不同英文字母的数量的
英文词汇各有多少)
张学文2000,4,24

--
※ 来源:.月光软件站 http://www.moon-soft.com.[FROM: 202.100.166.85]

[关闭][返回]