心理

当前位置 /首页/完美生活/心理/列表

数字分布定理

数字分布定理

首位数定理,与其名称相反,并非是一个严格的"定理",而是一个在绝大部分自然数据集中都存在的经验统计规律。这个规律由Newcomb S.于1881年首次发现,并由Benford F.于1938年再次独立提出,所以也被称为Benford定理。首位数定理是说,十进制中一个数字的首位数是d(d=1,2,..,9)的概率遵从如下的对数分布,越大的数字出现的概率越低。

简单地说,一堆从实际生活得出的数据中,以1为首位数字的数的出现概率约为总数的三成,接近直觉得出之期望值1/9的3倍。推广来说,越大的数,以它为首几位的数出现的概率就越低。它可用于检查各种数据是否有造假。

首位数定理的"神秘"性在于,虽然绝大部分自然数据集符合首位数定理,人工伪造的数据集大部分却不满足首位数定理,似乎自然界存在某种特殊的数据生产过程。

为了研究小数的数字规律,引进等分布的概念,它并不复杂,但却引人入胜。

等分布又名一致分布(uniform distribution)。

若为中的一个点集,对于任意正整数n

及任意实数,命表示n个点落入区间[0,r)的点的个数,如果

则称点集

中一致分布。

外尔判别法:点集

中一致分布的充要条件是

对于任意一个

中的黎曼可积函数

,都有:

外尔,德国数学家,给出了另外一个可行的判别法:

点集

中一致分布的充要条件是,对于任意一个

整数h≠0,都有

上面的定义只是数学分析性质的,我们可以对其进行通俗的理解。

所谓的等分布,顾名思义就是说数列

上“等可能”

分布。

TAG标签:定理 分布 #