Benford定律在社会学以及自然科学领域中都有着广泛的应用。如果一个数据库能够被看作是符合Benford定律的,则可以通过检验首位数字相对于同类实际数据的合理性进行检验。这种方法已经被广泛的应用于检测会计以及财务报表等统计中的虚假情况和伪造数据以及某些科学实验的伪造虚假数据等。
在许多看似毫无联系的自然数据中都可以找到Benford定律的踪迹,比如街道住址、微观粒子的重量、湖泊面积、河流长度、 衰变半衰期、生物存活率等等 ,尽管也存在着许多不符合Benford 定律的分布。在三大物理统计规律中均能找到Benford定律的踪迹。在粒子物理学领域,Benford定律同样成立。北京大学的马伯强等人也系统地对Benford定律在粒子物理学中的应用进行了研究,他们发现介子与重子的首位数字分布情况满足Benford 定理 ;微观领域中的强子(介子与重子)宽度同样遵守Benford 分布 。
已经有许多有关Benford定律在核衰变半衰期上的应用,如Buck等人对该定律与 衰变半衰期的关系进行了研究 ,南京大学任中洲等在 衰变半衰期的首位数分布方面也做出了相应的贡献 。然而目前为止,还不能先验地判断某类数据是否符合Benford 定律,只有通过细致的研究与精确的统计后才能得到结论。如何对Benford定律在物理学上的应用有更好的理解,研究首位数字在物理量中分布的具体规律,仍然需要科学家们更多的研究。
1.1 本福特定律的概念
一组随机数的首位数字存在以下规律:数字越小出现的机率越高。在十进制下数字1出现的概率接近总数字的31%,2出现的概率约为18%,依次类推逐渐减小,9出现的概率不到5%。这就是Benford定律的概念,同时它也有应用条件:1.必须是随机数据;2.不可以是经过人为处理的数据。以十进制下的情况为例:一组平均增长的数据,开始时的增长速度较慢,由最初的数字a增长到另一个数字a+1起首的数的时间,必然比a+1起首的数增长到a+2的时间长,因而出现机率更高。从1开始数数字,1,2,3,...,9,从这点终结的话,每个数起首的机率相同;但9之后的两位数10至19,以1起首的数又高于其他数了。在下一堆以9起首的数出现之前,必然经过一堆以2,3,4,...,8起首的数。如果这种数法有一个随机的终点,则以1起首的数出现概率一般都比9大 。
Benford定律在十进制下的数学表达式为 (1)
其中d=1,2,3,……,9为首位数字,p为这个数字出现的概率。
Benford定律在被改写为10以外的其它数字为底的形式时同样有效。因此在一般形式下也可以写为
(2)
自从Benford定律被发现以后,在数学意义上还未被完全理解。Simon.Newcomb提出了一个较为简单的解释 ,他的观点是这样的:任意一个正的实数都能被写成为 的形式,其中c为一个整数,s为一个[0,1)区间上的小数。在整数c发生变化的情况下只有小数点发生改变,对 的首位数字没有影响,所以只有小数s对结果存在影响。
1.2 本福特定律的数学性质
Benford 定律之所以能引起科学界广泛的关注,是因为它有着深刻的数学与物理意义。
1.Benford定律的首n位数形式
Benford定理预言,前n位数分别为 的概率为 本福特定律在核数据中的应用(2):http://www.youerw.com/wuli/lunwen_21292.html