贝塔分布和正态分布的关系(关于正态分布和贝塔分布的案例介绍)

本文通过案例介绍了正态分布和贝塔分布的概念。

正态分布

正态分布是一种非常常见的连续概率分布,也叫正态分布,或者根据其早期研究贡献者之一的名字叫高斯分布。正态分布是自然科学和行为科学中定量现象的一种方便模型。

各种心理测试结果和物理现象的观测值,如光子计数,都被发现近似服从正态分布。甚至生活中很多现象的表征结果都符合正态分布的分布规律。虽然这些现象的根本原因往往是未知的,甚至抽样样本的原始总体分布也不服从正态分布,但这个变量的抽样分布均值仍会近似服从正态分布。

正态分布的概率密度函数是一个左右对称的钟形,具体表示为:

因为正态分布是如此普遍,这个公式是如此奇怪,我们打算重温高斯当年的推导过程,但有些细节不会证明得那么严谨,只是给你看看高斯当年是怎么想的。

首先高斯预先假设了以下条件,然后得到了正态分布的连续密度函数。

即误差分布导出的最大似然估计=算术平均值。

来,让让我们用通俗易懂的语言复述整个过程。

贝塔分布

贝塔分布,贝塔分布,简单来说就是一个事件发生概率的概率密度分布。

比如篮球比赛中的三分命中率,就是衡量篮球后卫球员的一个重要指标。通过过去的历史经验,我们知道运动员三分命中率几乎不可能超过40%。如果说老张是一个优秀的,经验丰富的篮球后卫,他在过去历史上的三分命中率是35%,总共10000次出手,3500次命中。请问,新赛季开始,他得到了一个三分球。他出手的概率服从什么分布?

我们必须清楚,这个概率一定不是确定的,而是服从一定的分布。这个概率密度分布函数应该在0.35处最大,并且沿着两侧逐渐减小。

这个概率服从贝塔分布。确切地说,是服从。

还有一个运动员,小张,很年轻,很优秀。他的历史三分命中率是35%,但总投篮次数是1000次,命中次数是350次。请问他新赛季的第一个三分球,命中概率分布是不是和老张一样?

明显不一样!虽然他们的历史投篮命中率是35%,但是我们的直觉是老张比小张更靠谱,老张的概率密度分布第一枪应该比小张高大约是0.35。事实上,我们可以快速利用python中内置的beta统计方法科学图书馆。

让让我们来看看这张图片。

那这是真的。那么贝塔分布的具体表现是什么呢?

我们赢了这里不重复伽马函数和贝塔函数。

需要指出的是,似乎贝塔分布的概率密度函数类似于高斯分布的曲线,其实不然。

再比如,如果老张的孙子也想当运动员,老张算小张历史上一本正经的三分球,而且是5投1中。问他击中下一个球也就是第六个球的概率分布是什么?如果以前是2对5,3对5,4对5呢?

如你所见,贝塔分布和高斯分布的PDF在曲线形状上有很大的区别。hfy