<如何深刻理解二项式分布到泊松分布?-知识大全-龙咔百科
> 知识大全 > 列表
如何深刻理解二项式分布到泊松分布?
时间:2024-12-23 19:54:06
答案

设置参数λ并将其插入公式中之前,让我们暂停一下并提出灵魂拷问。为什么泊松必须发明泊松分布?为什么存在这种分布(他为什么发明这种分布)?何时应使用Poisson进行建模?

预测未来发生的事件数!更正式地说,在固定的时间间隔内,预测给定事件数量的可能性。例如:如果您曾经作为销售人员,则可以将作为售卖的“事件”定义,例如,某个顾客从您那里购买某物(事实是关键时刻,而不仅仅是浏览)。

以下是我在现实生活中如何使用泊松的示例:每周平均有17个人为我的博客点赞。我想预测下周会点赞的人数,因为我每周都会得到这些数字的报酬。下周,有20个人(或10、30、50等)会为博客帖子点赞的概率是多少?

现在,假设我们对泊松分布一无所知。那我们该如何解决这个问题呢?解决此问题的一种方法是从读取次数开始。阅读该博客的每个人都有一定的可能性,他们会真的喜欢和点赞。这是二项式分布的经典场景,因为我们正在计算成功事件(点赞)次数的概率。

二项式随机变量是在Ñ重复试验中成功的次数X的概率,并且我们假设在每个试验中成功的概率p是恒定的。然而,在这里我们只给出了一点信息- 17个点赞/周,这是一个“速度”(每周平均点赞次数#,或x的预期值),我们不知道点赞概率p,也不知道博客访问者的人数n。因此,我们需要更多信息来解决此问题。我们还需要将这种可能性描述为二项式问题吗?我们需要两件事:成功的概率p和试验的次数(访问者)n。

让我们从过去的数据中获取它们。这些是1年的统计数据。共有59k人阅读了我的博客。在59000人中,有888人点赞。因此,每周阅读我的博客的人数(n)为59k / 52 =1134。每周点赞的人数(x)为888/52 = 17。读人/每周(ñ)= 59K / 52 = 1134 赞人/每周(X)=52分之888= 17 成功概率(p):888 / 59k = 0.015 = 1.5%

使用二项式PMF,下周我将获得20个成功(点赞的20个人)的概率是多少?我们只是用二项分布解决了这个问题。那么,泊松是干什么的呢?只有泊松可以做的事情,而二项式做不到的是什么?

a)二项式随机变量是“BI-nary” 0或1分布。在上面的示例中,我们有17点赞/周。这意味着每天有17/7 = 2.4个人点赞/每天,每小时有17 /(7 * 24)= 0.1个人点赞/每小时。如果我们使用二项式随机变量按小时(0.1个人/小时)对成功概率进行建模,那么这意味着大多数小时会获得零点赞,但有些小时会恰好得到1点赞。但是,某些小时也很有可能会超过1点(2、3、5等)。二项式的问题在于它不能在单位时间内包含超过1个事件(在这种情况下,单位时间是1小时)。单位时间只能有0或1个事件。然后,如何将1个小时划分为60分钟,并将单位时间缩短为例如一分钟呢?然后1小时可以包含多个事件。(不过,一分钟将恰好包含1或0个事件。)

现在我们的问题解决了吗?有点儿。但是,如果在那一分钟内,我们得到了多次,该怎么办?(即某人在Twitter上分享了您的博客文章,并且那一刻的流量激增。)然后呢?我们可以将一分钟分为几秒。然后我们的时间单位变成一秒钟,一分钟又可以包含多个事件。但是,这种二进制容器问题将在越来越小的时间单位中始终存在。这个想法是,我们可以通过将单位时间划分为较小的单位来使二项式随机变量处理多个事件。通过使用较小的划分,我们可以使原始单位时间包含一个以下的事件。在数学上,这意味着n→∞。由于我们假设速率是固定的,因此我们必须将p→ 0。否则,n * p(即事件数)将爆炸。使用该限制,单位时间现在是无限的。我们不再需要担心在同一单位时间内发生多个事件。这就是我们推导泊松分布的方式。

b)在二项分布中,应事先知道试验次数(n)。如果使用二项式,则不能仅以该速率(即17 /周)来计算成功概率。您需要“更多信息”(n&p)才能使用二项式PMF。另一方面,泊松分布不需要您知道n或p。我们假设n无限大而p无限小。泊松分布的唯一参数是比率λ(x的期望值)。在现实生活中,仅了解比例(例如即在2pm~4pm期间,我接了3个电话)比了解n&p要容易得多。

让我们从二项式PMF中数学推导Poisson公式。现在您知道每个分量λ^k,k!和e^-λ来的来源。最后,我们只需要证明当n接近无穷大时,前两项n!/(((nk)!* n ^ k))的乘积为1。是1。我们有了泊松公式!现在,维基百科的解释开始变得有意义。将您自己的数据插入公式中,看看P(x)是否对您有意义!以下是两者之间的差异:

注意事项:泊松模型假设a. 每单位时间的平均事件发生率是恒定的。这意味...

推荐
© 2024 龙咔百科