・ポアソン分布って何?
・ポアソン分布と二項分布の関係を知りたい
・ポアソン分布の期待値と分散はなぜ一致するの?
こんな疑問を解決します。
本記事では、「ポアソン分布とは何か?」からはじめ、ポアソン分布のグラフ、導出方法、二項分布との関係、期待値と分散、例題の解説など、ポアソン分布の重要ポイントをすべて解説します。
※スマホでご覧になる場合は、途中から画面を横向きにしてください
ちなみに、ポアソン分布は数学検定1級でもときどき出題されます。
実は私が受けた時もポアソン分布が出題されました!
数学検定1級を目指している方は数学検定1級対策(26記事)をまとめた、次のページも参考にしてみてください。
✔︎本記事の内容
・ポアソン分布とは
・ポアソン分布の式とグラフ
・ポアソン分布に関する例題
・二項分布からポアソン分布を導く方法
・ポアソン分布の期待値と分散の導き方
盛り沢山な内容ですが、ポアソン分布の重要ポイントは一通り押さえてあります。
本記事の最後では、ポアソン分布を学ぶときにおすすめの参考書もご紹介していますので、ぜひ最後までご覧ください。
それでは、「ポアソン分布とは何か」から解説していきます!
ポアソン分布とは
ポアソン分布は,二項分布\(B(n,\; p)\)において,確率\(p\)が非常に小さく,試行回数\(n\)が大きい場合の近似として用いられる分布で,フランスの数の数学者ポアソン(S.D.Poisson, 1781~1840年)によって考案されました。
ポアソン分布は主に「めったに起こらない確率」を計算する際に用いられています。
例を挙げておきます。
【ポアソン分布が用いられる例】
・工場の不良品の発生数
・ある交差点で起こる交通事故の件数
・火災の発生件数
・1日にかかってくる電話の回数
・破産件数
このように、ある一定の時間や期間に、わずかな回数しか起こらない確率を計算する際、用いられています。
ポアソン分布の式
ポアソン分布とその式は以下の通りです。
与えられた時間中に平均\(\lambda\)回起こる事象が,ちょうど\(k\)回起こる確率\(P(X=k)\)が\[ P(X=k)=e^{-\lambda}\frac{\lambda^k}{k!} \quad (k=0,\; 1,\; 2,\; \cdots )\]
を満たすとき,確率変数\( X\) は平均\(\lambda\)のポアソン分布に従うという
ここで\(e\)はネイピア数(自然対数の底)とよばれる数で,\(e=2.718\cdots \)です
「与えられた時間」は「1時間」でも「1日」でも「1年間」でも構いません。
なお、\(X\)がポアソン分布に従うことを,\(X\)~\(Po(\lambda)\)と表します。
Poisson(ポアソン)の先頭2文字が使われているので覚えやすいですね。
この式は、例えば「ある人が1年間に平均\( 2 \)回、風邪を引くということがわかっているときに、今年1年間で風邪を3回引いてしまう確率を求める」ようなケースで用いられます。
ポアソン分布の具体例(かかってくる電話の回数)
それでは、具体例でポアソン分布を考えていきましょう。
【例】
ある会社では1時間に平均3回の電話がかかってくる。今から1時間の間に電話がかかってくる回数\(X\)がポアソン分布に従うとすると,\(\lambda =3\)を代入して、\(X\)の確率分布は次の表のようになる。
\begin{array}{|c|cccccc|}\hline
X & 0 & 1 & 2 & \cdots & k & \cdots \\\hline
P & e^{-3}\displaystyle\frac{3^0}{0!} & e^{-3}\displaystyle\frac{3^1}{1!}& e^{-3}\displaystyle\frac{3^2}{2!} & \cdots & e^{-3}\;\displaystyle\frac{3^k}{k!}& \cdots \\\hline
\end{array}
この確率分布をポアソン分布といい,\(Po(3)\)で表します.
上の表の値を具体的に計算してみると次のようになります。
\begin{array}{|c|cccccc|}\hline
X & 0 & 1 & 2 & 3 & 4 & \cdots \\\hline
P & 0.0497 & 0.1493 & 0.2240 & 0.2240 & 0.1680 & \cdots \\\hline
\end{array}
グラフで示すとさらに分かりやすくなります。
この結果から,1時間にかかってくる電話の回数は2回または3回である確率が最も高く、それ以上だと回数が多くなるにつれて減少していくことがわかります。
今回のケースでは,1時間に9回とか10回電話がかかってくるケースは非常にまれであることがグラフからもわかりますね!
このような分布がポアソン分布です。
ポアソン分布のグラフ
先ほどの例では\(\lambda =3\)のポアソン分布\(Po(3)\)のグラフを示しました。
この例でわかるように、ポアソン分布は1つのパラメータ\(\lambda\)によって定まるという特徴があります。
参考として\(\lambda =1,\; 3,\; 7\)の場合のポアソン分布\(Po(1),\; Po(3),\; Po(7)\)を示しておきます。
上のグラフからもわかるように、ポアソン分布には、\(\lambda\)の値が大きくなるにしたがって左右対称のグラフに近づく性質があることが知られています。
ポアソン分布に関する例題
それでは2つ例題をご紹介します。
どちらも、起こる回数\(X\)がポアソン分布に従うとして、確率を求めていきます。
【例題1】
Aさんのスマホには1日平均2件のメールが届く。1日に届くメールの件数を\(X\)とし,\(X\)は平均\(\lambda =2\)のポアソン分布\(Po(2)\)に従うものとする。このとき,1日に届くメールの件数が3件である確率を求めよ。
【解答】
ポアソン分布の式で\(\lambda =2\)の場合なので
\[ P(X=k)=e^{-2}\frac{2^k}{k!} \]
となる。ここで、1日にメールが3件届く確率\(P(X=3)\)は、上の式に\(k=3\)を代入して
\begin{align*}
P(X=3)&=e^{-2}\frac{2^3}{3!}\\
&≒ 0.1804
\end{align*}
(答) 約18.0%
【例題2】
あるケーキ屋では,1時間当たり平均3個のケーキが売れる。1時間に売れるケーキの個数を\(X\)とし、\(X\)は平均\(\lambda =3\)のポアソン分布\(Po(3)\)に従うものとする。このとき,1時間に5個以上のケーキが売れる確率を求めよ。
【解答】
ポアソン分布の式で\(\lambda =3\)の場合なので
\[ P(X=k)=e^{-3}\frac{3^k}{k!} \]
となる。ここで、1時間に5個以上のケーキが売れる確率\(P(X\geq 5)\)を,余事象の確率\(P(X\leq 4)\)を用いて,次のように求める。
\begin{align*}
&P(X\geq 5)\\
&=1-P(X\leq 4)\\
&=1-\{ \!P(X=0)+\!P(X=1)+\!P(X=2)+\!P(X=3)+\!P(X=4)\}\\
&=1-\left( e^{-3}\frac{3^0}{0!} +e^{-3}\frac{3^1}{1!}+e^{-3}\frac{3^2}{2!}
+e^{-3}\frac{3^3}{3!}+e^{-3}\frac{3^4}{4!}\right) \\
&=1-\left(1+3+\frac{9}{2}+\frac{9}{2} +\frac{27}{8}\right) e^{-3}\\
&=1-\frac{131}{8}e^{-3}\\
&≒ 0.1847
\end{align*}
(答) 約18.5%
ポアソン分布を二項分布から導く
【復習】
まず最初に,二項分布とポアソン分布の式(確率関数と呼ぶ)を確認しておきましょう。
二項分布\( B(n,\; p) \)
\[ P(X=k)={}_n{\rm C}_kp^k(1-p)^{n-k} \]
ポアソン分布\( Po(\lambda )\)
\[ P(X=k)=e^{-\lambda}\frac{\lambda^k}{k!} \]
ポアソン分布は二項分布\(B(n,\; p)\)において,確率\(p\)が非常に小さく,試行回数\(n\)が大きい場合の近似として用いられる分布です。
\(np=\lambda (一定)\)の条件で,\(p \to 0\)とすると,\(n\to \infty\)となり、次の式が成り立つことが分かっています(ポアソンの少数の法則と呼ばれています)。
【ポアソンの少数の法則】
\[ \lim _{np=\lambda ,n\to \infty }{}_n{\rm C}_k p^k(1-p)^{n-k}=e^{-\lambda}\frac{\lambda^2}{k!}\]
ここで\(np=\lambda ,n\to \infty \)は\(np=\lambda (一定)\)の条件のもとで\(n\to \infty\)という意味です。
それでは、この「ポアソンの少数の法則」をを証明してみましょう!これが証明できれば、二項分布からポアソン分布が導かれたことになりますね。
今後は簡素化のため\(np=\lambda\)は省略します。
【証明】
\(np=\lambda\)より\(p=\displaystyle\frac{\lambda}{n}\)であるから
\begin{align*}
& {}_n{\rm C}_kp^k(1-p)^{n-k} \\
&=\frac{n!}{k!(n-k)!}\left( \frac{\lambda}{n}\right) ^k
\left( 1-\frac{\lambda}{n}\right)^{n-k} \\
&=\frac{n!}{k!(n-k)!}\cdot \frac{\lambda^k}{n^k}\cdot
\left( 1-\frac{\lambda}{n}\right)^{n-k} \\
&=\frac{\lambda^k}{k!}\cdot \frac{n!}{(n-k)!\;n^k}\cdot
\left( 1-\frac{\lambda}{n}\right)^{n}\!\! \cdot \left( 1-\frac{\lambda}{n}\right)^{-k}\cdots (A)
\end{align*}
ここで
\begin{align*}
\frac{n!}{(n-k)!\;n^k} &=\frac{n(n-1)(n-2)\cdots (n-k+1)}{n^k} \\
&=\frac{n}{n}\cdot \frac{n-1}{n}\cdot \frac{n-2}{n}\cdots \frac{n-k+1}{n}\\
&=1\cdot \left( 1-\frac{1}{n}\right) \cdot \left( 1-\frac{2}{n}\right) \cdots \left( 1-\frac{k-1}{n}\right)\\
&\to 1\; (n\to \infty)\cdots ①
\end{align*}
\(-\displaystyle\frac{\lambda}{n}=h\)とおくと\(n=-\displaystyle\frac{\lambda}{h}\)で,\(n\to\infty\)のとき\(h\to 0\)であるから
\begin{align*}
\left( 1-\frac{\lambda}{n}\right)^n&=(1+h)^{-\frac{\lambda}{h}}\\
&=\left\{ (1+h)^{\frac{1}{h}}\right\}^{-\lambda}\\
&\to e^{-\lambda}\; (h\to 0) \cdots ②
\end{align*}
ここでは \(\displaystyle\lim_{n\to 0}(1+h)^{\frac{1}{h}}=e \)を用いました。
また
\begin{align*}
\left( 1-\frac{\lambda}{n}\right)^{-k}\to 1\; (n\to \infty) \cdots ③
\end{align*}
①②③を\( (A)\) 式に適用すると
\begin{align*}
\lim_{n\to\infty} {}_n{\rm C}_kp^k(1-p)^{n-k}= e^{-\lambda}\frac{\lambda^2}{k!}
\end{align*}
これで証明は終わりです。
二項分布で\( np\)を一定に保ったまま\(n\to\infty\)とすることで,ポアソン分布を導くことができるのです。
ポアソン分布が二項分布の近似になっている具体例
二項分布の極限がポアソン分布であることが証明できました。
ここでは、具体的な例を用いて、ポアソン分布が二項分布のよい近似となっていることを見ていきます。
次の問題を「二項分布」と「ポアソン分布」の2通りの方法で解いてみます。
【例】
ある工場で作られる製品Aは,平均して500個に1個の割合で不良品が発生する。すなわち不良品率は0.2%(0.002)である。ある日,この工場で500個の製品を製造したとき,不良品が2個含まれる確率を求めよ。
不良品率から考えると1日平均1個の不良品が出るはずですが、不良品が2個出てしまう確率を求めてみよ、という問題です。
二項分布で求める
500個の製品Aを作ったときに発生する不良品の個数を\(X\)とすると,\(X\)は二項分布
\(B(500,0.002)\)に従います。
したがって,\(X=2\)となる確率\(P(X=2)\)は
\[ P(X=2)={}_{500}{\rm C}_2 \cdot 0.002^2\cdot (1-0.002)^{500-2}\]
から計算することができて、結果は約0.1841(18.41%)となります。
式を見ていただくと分かるように,二項分布では試行回数\(n\)が大きくなると計算が大変です。
一般には,1回の試行で起こる確率\(p\)が非常に小さ、試行回数\(n\)が十分大きい場合,二項分布は通常用いられません。
このような場合は二項分布のよい近似であるポアソン分布を用います。
それでは、500個の製品Aを作ったときに発生する不良品の個数を\(X\)とし,\(X\)がポアソン分布に従うとして問題を解いてみましょう。
ポアソン分布で求める
試行回数\(n\)が十分大きく,確率\(p\)非常に小さいとき,ポアソン分布の期待値は二項分布の期待値と同じと考えられるので(二項分布の期待値は\(np\))
\[ E(X)=\lambda =np \]
よって
\[ \lambda =np=500\times 0.002=1 \]
このとき、ポアソン分布の確率関数は
\[ P(X=k)=e^{-1}\frac{1 ^k}{k!} \]
となるので,不良品が2個である確率\(P(X=2)\)は\( k=2\)を代入して
\begin{align*}
P(X=2)&=e^{-1}\frac{1 ^2}{2!} \\
&≒0.1839
\end{align*}
となり、約18.39%という結果になりました。
二項分布よりも簡単な計算で確率を求めることができましたね!
計算結果を比べてみると、二項分布を使った場合の確率18.41%にかなり近い結果が得られました。
このように、ポアソン分布は\(p\)が非常に小さく\( n\)が極めて大きい場合の二項分布のよい近似になっています。
ポアソン分布の期待値と分散の導出
ポアソン分布の期待値と分散はつぎのようになります。
【ポアソン分布の期待値と分散】
期待値\( \lambda =np\)
分散\( \sigma^2 =np\)
期待値と分散が一致しています!これは便利ですね。
それでは順に証明していきましょう。
ポアソン分布の期待値の導出
\begin{align*}
E(X)&=\sum _{k=0}^{\infty} kP(X =k)\\
&=\sum _{k=0}^{\infty} k e^{-\lambda}\frac{\lambda^k}{k!}\\
&=\left( 0\cdot \frac{\lambda^0}{0!}+1\cdot \frac{\lambda^1}{1!}+2\cdot \frac{\lambda^2}{2!}+3\cdot \frac{\lambda^3}{3!}+\cdots \right) e^{-\lambda}\\
&=\lambda \left( 1+ \frac{\lambda^1}{1!}+\frac{\lambda^2}{2!}+\frac{\lambda^3}{3!}+\cdots \right) e^{-\lambda}\\
& [ここで e^xのマクローリン展開\\
& e^x=1+ \frac{x^1}{1!}+\frac{x^2}{2!}+\frac{x^3}{3!}+\cdots \\
& において,xを\lambda に変えた次の式を用いる\\
& e^x=1+ \frac{\lambda^1}{1!}+\frac{\lambda^2}{2!}+\frac{\lambda^3}{3!}+\cdots ]\\
&=\lambda e^{\lambda}e^{-\lambda}\\
&=\lambda
\end{align*}
ポアソン分布の分散の導出
分散の計算公式
\[ V(X)=E(X^2)-\{ E(X) \}^2 \]
を用いるために,まずは\(E(X^2)\)を計算する。
\begin{align*}
E(X^2)&=\sum _{k=0}^{\infty} k^2P(X =k)\\
&=\sum _{k=0}^{\infty} k^2 e^{-\lambda}\frac{\lambda^k}{k!}\\
& [ここで k^2=k(k-1)+k より]\\
&=\sum _{k=0}^{\infty} \{ k(k-1)+k\} e^{-\lambda}\frac{\lambda^k}{k!}\\
&=\sum _{k=0}^{\infty} k(k-1) e^{-\lambda}\frac{\lambda^k}{k!}
+\sum _{k=0}^{\infty} k e^{-\lambda}\frac{\lambda^k}{k!}\\
&=\sum _{k=2}^{\infty} k(k-1) e^{-\lambda}\frac{\lambda^k}{k!} +E(X)\\
&=\sum _{k=2}^{\infty} e^{-\lambda}\frac{\lambda^k}{(k-2)!} +\lambda\\
&=\left( \frac{\lambda^2}{0!}+\frac{\lambda^3}{1!}+\frac{\lambda^4}{2!}+\frac{\lambda^5}{3!}+\cdots \right) e^{-\lambda}+\lambda\\
&=\lambda^2\left( 1+ \frac{\lambda^1}{1!}+\frac{\lambda^2}{2!}+\frac{\lambda^3}{3!}+\cdots \right) e^{-\lambda} +\lambda\\
& [ 期待値の計算と同様に,次の式を用いる \\
& e^\lambda=1+ \frac{\lambda^1}{1!}+\frac{\lambda^2}{2!}+\frac{\lambda^3}{3!}+\cdots ]\\
&=\lambda^2 e^{\lambda}e^{-\lambda}+\lambda \\
&=\lambda^2+\lambda
\end{align*}
よって
\begin{align*}
V(X)&=E(X^2)-\{ E(X) \}^2 \\
&=(\lambda^2+\lambda)-\lambda^2\\
&=\lambda
\end{align*}
このように,ポアソン分布の期待値と分散は一致し、ともに\(\lambda\)になることが確認できました。
期待値\( \lambda =np\)
分散\( \sigma^2 =np\)
ある飛行機が1回も重大事故を起こさない確率は?
最後にポアソン分布を用いた次の例題を考えてみましょう。
【例題3】
1回の飛行で重大事故を起こす確率が\(0.0001\)%(0.000001)である飛行機が,10万回飛行したとき,1回も事故を起こさない確率をポアソン分布の確率関数を用いて求めよ。
(解答)
この飛行機が10万回飛行したとき,重大事故を起こす回数を\(X\)とする。
\(X\)期待値\(\lambda\)は\(\lambda =np\)であるから
\[ \lambda =100000\times 0.000001=0.1 \]
これより\(X\)は平均\(\lambda =0.1\)のポアソン分布\(Po(0.1)\)に従うものとする。このとき
\begin{align*}
P(X=k)=e^{-0.1}\frac{0.1^k}{k!}
\end{align*}
となるので,1回も事故を起こさない確率\(P(X=0)\)は
\begin{align*}
P(X=0)&=e^{-0.1}\frac{0.1^0}{0!}\\
&=e^{-0.1}\frac{1}{1}\\
&≒0.9048
\end{align*}
(答)約90.5%
このように,ポアソン分布は「めったに起こらない確率」の計算に用いられます。
今回参考にさせていただいた本
本記事では、ポアソン分布について重要ポイントを解説してきました。
今回参考にさせていただいた本をご紹介します。
この本ではポアソン分布について、かなりのページ数をさいて解説しています。
不良品率の例からはじめて、ポアソン分布の導出や意味まで分かりやすく丁寧に説明されているので、私の一番のおすすめ本です。
ポアソン分布について4ページほどにわたってコンパクトにまとまっている本です。
ポアソン分布を扱っているページ数は少ないですが、確率関数の背景や期待値・分散の導出、例題など重要ポイントがきちんと解説されています。
ちなみに、この本のコラムには興味深い話題がたくさんあります。
ポアソン分布の扱いは少なく、数式の説明もありませんが、二項分布とポアソン分布の比較するための問題などがあり、勉強になります。飛行機事故の問題もこの本で扱っている例題を参考に作成しました。
通称「赤本」と呼ばれている本で、長年愛されている統計学の定番ロングセラー本です。この本はやや難解な印象がありますが、ポアソン分布の部分はそれほど難しくありませんでした。二項分布からポアソン分布を導く際、\(np=\lambda (一定)\)ではなく、\(np \to \lambda \)として解説されています。
左側に解説、右側に数コマのマンガがあり、楽しく統計学を学べる本です。ポアソン分布については触りだけの記述ですが、なぜか印象に残るのが不思議です。初心者向けの本ですが、統計学を一通り勉強したあとに読むと効果的だと感じました。
さいごに
本記事ではポアソン分布の重要ポイントについて解説してきました。
ポアソン分布は,二項分布\(B(n,\; p)\)において,確率\(p\)が非常に小さく,試行回数\(n\)が大きい場合の近似として与えられる分布です。
「不良品の発生数」「ある交差点で1年間に起こる交通事故の件数」「1年間の火災の発生件数」「1日にかかってくる電話の回数」など、めったに起こらない確率や、一定時間に何回か起こる事象の確率を求める際、大活躍してくれるのがポアソン分布です。
本記事にで解説したように、ポアソン分布には興味深い性質がたくさんあります。
- 「二項分布の極限としてポアソン分布が導ける」
- 「期待値\(\lambda\)が大きくなると、グラフは左右対象に近く」
- 「期待値と分散が一致している」
私はこれらの事実を初めて知ったとき、数学の美しさにとても感動しました。みなさんはどうでしたか?
それでは、今回は以上です。
最後までお読みいただきありがとうございました。