二項分布の期待値が\(np\),分散が\(npq\)になる理由を知りたい.どうやって導くの?
こんな悩みを解決します。
※スマホでご覧になる場合は,途中から画面を横向きにしてください.
二項分布\(B\left( n,\; p\right)\)の期待値と分散は
期待値\(np\)
分散\(npq\)
と非常にシンプルな式で表されます.
なぜこのような式になるのでしょうか?
本記事では,二項分布の期待値が\(np\),分散が\(npq\)となる理由を次の3通りの方法で証明します.
方法1 公式\(k{}_nC_k=n{}_{n-1}C_{k-1}\)を利用
方法2 微分の利用
方法3 各試行ごとに新しく確率変数\(X_k\)を導入する(画期的方法)
方法1
しっかりと定義から証明していく方法で,コンビネーションの公式を利用します。正攻法ですが,式変形は大変です.でも,公式が導けたときの喜びはひとしお.
方法2
やや技巧的な方法ですが,方法1より簡単に,二項定理の期待値と分散を求めることができます.かっこいい方法です!
方法3
考え方を全く変えた画期的な方法です.各試行に新しい確率変数を導入します.高校の教科書などはこの方法で解説しているものがほとんどです.
それではまず,二項分布もとになっているベルヌーイ試行から確認していきましょう.
ベルヌーイ試行とは
二項分布を理解するにはまず,ベルヌーイ試行を理解しておく必要があります.
ベルヌーイ試行とは,結果が「成功か失敗」「表か裏」「勝ちか負け」のように二者択一になる独立な試行のことです.
(例)
・コインを投げたときに「表が出るか」「裏が出るか」
・サイコロを振って「1の目が出るか」「1以外の目が出るか」
・視聴率調査で「ある番組を見ているか」「見ていないか」
このような,試行の結果が二者択一である試行は身の回りにたくさんありますよね。
ベルヌーイ試行とは
「成功か失敗など,結果が二者択一である試行のこと」
二項分布はこのベルヌーイ試行がもとになっていますので,しっかりと覚えておきましょう.
反復試行の確率とは
二項分布を理解するためにはもう一つ,反復試行の確率についての知識も必要です.
反復試行とはある試行を複数回繰り返す試行のことで,その確率は以下のようになります.
1回の試行で,事象\(A\)が起こる確率が\(p\)であるとする.この試行を\(n\)回くり返す反復試行において,\(A\)がちょうど\(k\)回起こる確率は
\[ {}_n{\rm C}_kp^kq^{n-k}\]
ただし\(q=1-p\)
簡単な例を挙げておきます
1個のさいころをくり返し3回投げたとき,1の目が2回出る確率は\[ {}_3C_2\left( \frac{1}{6}\right) ^2 \left( \frac{5}{6}\right) =\frac{5}{27}\]
\( n=3,\; k=2,\; p=\displaystyle\frac{1}{6} \)を公式に代入すれば簡単に求まります.
二項分布とは
成功の確率が\(p\)であるベルヌーイ試行を\(n\)回行ったとき,成功する回数がしたがう確率分布を「二項分布」といい,\(B(n,\; p)\)で表します.
\(X\)が二項分布にしたがうことを「\(X~B(n,\; p)\)」とかくこともあります.
\(B(n,\; p)\)の\(B\)は binomial distribution(二項分布)に由来し,「~」は「したがう」ということを表しています.
これだけだとわかりにくいので,次の具体例で考えてみましょう.
(例)1個のさいころをくり返し3回投げる試行において,1の目が出る回数を\(X\)とすると,\(X=0,\; 1,\; 2,\; 3\)であり,\(X\)の確率分布は次の表のようになります.
\begin{array}{|c||cccc|c|}\hline
X & 0 & 1 & 2 & 3 & 計\\\hline
P & {}_3{\rm C}_0\left(\frac{1}{6}\right)^3& {}_3{\rm C}_1\left( \frac{1}{6} \right)\left( \frac{5}{6} \right)^2 & {}_3{\rm C}_2\left( \frac{1}{6} \right)^2\left( \frac{5}{6} \right) & {}_3{\rm C}_3 \left( \frac{1}{6}\right) ^3 & 1\\\hline
\end{array}
この確率分布を二項分布といい,\(B\left(3,\; \displaystyle\frac{1}{6}\right)\)で表すのです.
一般的には次のように表わされます.
\(n\)回の反復試行において,事象Aの起こる回数を\(X\)とすると,\(X\)の確率分布は次のようになります.
\begin{array}{|c||cccccc|c|}\hline
X& 0 & 1 & \cdots& k & \cdots & n& 計\\\hline
P & {}_n{\rm C}_0q^n & {}_n{\rm C}_1pq^{n-1} & \cdots& {}_n{\rm C}_k p^kq^{n-k} & \cdots & {}_n{\rm C}_np^n & 1 \\\hline
\end{array}
このようにして与えられる確率分布を二項分布といい,\(B(n,\; p)\)で表します.
二項分布は次のように表現することもできます.
確率変数\(X=0,\; 1,\; 2,\; \cdots ,n\)について,それぞれの確率が
\[P(X=k)={}_n{\rm C}_k p^kq^{n-k}\]
\((k=0,\; 1,\; 2,\; \cdots ,n)\)
で表される確率分布を二項分布とよぶ.
二項分布を一言でいうのは難しいですが,次のようにまとめられます.
「二者択一の試行を繰り返し行ったとき,一方の事象が起こる回数の確率分布のこと」
二項分布の期待値と分散の公式
二項分布の期待値,分散は次のように表されることが知られています.
【二項分布の期待値と分散】
確率変数\(X\)が二項分布\(B(n,\; p)\)にしたがうとき
期待値 \(E(X)=np\)
分散 \(V(X)=npq\)
ただし,\(q=1-p\)
どうしてこのようになるのかは後で証明するとして,まずは具体例で実際に期待値と分散を計算してみましょう.
(例)
1個のさいころをくり返し3回投げる試行において,1の目が出る回数を\(X\)とすると,\(X\)は二項分布\(\left( 3,\; \frac{1}{6}\right)\)に従いますので,上の公式より
\[ E(X)=3\times \frac{1}{6} \]
\[ V(X)=3\times \frac{1}{6} \times \frac{5}{6} \]
となります.
簡単ですね!
それでは,本記事のメインである,二項定理の期待値と分散を,次の3通りの方法で証明していきます.
方法1 公式\(k{}_nC_k=n{}_{n-1}C_{k-1}\)を利用
方法2 微分の利用
方法3 各試行ごとに新しく確率変数\(X_k\)を導入する(画期的方法)
方法1と方法2は複雑です.どれか1つだけで知りたい場合は方法3のみお読みください.
それでは順に解説していきます!
方法1 公式\(k{}_n{\rm C}_k=n{}_{n-1}{\rm C}_{k-1}\)を利用
二項係数の重要公式
\(k{}_n{\rm C}_k=n{}_{n-1}{\rm C}_{k-1}\)
を利用して,期待値と分散を定義から求めていきます.
この公式の導き方については以下の記事を参考にしてください.
期待値
期待値の定義は
\[ E(X)=\sum_{k=0}^{n}k\cdot P(X=k) \]
です.ここからスタートしていきます.
\begin{align*}
E(X)&=\sum_{k=0}^{n}k\cdot P(X=k)\\
&=\sum_{k=1}^{n}k{}_n{\rm C}_kp^kq^{n-k}\\
& \left[ 公式k{}_n{\rm C}_k=n{}_{n-1}{\rm C}_{k-1}を利用して\right] \\
&=\sum_{k=1}^{n}n{}_{n-1}{\rm C}_{k-1}p^kq^{n-k}\\
&=np\sum_{k=1}^{n}{}_{n-1}{\rm C}_{k-1}p^{k-1}q^{n-k}\\
& [r=k-1とおくと]\\
&=np\sum_{r=0}^{n-1}{}_{n-1}{\rm C}_{r}p^{r}q^{n-(r+1)}\\
&=np\sum_{r=0}^{n-1}{}_{n-1}{\rm C}_{r}p^{r}q^{(n-1)-r}\\
& \left[ (p+q)^{n-1}=\sum_{r=0}^{n-1}{}_{n-1}{\rm C}_{r}p^{r}q^{(n-1)-r}に注意して \right] \\
&=np(p+q)^{n-1}\\
& [確率の和p+q=1より]\\
&=np\cdot 1^{n-1}\\
&=np
\end{align*}
分散
分散の計算公式
\begin{align*}
V(X)&=E(X^2)-\{ E(X)^2\}
\end{align*}
を使って計算をしてきます.
先ほどの結果から\(E(X)=np\)となることに注意してください.
それではまず\(E(X^2)\)を求めていきます.\(X^2\)の期待値の定義から
\begin{align*}
E(X^2)&=\sum_{k=0}^{n} k^2\cdot P(X=k)\\
&=\sum_{k=0}^{n} k^2\cdot {}_nC_k p^kq^{n-k}\\
& [k^2=k(k-1)+kより]\\
&=\sum_{k=0}^{n} \{ k(k-1)+k\} \cdot {}_nC_k p^kq^{n-k}\\
&=\sum_{k=0}^{n} k(k-1){}_nC_k p^kq^{n-k}+\sum_{k=0}^n k{}_nC_k p^kq^{n-k}\\
&=\sum_{k=2}^{n} (k-1)k{}_nC_k p^kq^{n-k}+E(X)\\
& [k{}_n{\rm C}_k=n{}_{n-1}{\rm C}_{k-1}より]\\
&=\sum_{k=2}^{n} (k-1)n{}_{n-1}C_{k-1} p^kq^{n-k}+np\\
&=\sum_{k=2}^{n} n(k-1){}_{n-1}C_{k-1} p^kq^{n-k}+np\\
& [(k-1){}_{n-1}{\rm C}_{k-1}=(n-1){}_{n-2}{\rm C}_{k-2}より]\\
&=\sum_{k=2}^{n} n (n-1){}_{n-2}{\rm C}_{k-2} p^kq^{n-k}+np\\
&=n(n-1)p^2\sum_{k=2}^{n} {}_{n-2}{\rm C}_{k-2} p^{k-2}q^{n-k}+np\\
& [r=k-2とおく]\\
&=n(n-1)p^2\sum_{r=0}^{n-2} {}_{n-2}{\rm C}_{r} p^rq^{n-(r+2)}+np\\
&=n(n-1)p^2\sum_{r=0}^{n-2} {}_{n-2}{\rm C}_{r} p^rq^{(n-2)-r}+np\\
& [(p+q)^{n-2}=\sum_{r=0}^{n-2} {}_{n-2}{\rm C}_{r} p^rq^{(n-2)-r}に注意すると]\\
&=n(n-1)p^2(p+q)^{n-2}+np\\
& [確率の和p+q=1より]\\
&=n(n-1)p^2\cdot 1^{n-2}+np\\
&=n(n-1)p^2+np
\end{align*}
これで
\[ E(X^2)=n(n-1)p^2+np\]
が成り立つことがわかりました.
この式を分散の計算公式に代入します.
\begin{align*}
V(X)&=E(X^2)-\{ (E(X)\}^2\\
&=n(n-1)p^2+np-(np)^2\\
&=n^2p^2-np^2+np-n^2p^2\\
&=-np^2+np\\
&=np(1-p)\\
&=npq
\end{align*}
このようにして期待値と分散を求めることができました!
分散の計算は結構大変でしたね.
分散の計算公式
\begin{align*}
V(X)&=E(X^2)-\{ E(X)^2\}
\end{align*}
を利用しないで定義から求めていく方法は,たとえば「マセマシリーズの演習統計学」に詳しく解説されていますので,参考にしてみて下さい.
方法2 微分を利用
微分を利用することで,もう少しすっきりと二項定理の期待値と分散を求めることができます.
準備
まず準備として,やや天下り的ですが以下のような二項定理の式を考えます.
\[ (pt+q)^n=\sum_{k=0}^n{}_nC_k (pt)^kq^{n-k} \]
この式の両辺を\(t\)について微分します.
\[ np(pt+q)^{n-1}=\sum_{k=0}^n {}_nC_k p^kq^{n-k} \cdot kt^{k-1}・・・①\]
上の式の両辺をもう一度\(t\)について微分します(ただし\(n\geq 2\)のとき)
\[ n(n-1)p^2(pt+q)^{n-2}=\sum_{k=0}^n{}_nC_k p^kq^{n-k} \cdot k(k-1)t^{k-2}・・・②\]
※この式は\(n=1\)でも成り立ちます.
この①と②の式を用いると期待値と分散が簡単に求まります.
期待値
先ほど準備した①の式
\[ np(pt+q)^{n-1}=\sum_{k=0}^n {}_nC_k p^kq^{n-k} \cdot kt^{k-1}・・・①\]
に\(t=1\)を代入すると
\[ np(p+q)^n=\sum_{k=0}^n){}_nC_k p^kq^{n-k} \]
\(p+q=1\)なので
\[ np=\sum_{k=0}^n{}_nC_k p^kq^{n-k} \]
右辺は\(X\)の期待値の定義そのものなので
\[ E(X)=np \]
簡単に求まりました!
分散
先ほど準備した②の式
\[ n(n-1)p^2(pt+q)^{n-2}=\sum_{k=0}^n{}_nC_k p^kq^{n-k} \cdot k(k-1)t^{k-2}・・・②\]
に\(t=1\)を代入すると
\[ n(n-1)p^2(p+q)^{n-2}=\sum_{k=0}^n{}_nC_k p^kq^{n-k} \cdot k(k-1) \]
\(p+q=1\)なので
\begin{align*}
n(n-1)p^2&=\sum_{k=0}^nk(k-1){}_nC_k p^kq^{n-k} \\
&=\sum_{k=0}^n(k^2-k){}_nC_k p^kq^{n-k} \\
&=\sum_{k=0}^nk^2{}_nC_k p^kq^{n-k} -\sum_{k=0}^nk{}_nC_k p^kq^{n-k}\\
&=E(X^2)-E(X)\\
&=E(X^2)-np
\end{align*}
※ここでは次の期待値の定義を利用しました
\begin{align*}
&E(X^2)=\sum_{k=0}^nk^2{}_nC_k p^,q^{n-k}\\
&E(X)=\sum_{k=0}^nk{}_nC_k p^kq^{n-k}
\end{align*}
よって
\[ E(X^2)=n(n-1)p^2+np \]
したがって
\begin{align*}
V(X)&=E(X^2)-\{ E(X)^2\} \\
&=n(n-1)p^2+np-(np)^2\\
&=n^2p^2-np^2+np-n^2p^2\\
&=-np^2+np\\
&=np(1-p)\\
&=npq
\end{align*}
式は長いですが,方法1よりもすっきり求まりました!
方法3 各試行ごとに新しく確率変数\(X_k\)を導入する(画期的な方法)
高校の教科書等でも使われている方法です.
新しい確率変数\(X_k\)の導入
まず,次のような新しい確率変数を導入します
\(k\)回目の試行で「事象Aが起これば1,起こらなければ0」の値をとる確率変数\(X_k(k=1,\; 2,\; \cdots ,n)\)
具体的には
\(1\)回目の試行で「Aが起これば1,起こらなければ0」となる確率変数を\(X_1\)
\(2\)回目の試行で「Aが起これば1,起こらなければ0」となる確率変数を\(X_2\)
\(\cdots \)
\(n\)回目の試行で「Aが起これば1,起こらなければ0」となる確率変数を\(X_n\)
このような確率変数を導入します.
ここで,\(X\)は事象\(A\)が起こる「回数」でしたので,
\[X=X_1+X_2+\cdots +X_n・・・(A)\]
が成り立ちます.
たとえば2回目と3回目だけ事象Aが起こった場合は,\(X_2=1,\; X_3=1\)で残りの\(X_1,\; X_4,\; \cdots ,X_n\)はすべて0です.
したがって,事象Aが起こる回数\( X \)は,
\[X=0+1+1+0+\cdots +0=2\]
となり,確かに(A)が成り立つのがわかります.
\(X_k\)の値は0または1で,事象Aの起こる確率は\(p\)なので,\(X_k\)の確率分布は\(k\)の値にかかわらず,次のようになります.
\begin{array}{|c||cc|c|}\hline
X_k & 0 & 1 & 計\\\hline
P & q & p & 1 \\\hline
\end{array}
(ただし,\(q=1-p\))
\(X_k\)の期待値と分散
それでは準備として,\(X_k(k=1,\; 2,\; \cdots ,n)\)の期待値と分散を求めておきましょう.
まず期待値は
\[ E(X_k)=0\cdot q+1\cdot p =p\]
となります.
次に分散ですが,
\[ E({X_k}^2)=0^2\cdot q+1^2\cdot p =p\]
となることから
\begin{align*}
V(X_k)&=E({X_k}^2)-\{ E(X_k)\}^2\\
&=p-p^2\\
&=p(1-p)\\
&=pq
\end{align*}
となります.
以上をまとめると
\( 期待値E(X_k)=p \)
\( 分散V(X_k)=pq \)
となります.
二項分布の期待値と分散
\(X_k\)の期待値と分散
\begin{align*}
&期待値E(X_k)=p \\
&分散V(X_k)=pq
\end{align*}
から\(X=X_1+X_2+\cdots +X_n\)の期待値と分散が次のように求まります.
期待値
\begin{align*}
E(X)&=E(X_1+X_2+\cdots +X_n)\\
&=E(X_1)+E(X_2)+\cdots +E(X_n)\\
&=p+p+\cdots +p\\
&=np
\end{align*}
分散
また,\(X_1+X_2+\cdots +X_n\)は互いに独立なので,分散\(V(X)\)は次のようになります.
\begin{align*}
V(X)&=V(X_1+X_2+\cdots +X_n)\\
&=V(X_1)+V(X_2)+\cdots +V(X_n)\\
&=pq+pq+\cdots +pq\\
&=npq
\end{align*}
各試行における新しい確率変数\(X_k\)を導入するという,一風変わった方法により,二項分布の期待値や分散を簡単に求めることができました!
まとめ
本記事では,二項分布の期待値が\(np\),分散が\(npq\)となる理由を次の3通りの方法で証明しました.
方法1 公式\(k{}_nC_k=n{}_{n-1}C_{k-1}\)を利用
方法2 微分の利用
方法3 各試行ごとに新しく確率変数\(X_k\)を導入する(画期的方法)
方法3は各試行ごとに新しく確率変数を導入する方法で,意味さえ理解できれば計算はかなり簡単になりますのでおすすめです.
しかし,統計学をしっかり学んでいこうという場合には定義からスタートする方法1や方法2もぜひ知っておいてほしいのです.
高校の数学Bの教科書ではほとんどが方法3を使って二項分布の期待値と分散を計算していますが,高校生にこそ方法1や方法2のような手法を学んでほしいなと思っています.
もし可能であれば,自身の手を動かし,定義から期待値\(np\)と分散\(npq\)が求められたときの感覚を味わってみてください.
二項分布の期待値\(np\)と分散\(npq\)は結果だけみると単純ですが,このような大変な式変形から導かれたものなのだということを心に止めておいてほしいです.
今回は以上です.
最後までお読みいただき,ありがとうございました!
(私が数学検定1級を受験した際に使った参考書↓)