事象の独立性
事象の独立性とは、$2$ つの事象が無関係である(互いに影響されない)ことを表す概念です。
複数の事象について考えるとき、それらが独立であるか否かは重要です。ここでは、事象の独立性の定義と意味、独立と排反の違いについて、具体例とともに解説します。
事象の独立性
まず、独立性の定義を示します。
定義 1.10(事象の独立性)
$2$ つの事象 $A, B$ について、次が成り立つとき、それらは独立である($\text{independent}$)という。
解説
事象の独立性とは
事象の独立性とは、$2$ つの事象が無関係である(互いに影響されない)ことを数学的に定義した概念です。
独立性の意味(定義式の導出)
事象が独立であるとは、「ある事象の起こる確率が、他の事象が起こったか否かに影響されない」 ことを意味します。
上記の (1.2.12)式がこのような意味を持つ定義式であることは、次のようにして理解できます。
条件付き確率による定義
まず、$2$ つの事象 $A$ と $B$ が独立であるということは、次の $2$ つを満たすことであると考えます。
- $A$ の起こる確率は $B$ が起こったか否かに影響されない
- $B$ の起こる確率は $A$ が起こったか否かに影響されない
このことは、 条件付き確率を用いて、次のように定式化できます。
ここで、$P(A \mid B)$ は、$B$ を条件として $A$ が起こる確率( 条件付き確率)であり、「$B$ が起こったとわかった上で $A$ が起こる確率」に他なりません。
したがって、上記 (1.2.13)式の第 $1$ 式は、「$A$ の起こる確率は $B$ が起こったとわかった上で $A$ が起こる確率に等しい」、つまり「$A$ の起こる確率は $B$ が起こったか否かに影響されない(変わらない)」ことを表しているというわけです。第 $2$ 式についても同様です。
上記 (1.2.13)式に 条件付き確率の定義を適用することで、直ちに (1.2.12)式が導かれます。
このように、 条件付き確率を用いて事象の独立性を定義することもできます。このような定義の仕方は、直感的にも理解しやすいものです。
しかしながら、 (1.2.13)式に 条件付き確率が現れる以上、このような定義の仕方は 条件付き確率が定義されるための条件が前提となる点に注意が必要です。すなわち、事象 $A$ と $B$ は、$P(A) \gt 0$ かつ $P(B) \gt 0$ を満たす必要があり、$P(A) = 0$ または $P(B) = 0$ となるような事象に対しては独立性が定義できないということになります。
同時確率による定義
そこで、はじめから (1.2.12)式を定義式として、 同時確率を用いて事象の独立性を定義することを考えます。 (1.2.12)式に現れる 同時確率は、$P(A) = 0$ または $P(B) = 0$ の場合を含む、任意の事象に対して定義できるためです。
このように、 同時確率を用いた事象の独立性の定義は、任意の事象に対して適用できます。
このような定義の仕方は、直感的には少し理解しにくいものです。すなわち、 (1.2.12)式は、$2$ つの事象 $A$ と $B$ が独立であるとは「$A$ と $B$ が同時に起こる確率( 同時確率)が、それぞれ単独で起こる確率の積に等しい」ことと定義するものです。ここから、上記のような 独立性の意味を読み取るのは難しいです。
しかしながら、任意の事象に対して定義できるという点で、 同時確率による定義は 条件付き確率による定義よりも一般化された定義であるといえます。
このような意味で、多くの教科書では 同時確率による定義が採用されています。なお、 [1], [2], [5] では( 上記と同様に)まず 条件付き確率を用いて独立の概念を定義した上で、直ちに (1.2.12)式を導き、定義を拡張しています。
独立と排反の違い
事象の「独立」と混同されやすい概念に、事象の「排反」があります。これらは、いずれも $2$ つの事象の関係を表す概念ではありますが、本質的に異なります。
それぞれの定義は、次の通りです。
排反な事象(定義)
ここで、$\phi$ は空集合を表します。 確率の定義より $P(\phi) = 0$ であることから、$2$ つの事象 $A$ と $B$ が排反であるとき、次が成り立ちます。つまり、排反な事象は同時には起こらないということです。
独立な事象(定義)
上記の考察の通り、事象が独立であるとは、「ある事象の起こる確率が、他の事象が起こったか否かに影響されない」ことを意味します。$2$ つの事象 $A$ と $B$ が独立であるとき、$A$ の起こる確率は $B$ が起こったか否かに影響されず、$B$ の起こる確率も $A$ が起こったか否かに影響されません。
このように、事象の独立と排反はまったく異なる概念であり、一般に、両者の間に論理的な含意関係は存在しません。それぞれがどのような状況($2$ つの事象の関係)を表すかは、下記の 具体例を参照ください。
独立な事象の例
次に、独立な事象、独立でない事象、独立と排反の関係について、具体例を示します。
独立な事象
復元抽出や 同じ試行の繰り返しなどは、独立性が成り立つ確率モデルの典型的な例です。
例 1:復元抽出
袋の中に白色の玉と赤色の玉が、それぞれ $5$ 個ずつ入っているとします。袋から $1$ 個の玉を取り出して色を確認した後、袋に戻し、よく混ぜてから再び $1$ 個取り出します。(このような試行を、復元抽出といいます。)
このとき、$1$ 回目に赤色の玉が出ることを $R_{1}$、$2$ 回目に赤色の玉が出ることを $R_{2}$ とすると、$R_{1}$ と $R_{2}$ は独立であるといえます。
独立である理由
復元抽出では、各回の抽出(玉を取り出して色を確認して袋に戻す)が終わる度に、袋の中の状態は元に戻ります。したがって、$1$ 回目の抽出の結果は $2$ 回目の抽出の結果に影響を与えません。
つまり、$R_{1}$ が起こった($1$ 回目に赤色の玉が出た)か否かによらず、$R_{2}$ が起こる($2$ 回目に赤色の玉が出る)確率は変わりません。よって、$2$ つの事象 $R_{1}$ と $R_{2}$ は独立であるといえます。
このように、復元抽出は、独立性が成り立つもっとも基本的な確率モデルの $1$ つです。
例 2:同じ試行の繰り返し
サイコロを投げて出た目を確認するという試行を繰り返します。
$1$ 回目の試行の結果、偶数の目が出ることを $E_{1}$、$2$ 回目の試行の結果、奇数の目が出ることを $O_{2}$ とすると、$E_{1}$ と $O_{2}$ は独立であるといえます。
独立である理由
各回の試行は同一条件の下で行われるとみなせます。サイコロ自体に変化はなく、その他の条件や環境(投げ方や場所など)も変化しないと考えるのが妥当だからです。したがって、$1$ 回目の試行の結果は $2$ 回目以降の結果に影響を与えません。例えば、$1$ 回目に偶数の目が出たからといって、$2$ 回目に奇数の目が出やすくなるわけではありません。
つまり、$E_{1}$ が起こった($1$ 回目に偶数の目が出た)か否かによらず、$O_{2}$ が起こる($2$ 回目に奇数の目が出る)確率は変わりません。よって、$2$ つの事象 $E_{1}$ と $O_{2}$ は独立であるといえます。
同一独立分布($\text{i.i.d.}$)
このように、同一条件下での試行の繰り返しは、確率論や統計学において 独立同一分布($\text{i.i.d.} \text{\, : \,} \text{independent and identically distributed}$) として一般化されます。 復元抽出も、同一条件下での試行の繰り返しであり、独立同一分布の代表的な例ともいえます。
独立同一分布は、大数の法則や中心極限定理などを導出する際に重要な役割を果たします。
独立でない事象
これに対して、 非復元抽出などは、試行の結果が互いに影響し合うため、一般に独立性が成り立たない確率モデルといえます。
例 3:非復元抽出
(ジョーカーを除く)$52$ 枚のトランプの山札から、$1$ 枚ずつカードを引きます。$1$ 度引いたカードは山札に戻さないこととします。(このような試行を、非復元抽出といいます。)
このとき、$1$ 枚目に引いたカードのスート(マーク)がハートであることを $H_{1}$、$2$ 枚目に引いたカードがハートであることを $H_{2}$ であるとすると、$H_{1}$ と $H_{2}$ は独立ではありません。
独立でない理由
非復元抽出では、各回の抽出(カードを $1$ 枚引く)が終わる度に、山札の状態が変わります。例えば、$1$ 枚目に引いたカードがハートだった場合、$2$ 枚目を引く際には、ハートが $1$ 枚減っている山札から抽出が行われます。一方で、$1$ 枚目に引いたカードがハートではなかった場合、$2$ 枚目を引く際には、ハートがすべて残っている山札から抽出が行われます。
つまり、$H_{1}$ が起こった($1$ 枚目にハートを引く)か否かにより、$H_{2}$ が起こる($2$ 枚目にハートを引く)確率は変わります。よって、$2$ つの事象 $H_{1}$ と $H_{2}$ は独立ではありません。
情報が更新されていく試行
非復元抽出のように、先行する結果が「情報」として蓄積・更新されていく試行では、その情報が後続の結果に直接影響します。このような試行は、一般に独立性が成り立たない確率モデルと考えるのが妥当です。
なお、実社会で扱う問題の多く(天気予報や病気の検査、定員制の試験など)は、このような「情報が更新されていく試行」であるといえます。
独立と排反
独立と排反は混同されがちな概念です。いずれも $2$ つの事象の関係を表す概念ですが、これらは本質的に異なります( 独立と排反の違いを参照)。
一般に、独立であることと排反であることの間に論理的な含意関係は存在しません。したがって、$2$ つの事象の関係には(論理的には)次の $4$ 通りの組合せが考えられます。
下記の 例 $4$ で、それぞれの関係がどのようなものかを考えます。(なお、説明のしやすさから「排反でない」を「排反」より先に置いています。)
例 4:2つの事象の関係
ある学校において、英語の試験と長距離走の記録計測が行われたとします。いま、$2$ つの事象 $A, B$ を次のように定義します。
- 事象 $A$:英語の試験で高得点($90$ 点以上)を取る
- 事象 $B$:長距離走で上位層(上位 $10 %$ 位以内)となる
このとき、事象 $A$ と $B$ について考えられる、次の $4$ 通りの関係が、それぞれどのような仮定の下に成り立つか(どのような状況を表すか)を示します。
(1)独立かつ排反でない
次の 仮定 $1$ が成り立つとき、事象 $A$ と $B$ は「独立かつ排反でない」といえます。
このとき、学力と運動能力の間にはまったく関連性がなく、英語の試験の点数が高いことと長距離走の記録が良いことは無関係であるといえます。また、英語も長距離走もどちらも得意であるという生徒がいる可能性も充分にあります。(どちらか一方のみ得意、どちらも不得意という生徒も同じだけいる可能性があります。)
すなわち、事象 $A$ と $B$ は互いに無関係であり、同時に起こり得ます。したがって、事象 $A$ と $B$ は独立であり、かつ排反ではないといえます。
現実的には、学力と運動能力の間には関連性があり、それぞれの結果に何らかの相関があるかもしれません( ($3$)独立でないかつ排反でない参照)。一方で、数学の問題を考えるにあたって、所与の条件を簡潔にする(余計な前提条件を置かない)ことは基本的な姿勢ともいえます。このような意味で、 仮定 $1$ は、数学的には一定の妥当性のある仮定といえます。
(2)独立かつ排反
次の 仮定 $2$ が成り立つとき、事象 $A$ と $B$ は「独立かつ排反」であるといえます。
確率の単調性より、$P(A) =0 \Rightarrow P(A \cap B) = 0$ が成り立ちます。また、このとき $P(A \cap B) = P(A) \, P(B)$ も成り立ちます。したがって、事象 $A$ が起こり得ない($P(A) = 0$)とき、事象 $A$ と $B$ は独立であり、かつ排反であるといえます。
逆に、事象 $A$ と $B$ が「独立かつ排反」であるとすると、それぞれの 定義より、次が成り立ちます。
すなわち、$2$ つの事象が「独立かつ排反」であるということは、いずれかの起こる確率が $0$ に等しいということと同値です。片方が起こり得ない事象であるとき、$2$ つの事象は互いに影響されず、同時にも起こり得ない、つまり「独立かつ排反である」ということです。
しかしながら、現実的な問題において、このような($2$ つの事象のうち片方が起こり得ない)場合について考える意味はあまりありません。 仮定 $2$ は、例示のために考えた、かなり無理のある設定です。(出題に不備があったときは、無条件で全員に加点されることがほとんどです。また、仮に満点が $100$ 点から $75$ 点に変更されたならば、「高得点:$90$ 点以上」という基準そのものも見直すべきです。)
(3)独立でないかつ排反でない
次の 仮定 $3$ が成り立つとき、事象 $A$ と $B$ は「独立でないかつ排反はもない」といえます。
このとき、英語が得意な生徒は長距離走も得意である可能性が高く、英語の試験の点数と長距離走の記録には(正の)相関があると考えられます。(逆に、英語が不得意な生徒は長距離走も不得意である可能性が高いといえます。)
すなわち、事象 $A$ と $B$ は互いに無関係ではなく、同時にも起こり得ます。したがって、事象 $A$ と $B$ は独立でなく、かつ排反でないといえます。
仮定 $3$ は、比較的現実に近い仮定です。実際に、多くの研究結果が「学力の高い生徒は運動能力も高い傾向がある」ことを示しているようです(主な研究結果は、以下の通り)。
- Ishihara, T., Nakajima, T., Yamatsu, K., Okita, K., Sagawa, M., & Morita, N. (2020)
- Rasberry, C. N., Lee, S. M., Robin, L., Laris, B. A., Russell, L. A., Coyle, K. K., & Nihiser, A. J. (2011)
- Trudeau, F., & Shephard, R. J. (2008)
(4)独立でないかつ排反
次の 仮定 $4$ が成り立つとき、事象 $A$ と $B$ は「独立でないかつ排反」であるといえます。
このとき、英語の試験の点数と長距離走の記録には(負の)相関があると考えられます。つまり、英語の試験の結果が良かった生徒は、長距離走では振わない可能性が高いです。また、英語の試験で高得点を取り、長距離走でも上位層であるような生徒はいないことになります。
すなわち、事象 $A$ と $B$ は互いに無関係ではないが、同時には起こり得ません。したがって、事象 $A$ と $B$ は独立でなく、かつ排反であるといえます。
仮定 $4$ は、少し極端な仮定です。これは、例えば、生徒の学力と運動能力が(ゲーム・キャラクターのように)パラメータとして設定されており、それらの合計値に上限がある状況を考えるとイメージできるかもしれません。学力に多くのパラメータを割り当てた生徒は、運動能力に割り当てられるパラメータが少なくなります。
このような仮定は、 例 $4$ においては、非現実的なものです。しかしながら、現実的な問題では、$2$ つの事象が「独立でないかつ排反」であるということは充分あり得ます。例えば、勝敗が明確に決まるスポーツにおいて、それぞれの参加者が勝つのは「独立でないかつ排反」な事象といえます。一方が勝つということは(必然的に)もう一方の負けを意味しており、どちらも勝つということがないからです。
参考文献
[1] 舟木直久. 確率論. 朝倉書店. 2004.
[2] 縄田和満. 確率・統計 $\text{I}$. 丸善出版. 2013.
[3] 小針晛宏. 確率・統計入門. 岩波書店. 1973.
[4] 真貝寿明. 徹底攻略 確率統計. 共立出版. 2012.
[5] 東京大学教養学部統計学教室 編. 統計学入門. 東京大学出版会. 1991.
[6] W. Feller. An Introduction to Probability Theory and Its Applications. John Wiley & Sons, Inc.. 1968.
[7] Robert B. Ash. Basic Probability Theory. Dover Publications, Inc.. 2008.
[8] G. Andrews. Special Functions. Cambridge University Press. 1999.
[9] 杉浦光夫. 解析入門 $\text{I}$. 東京大学出版会. 1980.
[10] 吉田伸生. [新装版] ルベーグ積分入門. 日本評論社. 2021.