確率の基本的性質(2)

確率の加法定理、劣加法性に関する定理を示します。

これらは、排反とは限らない事象の和の確率について成り立つ基本的な性質であり、いずれも 確率の定義から導くことができます。

確率の加法定理

まず、確率に関する加法定理を示します。


定理 1.7(確率の加法定理)

任意の事象 $A, B$ に対して、次が成り立つ。

$$ \begin{align*} \tag{1.2.6} P(A \cup B) = P(A) + P(B) - P(A \cap B) \end{align*} $$


解説

確率の加法定理

定理 1.7(確率の加法定理)は、任意の $2$ つの事象 $A, B$ の和の確率が、それぞれの事象の確率と、共通部分の確率を用いて表せることを示しています。

排反でない事象の和の確率

定理 1.7(確率の加法定理)は、互いに排反とは限らない、任意の事象について成り立ちます。

$2$ つの事象 $A, B$ が互いに排反である($A \cap B = \phi$)であるとすると、 定理 1.4(空事象の確率)より $P(A \cap B) = 0$ となるため、 ($1.2.6$)式は、次のようになります。

$$ \begin{align*} \tag{1.2.6$^{\prime}$} P(A \cup B) = P(A) + P(B) \end{align*} $$

ところで、これは 確率の定義(特に、条件 ($\text{iii}$)可算加法性)から直ちに導かれることであり、改めて定理としてまとめる意義はありません。

つまり、 定理 1.7(確率の加法定理)は、互いに排反でない場合も含む 任意の事象について成り立つということが重要です。

加法定理の直感的な理解

定理 1.7(確率の加法定理)は、直感的には、有限集合の要素数に関して成り立つ、次の関係式と対応するものとして理解できます。ここで、$\lvert \, A \, \rvert$ は集合 $A$ の要素数を表します。

$$ \begin{align*} \lvert \, A \cup B \, \rvert = \lvert \, A \, \rvert + \lvert \, B \, \rvert - \lvert \, A \cap B \, \rvert \end{align*} $$

すなわち、有限集合の和 $A \cup B$ の要素数は、$A, B$ それぞれの要素数を足して、共通部分 $A \cap B$ の要素数を引いたものに等しくなります。

確率の加法定理と有限集合の要素数との関係を表すベン図

ここで、集合 $A$ の要素数 $\lvert \, A \, \rvert$ と事象 $A$ の起こる確率 $P(A)$ を対応させて考えると、上図は「$A$ または $B$ が起こる確率」が「$A$ が起こる確率」と「$B$ が起こる確率」を足して「$A$ と $B$ がともに起こる確率」を引くいた値に等しくなるという ($1.2.6$)式を表していると捉えられます。



証明(定理 1.7)

$A \cup B$ は $3$ つの事象 $A \cap \overline{B \, \vphantom{\big(\big)}}, \, A \cap B, \, \overline{A \, \vphantom{\big(\big)}} \cap B$ の和として表すことができ、これらの事象は互いに排反であるから、次が成り立つ。

$$ \begin{align*} P(A \cup B) = P(A \cap \overline{B \, \vphantom{\big(\big)}}) + P(A \cap B) + P(\overline{A \, \vphantom{\big(\big)}} \cap B) \end{align*} $$

また、事象 $A$ は $2$ つの事象 $A \cap \overline{B \, \vphantom{\big(\big)}}, \, A \cap B$ の和として表すことができ、これらの事象も排反であるから、

$$ \begin{align*} P(A) = P(A \cap \overline{B \, \vphantom{\big(\big)}}) + P(A \cap B) \end{align*} $$

同様に、事象 $B$ について、次が成り立つ。

$$ \begin{align*} P(B) = P(\overline{A \, \vphantom{\big(\big)}} \cap B) + P(A \cap B) \end{align*} $$

以上から、

$$ \begin{align*} \tag*{$\square$} P(A \cup B) = P(A) + P(B) - P(A \cap B) \end{align*} $$



証明の考え方(定理 1.7)

事象 $A, B$ とその和 $A \cup B$ をそれぞれ排反な事象に分割して、確率の 可算加法性を用います。

それぞれの事象に対応する集合の包含関係を考えることで見通しが良くなります。

前提事項の整理

  • 事象とは標本空間の部分集合(正確には、 可算加法族)のことでした( 確率の定義を参照)。
  • いま、$A, B$ は任意の事象であり、互いに排反であるとは限りません。
    • すなわち、$A \cap B = \phi$ とは限りません。
  • このとき、事象 $A, B$ に対応する集合は、次のような関係にあると考えられます。
確率の加法定理と有限集合の要素数との関係を表すベン図

事象の分割

  • 事象 $A, B$ とその和 $A \cup B$ を、それぞれ排反な事象に分割します。
(1)和事象 $A \cup B$
  • 上図より、和事象 $A \cup B$ は、互いに排反な $3$ つの事象 $A \cap \overline{B \, \vphantom{\big(\big)}}, \, A \cap B, \, \overline{A \, \vphantom{\big(\big)}} \cap B$ の和として表せます。

    $$ \begin{align*} A \cup B = (A \cap \overline{B \, \vphantom{\big(\big)}}) \cup (A \cap B) \cup (\overline{A \, \vphantom{\big(\big)}} \cap B) \end{align*} $$

  • ここで、右辺の $3$ つの事象は互いに排反であるから、確率の 可算加法性から、次が成り立ちます( 確率の定義)。

    $$ \begin{align*} \tag{$\ast 1$} P(A \cup B) = P(A \cap \overline{B \, \vphantom{\big(\big)}}) + P(A \cap B) + P(\overline{A \, \vphantom{\big(\big)}} \cap B) \end{align*} $$

(2)事象 $A$
  • 事象 $A$ は、互いに排反な $2$ つの事象 $A \cap \overline{B \, \vphantom{\big(\big)}}, \, A \cap B$ の和として表せます。

    $$ \begin{align*} A = (A \cap \overline{B \, \vphantom{\big(\big)}}) \cup (A \cap B) \end{align*} $$

  • 右辺の $2$ つの事象は互いに排反であるから、確率の 可算加法性から、次が成り立ちます( 確率の定義)。

    $$ \begin{align*} \tag{$\ast 2$} P(A) = P(A \cap \overline{B \, \vphantom{\big(\big)}}) + P(A \cap B) \end{align*} $$

(3)事象 $B$
  • 同様に、事象 $B$ は、$2$ つの事象 $\overline{A \, \vphantom{\big(\big)}} \cap B, \, A \cap B$ の和として表せます。

    $$ \begin{align*} B = (\overline{A \, \vphantom{\big(\big)}} \cap B) \cup (A \cap B) \end{align*} $$

  • 右辺の $2$ つの事象は互いに排反であるから、確率の 可算加法性から、次が成り立ちます( 確率の定義)。

    $$ \begin{align*} \tag{$\ast 3$} P(B) = P(\overline{A \, \vphantom{\big(\big)}} \cap B) + P(A \cap B) \end{align*} $$

関係式の整理

  • 以上を整理すると、次のようになります。

    $$ \begin{split} P(A \cup B) &\overset{(\text{i})}{=} P(A \cap \overline{B \, \vphantom{\big(\big)}}) + P(A \cap B) + P(\overline{A \, \vphantom{\big(\big)}} \cap B) \\ &\overset{(\text{ii})}{=} P(A \cap \overline{B \, \vphantom{\big(\big)}}) + P(A \cap B) \\ &\quad \; + \, P(\overline{A \, \vphantom{\big(\big)}} \cap B) + P(A \cap B) \\ &\quad \; - \, P(A \cap B) \\ &\overset{(\text{iii})}{=} P(A) + P(B) - P(A \cap B) \end{split} $$

  • 以上から、任意の $2$ つの事象の確率について、和の法則が成り立つことが示されました。



確率の劣加法性

次に、確率の劣加法性を示します。


定理 1.8(確率の劣加法性)

事象 $A_{1}, A_{2}, \cdots$ について、次が成り立つ。

$$ \begin{align*} \tag{1.2.7} P \Big(\bigcup_{i}^{\infin} A_{i} \Big) \leqslant \sum_{i}^{\infin} \, P(A_{i}) \end{align*} $$


解説

劣加法性とは

確率の劣加法性($\text{subadditivity}$)とは、可算個の事象の和の確率が、それぞれの確率の総和を超えない、という性質です。

劣加法性は確率の基本的な性質であり、特に、大数の法則などの極限操作を伴う考察において重要な役割を果たします。例えば、ボレル - カンテリの補題の証明などにおいて、劣加法性は考察の出発点となります。

可算加法性との違い

定理 1.8(確率の劣加法性)は、 確率の定義の条件 ($\text{iii}$)可算加法性に類似しています。

可算加法性確率の定義を参照)
互いに排反である事象 $A_{1}, A_{2}, \cdots$ に対して、次が成り立つ。 $$ \begin{align*} P \Big(\bigcup_{i}^{\infin} A_{i} \Big) = \sum_{i}^{\infin} \, P(A_{i}) \end{align*} $$

これらは、どちらも可算個の事象 $A_{1}, A_{2}, \cdots$ の和の確率に関する関係式ですが、 可算加法性において、事象 $A_{1}, A_{2}, \cdots$ は互いに排反であるのに対して、 劣加法性では、事象 $A_{1}, A_{2}, \cdots$ は互いに排反である必要はありません。

したがって、 定理 1.8(確率の劣加法性)は、より一般の(排反でない場合も含む)事象の和に関する関係式であるといえます。

注意すべきは、 確率の定義の条件(公理)はあくまで 可算加法性であるということです。下記の 証明に示すように、確率の 劣加法性可算加法性(と 単調性)から導かれる性質です。

劣加法性の直感的な理解

定理 1.8(確率の劣加法性)は、直感的には、有限個の事象の和について成り立つ 定理 1.7(確率の加法定理)を、可算個の事象の和に拡張したものとして理解できます。

例えば、 定理 1.8(確率の劣加法性)において、和を考える対象を $2$ つの事象に限定する(あるいは、$A_{3}$ 以降がすべて空事象 $\phi$ である)と仮定すると (1.2.7)式は次のようになります。

$$ \begin{align*} P(A_{1} \cup A_{2}) \leqslant P(A_{1}) + P(A_{2}) \end{align*} $$

一方で、 定理 1.7(確率の加法定理)より、次が成り立ちます。

$$ \begin{gather*} & P(A_{1} \cup A_{2}) = P(A_{1}) + P(A_{2}) - P(A_{1} \cap A_{2}) \\ \Rightarrow & P(A_{1} \cup A_{2}) \leqslant P(A_{1}) + P(A_{2}) \\ \end{gather*} $$

すなわち、$2$ つの事象の和について 劣加法性が成り立つことは、 定理 1.7(確率の加法定理)より明らかといえます。また、$3$ 個以上の事象の和についても、同様に示すことができます。

これは、個々の事象 $A_{1}, A_{2}, \cdots$ の確率を単純に足し合わせると重複が含まれるため、その分だけ事象の和 $A_{1} \cup A_{2} \cup \cdots$ の確率よりも大きくなる、ということを意味しています。

測度の劣加法性

劣加法性は( 確率測度に限らない)一般の測度について成り立ちます。すなわち、 測度空間 $(S, \mathcal{A}, \mu)$ 上で定義された測度 $\mu$ と $A_{1}, A_{2}, \cdots \in \mathcal{A}$ について、次が成り立ちます。

$$ \begin{align*} \mu \Big(\bigcup_{i}^{\infin} A_{i} \Big) \leqslant \sum_{i}^{\infin} \, \mu(A_{i}) \end{align*} $$

確率測度とは、全測度が $1$ となるように規格化された測度のことでした( 定義 1.8(確率測度)を参照)。このことからも、劣加法性は確率の基本的な性質であるといえます。



証明(定理 1.8)

$A_{1}, A_{2}, \cdots$ に対して、次のような $B_{1}, B_{2}, \cdots$ を考える。

$$ \left\{ \;\; \begin{align*} B_{1} &= B_{1} \vphantom{\bigcup^{\infin}} \\ B_{n} &= \bigcup_{i}^{n} A_{i} \, \setminus \, \bigcup_{i}^{n-1} A_{i} \\ \end{align*} \right. $$

すなわち、$\displaystyle\bigcup_{i}^{n-1} A_{i}$ に $A_{n}$ を加えて $\displaystyle\bigcup_{i}^{n} A_{i}$ を得るとき、新たに加わった部分を $B_{n}$ とする。このとき、$B_{1}, B_{2}, \cdots$ は互いに排反であり、任意の $n$ について、次が成り立つ。

$$ \left\{ \quad \begin{gather*} \bigcup_{i}^{n} B_{i} = \bigcup_{i}^{n} A_{i}, \\ B_{n} \sub A_{n} \vphantom{\bigcup^{\infin}} \end{gather*} \right. $$

したがって、

$$ \begin{align*} P \Big(\bigcup_{i}^{\infin} A_{i} \Big) &= P \Big(\bigcup_{i}^{\infin} B_{i} \Big) \\ &= \sum_{i}^{\infin} \, P(B_{i}) \\ &\leqslant \sum_{i}^{\infin} \, P(A_{i}) \tag*{$\square$} \end{align*} $$



証明の考え方(定理 1.8)

互いに排反とは限らない事象の列 $A_{1}, A_{2}, \cdots$ から、互いに排反な事象の列 $B_{1}, B_{2}, \cdots$ を作り、確率の 可算加法性単調性を適用します。

(1)互いに排反な事象列の定義

  • まず、互いに排反とは限らない事象の列 $A_{1}, A_{2}, \cdots$ から、互いに排反な事象の列 $B_{1}, B_{2}, \cdots$ を作ります。

  • すなわち、$A_{1}, A_{2}, \cdots$ に対して、$B_{1}, B_{2}, \cdots$ を、次のように定義します。

    $$ \left\{ \;\; \begin{align*} B_{1} &= B_{1} \vphantom{\bigcup^{\infin}} \\ B_{n} &= \bigcup_{i}^{n} A_{i} \, \setminus \, \bigcup_{i}^{n-1} A_{i} \\ \end{align*} \right. $$

    • 第 $2$ 式は、$\displaystyle\bigcup_{i}^{n} A_{i}$ から $\displaystyle\bigcup_{i}^{n-1} A_{i}$ を除いた 差集合を表しています。
    • つまり、$A_{1}, \cdots, A_{n-1}$ の和である $\displaystyle\bigcup_{i}^{n-1} A_{i}$ に $A_{n}$ を加えて $\displaystyle\bigcup_{i}^{n} A_{i}$ を作るとき、新たに加わった部分のみを $B_{n}$ とします。
    • したがって、$B_{n}$ は、次のようにも表せます。
      $$ \begin{align*} B_{n} &= \bigcup_{i}^{n} A_{i} \, \setminus \, \bigcup_{i}^{n-1} A_{i} \\ &= A_{n} \, \setminus \, \bigcup_{i}^{n-1} A_{i} \tag{$\ast$} \end{align*} $$
  • このとき、$B_{1}, B_{2}, \cdots$ は、定義から、互いに排反となります。

    $$ \begin{align*} \tag{$\ast 1$} B_{i} \cap B_{j} = \phi \quad (\, i \lt j \,) \end{align*} $$

  • また、$B_{1}, B_{2}, \cdots$ の総和は、$A_{1}, A_{2}, \cdots$ の総和に等しくなります。

    $$ \begin{align*} \tag{$\ast 2$} \bigcup_{i}^{n} B_{i} = \bigcup_{i}^{n} A_{i} \end{align*} $$

  • 更に、 ($\ast$)式より、任意の $n$ について、次が成り立ちます。

    $$ \begin{align*} \tag{$\ast 3$} B_{n} \sub A_{n} \vphantom{\bigcup^{\infin}} \end{align*} $$

(2)可算加法性と単調性の適用

  • 上記を踏まえて、$A_{1}, A_{2}, \cdots$ の和の確率を $B_{1}, B_{2}, \cdots$ を用いて表すと、次が成り立ちます。

    $$ \begin{align*} P \Big(\bigcup_{i}^{\infin} A_{i} \Big) &\overset{(\text{i})}{=} P \Big(\bigcup_{i}^{\infin} B_{i} \Big) \\ &\overset{(\text{ii})}{=} \sum_{i}^{\infin} \, P(B_{i}) \\ &\overset{(\text{iii})}{\leqslant} \sum_{i}^{\infin} \, P(A_{i}) \end{align*} $$

    • ($\text{i}$) ($\ast 2$)式より、$A_{1}, A_{2}, \cdots$ の総和は $B_{1}, B_{2}, \cdots$ の総和に等しくなります。
    • ($\text{ii}$) ($\ast 1$)式より、$B_{1}, B_{2}, \cdots$ は互いに排反であるので、確率の 可算加法性から、事象の列 $B_{1}, B_{2}, \cdots$ の和の確率はそれぞれの事象の確率の和に等しくなります。
    • ($\text{iii}$) ($\ast 3$)式より、任意の $n$ に対して $B_{n} \sub A_{n}$ が成り立ちます。したがって、 定理 1.6(確率の単調性)より、任意の $n$ について、次が成り立ちます。
      $$ \begin{align*} P(B_{n}) \leqslant P(A_{i}) \end{align*} $$
  • 以上から、 定理 1.8(確率の劣加法性)が示されました。

    $$ \begin{align*} P \Big(\bigcup_{i}^{\infin} A_{i} \Big) \leqslant \sum_{i}^{\infin} \, P(A_{i}) \end{align*} $$



参考文献

[1] 舟木直久. 確率論. 朝倉書店. 2004.
[2] 縄田和満. 確率・統計 $\text{I}$. 丸善出版. 2013.
[3] 小針晛宏. 確率・統計入門. 岩波書店. 1973.
[4] 真貝寿明. 徹底攻略 確率統計. 共立出版. 2012.
[5] 東京大学教養学部統計学教室 編. 統計学入門. 東京大学出版会. 1991.
[6] W. Feller. An Introduction to Probability Theory and Its Applications. John Wiley & Sons, Inc.. 1968.
[7] Robert B. Ash. Basic Probability Theory. Dover Publications, Inc.. 2008.
[8] G. Andrews. Special Functions. Cambridge University Press. 1999.
[9] 杉浦光夫. 解析入門 $\text{I}$. 東京大学出版会. 1980.
[10] 吉田伸生. [新装版] ルベーグ積分入門. 日本評論社. 2021.


初版:2025-10-10   |   改訂:2025-10-21