確率の基本的性質(1)

空事象の確率、余事象の確率、確率の単調性に関する定理を示します。

これらは、確率の基本的な性質を示す定理であり、いずれも 確率の定義から導くことができます。

空事象の確率

まず、空事象の確率について成り立つ性質を示します。


定理 1.4(空事象の確率)

$\phi$ を空事象とすると、次が成り立つ。

$$ \begin{align*} \tag{1.2.2} P(\phi) = 0 \end{align*} $$


解説

空事象の確率

定理 1.4(空事象の確率)は、空事象の確率が $0$ に等しいことを示しています。

空事象とは:根元事象を含まない事象

空事象($\text{null}$ $\text{event}$ $\text{/}$ $\text{empty}$ $\text{event}$)とは、「どの根元事象(標本)も含まない事象」であり、記号 $\phi$ を用いて表します。

起こり得ることがら全体の集合(標本空間)を $\varOmega$ とすると、事象とは $\varOmega$ の部分集合(正確には、$\varOmega$ 上の 可算加法族)のことでした( 確率の定義)。

ここで、空事象は空集合に対応する事象です。このような意味で、空事象は空集合と同じ文字 $\phi$ を用いて表されます。

空事象が事象であることの確認

空事象が事象であることは、次のようにして確かめられます。

まず、空集合 $\phi$ が標本空間 $\varOmega$ の部分集合であることは明らかです。

更に、空集合 $\phi$ が 可算加法族の要素であることは、空集合が標本空間の補集合であること($\phi = \overline{\varOmega \, \vphantom{\big(\big)}}$)と 可算加法族の条件($\text{i}$)($\text{ii}$)から直ちに導けます。

$$ \begin{align*} \varOmega \in \mathcal{F} \; \; \Rightarrow \; \; \overline{\varOmega \vphantom{\big(\big)} \,} = \phi \in \mathcal{F} \end{align*} $$

空事象の意味

空事象 $\phi$ は「どの根元事象(標本)も含まない事象」であり、 確率空間(確率モデル)における下限を表す「基準的な事象」といえます。

基準的な事象(標本空間と空事象)

標本空間 $\varOmega$ は「試行により起こり得るすべての結果を含む集合」であり、 確率の定義より、$P(\varOmega) = 1$ です。

これに対して、空事象 $\phi$ は「いかなる結果も含まない集合」に対応する事象であり、 定理 1.4(空事象の確率)より、$P(\phi) = 0$ となります。

また、確率は、その値が $0 \sim 1$ の範囲に収まるように 規格化されています( 確率の定義)。

$$ \begin{align*} P : \mathcal{F} \to [\, 0, 1 \,] \end{align*} $$

したがって、標本空間と空事象は、それぞれ、 確率空間(確率モデル)の上限と下限を表す「基準的な事象」としての意味合いを持ちます。

空事象の表現とその解釈

空事象は「どの根元事象(標本)も含まない事象」です。「何も起こらない事象」や「決して起こり得ない事象」などと表現されることもありますが、その解釈には注意が必要です。

「何も起こらない事象」の意味

「何も起こらない事象」というと、試行が実行されていない状態や、試行の結果が定まらない(観測できない)状態をイメージしてしまうかもしれませんが、これは誤りです。

確率論においては、試行の結果が客観的に定まるという前提の下、起こり得る結果全体の集合(すなわち標本空間)が定義されます。

したがって、空事象を「何も起こらない事象」というとき、これは「どのような結果もその事象に属さない」ということを意味しています。「試行の結果が定まらない」という意味ではないので、その点注意が必要です。

「決して起こり得ない事象」の意味

「決して起こり得ない事象」、すなわち確率が $0$ に等しい事象が、必ずしも空事象であるとは限りません。

空事象の確率は $0$ に等しい( 定理 1.4(空事象の確率))ですが、空事象ではないものの、確率が $0$ に等しい事象は多く存在します。例えば、「硬貨投げで表が出続ける」という事象の確率は $0$ に等しくなりますが、これは空事象ではありません。(測度論において、このような事象に対応する集合は、測度零集合と呼ばれます)。

したがって、空事象を「決して起こり得ない事象」というとき、これは「根元事象を $1$ つも含まない」(だから、確率が $0$ に等しい)ということを意味しています。「確率が $0$ に等しい事象」が空集合とはいえないので、その点注意が必要です。



証明(定理 1.4)

標本空間を $\varOmega$ とすると、$\varOmega$ と $\phi$ の和について、次が成り立つ。

$$ \begin{align*} \varOmega \cup \phi = \varOmega \end{align*} $$

よって、

$$ \begin{align*} P(\varOmega \cup \phi) = P(\varOmega) \end{align*} $$

また、$\varOmega$ と $\phi$ は排反であるから、

$$ \begin{align*} P(\varOmega \cup \phi) = P(\varOmega) + P(\phi) \end{align*} $$

したがって、

$$ \begin{gather*} & P(\varOmega) = P(\varOmega) + P(\phi) \\ \Rightarrow & P(\phi) = 0 \tag*{$\square$} \end{gather*} $$



証明の考え方(定理 1.4)

確率の定義より直ちに導けます。特に、確率が 可算加法性を満たすことを用います。

具体的には、標本空間 $\varOmega$ と空事象 $\phi$ の和の確率を $2$ 通りに表すことで、空事象の確率が $0$ に等しいことを導きます。

前提事項の整理

  • 標本空間を $\varOmega$ 、空事象を $\phi$ とします。

  • 空事象 $\phi$ は「どの根元事象も含まない事象」であり、空集合に対応しています( 空事象とはを参照)。

  • したがって、$\varOmega$ と $\phi$ の和、共通部分について、それぞれ次が成り立ちます。

    $$ \begin{align*} \varOmega \cup \phi &= \varOmega \tag{$\ast 1$} \\ \varOmega \cap \phi &= \phi \tag{$\ast 2$} \end{align*} $$

    • ($\ast 2$)式は、$\varOmega$ と $\phi$ が排反であることを表しています。

標本空間と空事象の和の確率

  • ($\ast 1$)式より、標本空間 $\varOmega$ と空事象 $\phi$ の和の確率について、次が成り立ちます。

    $$ \begin{align*} \tag{${\ast 1}^{\prime}$} P(\varOmega \cup \phi) = P(\varOmega) \end{align*} $$

  • 左辺の $P(\varOmega \cup \phi)$ について、 ($\ast 2$)式より、次が成り立ちます。

    $$ \begin{align*} \tag{${\ast 2}^{\prime}$} P(\varOmega \cup \phi) = P(\varOmega) + P(\phi) \end{align*} $$

  • 以上から、次が成り立ちます。

    $$ \begin{gather*} & P(\varOmega) = P(\varOmega) + P(\phi) \\ \Rightarrow & P(\phi) = 0 \end{gather*} $$

    • 上記の 証明では、標本空間 $\varOmega$ と空事象 $\phi$ の和を考えましたが、任意の事象 $A \in \mathcal{F}$ と空事象 $\phi$ の和を考えても、同様に証明できます。


余事象の確率

次に、余事象の確率について成り立つ性質を示します。


定理 1.5(余事象の確率)

任意の事象 $A$ について、次が成り立つ。ただし、$\overline{A \, \vphantom{\big(\big)}}$ は $A$ の余事象を表す。

$$ \begin{align*} \tag{1.2.3} P(\overline{A \, \vphantom{\big(\big)}}) = 1 - P(A) \end{align*} $$


解説

余事象の確率

定理 1.5(余事象の確率)は、任意の事象 $A$ とその余事象 $\overline{A \, \vphantom{\big(\big)}}$ の確率について成り立つ関係を示しています。すなわち、余事象 $\overline{A \, \vphantom{\big(\big)}}$ の確率は、$1$ からもとの事象 $A$ の確率を減じた値に等しくなります。

余事象とは:ある事象が起こらない事象

余事象($\text{complementary}$ $\text{event}$)とは、ある事象 $A$ に対して「$A$ が起こらない事象」のことです。

事象を標本空間 $\varOmega$ の部分集合とすると、$A$ の余事象は、$A$ の補集合に対応します。このような意味で、余事象は補集合と同じ記号 $\overline{A \, \vphantom{\big(\big)}}$ や $A^{c}$ などを用いて表されます。

差集合による表し方

また、$A$ の余事象は、集合の差(差集合)を用いて、次のようにも表せます。

$$ \begin{align*} \tag{1.2.4} \overline{A \, \vphantom{\big(\big)}} = \varOmega \setminus A \end{align*} $$

ここで、$2$ つの集合 $X, Y$ の差(差集合)$X \setminus Y$ は、$X$ の要素であって $Y$ の要素ではないもの全体の集合を表します。

2つの集合の差(差集合)を表すベン図

したがって、上記 (1.2.4)式は、$A$ の余事象 $\overline{A \, \vphantom{\big(\big)}}$ が、標本空間 $\varOmega$ の要素(根元事象)であって $A$ には含まれないもの全体であることを表しています。

余事象の確率を考える意義

確率の問題では、事象 $A$ そのものを考えるよりも、$A$ の余事象を考えた方が見通しが良い場合があります。

典型的な例は、「○○ が起こらない確率」や「少なくとも $1$ 回 ○○ が起こる確率」などです( 例題 1 を参照)。このような問題では、余事象をうまく使うことで計算が大幅に簡単になります。



証明(定理 1.5)

標本空間を $\varOmega$ とすると、事象 $A$ とその余事象 $\overline{A \, \vphantom{\big(\big)}}$ について、次が成り立つ。

$$ \begin{align*} A \cup \overline{A \, \vphantom{\big(\big)}} = \varOmega \end{align*} $$

よって、

$$ \begin{align*} P(A \cup \overline{A \, \vphantom{\big(\big)}}) = P(\varOmega) \end{align*} $$

いま、$A$ と $\overline{A \, \vphantom{\big(\big)}}$ は排反であるから、

$$ \begin{align*} P(A \cup \overline{A \, \vphantom{\big(\big)}}) = P(A) + P(\overline{A \, \vphantom{\big(\big)}}) \end{align*} $$

また、 確率の定義より、

$$ \begin{align*} P(\varOmega) = 1 \end{align*} $$

したがって、

$$ \begin{gather*} & P(A) + P(\overline{A \, \vphantom{\big(\big)}}) = 1 \\ \Leftrightarrow & P(\overline{A \, \vphantom{\big(\big)}}) = 1 - P(A) \tag*{$\square$} \end{gather*} $$



証明の考え方(定理 1.5)

確率の定義より直ちに導けます。特に、確率が 規格化されていることを用います。

具体的には、標本空間 $\varOmega$ を事象 $A$ と余事象 $\overline{A \, \vphantom{\big(\big)}}$ の和として表し、それぞれの確率の和が $1$ に等しいことを導きます。

前提事項の整理

  • 標本空間を $\varOmega$ として、ある事象 $A$ とその余事象 $\overline{A \, \vphantom{\big(\big)}}$ を考えます。

  • $A$ の余事象は「$A$ が起こらない事象」であり、$A$ の補集合に対応します( 余事象とはを参照)。

  • したがって、$A$ と $\overline{A \, \vphantom{\big(\big)}}$ の和、共通部分について、それぞれ次が成り立ちます。

    $$ \begin{align*} A \cup \overline{A \, \vphantom{\big(\big)}} &= \varOmega \tag{$\ast 1$} \\ A \cap \overline{A \, \vphantom{\big(\big)}} &= \phi \tag{$\ast 2$} \end{align*} $$

    • ($\ast 1$)式は、$A$ と $\overline{A \, \vphantom{\big(\big)}}$ の和が標本空間に等しいことを表しています。
    • ($\ast 2$)式は、$A$ と $\overline{A \, \vphantom{\big(\big)}}$ が排反であることを表しています。

ある事象と余事象の和の確率

  • ($\ast 1$)式より、事象 $A$ とその余事象 $\overline{A \, \vphantom{\big(\big)}}$ の和の確率について、次が成り立ちます。

    $$ \begin{align*} \tag{${\ast 1}^{\prime}$} P(A \cup \overline{A \, \vphantom{\big(\big)}}) = P(\varOmega) \end{align*} $$

  • 左辺の $P(A \cup \overline{A \, \vphantom{\big(\big)}})$ について、 ($\ast 2$)式より、次が成り立ちます。

    $$ \begin{align*} \tag{${\ast 2}^{\prime}$} P(A \cup \overline{A \, \vphantom{\big(\big)}}) = P(A) + P(\overline{A \, \vphantom{\big(\big)}}) \end{align*} $$

  • また、右辺の $P(\varOmega)$ について、 確率の定義より、次が成り立ちます。

    $$ \begin{align*} P(\varOmega) = 1 \end{align*} $$

  • 以上から、次が成り立ちます。

    $$ \begin{gather*} & P(A) + P(\overline{A \, \vphantom{\big(\big)}}) = 1 \\ \Leftrightarrow & P(\overline{A \, \vphantom{\big(\big)}}) = 1 - P(A) \end{gather*} $$



例題 1

サイコロを $3$ 回投げたとき、少なくとも $1$ 回は $1$ の目が出る確率を求めよ。



解答

事象 $A$ を「少なくとも $1$ 回は $1$ の目が出る」とすると、余事象 $\overline{A \, \vphantom{\big(\big)}}$ は「$1$ の目が $1$ 回も出ない」ことである。これは、「$3$ 回とも $1$ 以外の目が出る」ということだから、$\overline{A \, \vphantom{\big(\big)}}$ の確率は次の通り。

$$ \begin{align*} P(\overline{A \, \vphantom{\big(\big)}}) = \left(\frac{\, 5 \,}{\, 6 \,}\right)^{3} \end{align*} $$

したがって、$A$ の確率は次の通り。

$$ \begin{align*} P(A) &= 1 - P(\overline{A \, \vphantom{\big(\big)}}) \\ &= 1 - \left(\frac{\, 5 \,}{\, 6 \,}\right)^{3} \\ &= \frac{\, 91 \,}{\, 216 \,} \\ \end{align*} $$


解答の考え方

少なくとも $1$ 回 ○○ が起こる確率」を求める問題では、余事象を考えると見通しが良くなります。

例題 1 において、事象 $A$(少なくとも $1$ 回は $1$ の目が出る)の確率を直接求めようとすると、$1$ の目が $1$ 回出る場合、$2$ 回出る場合、$3$ 回出る場合、の $3$ つの場合の確率をそれぞれ計算する必要があります( 別解を参照)。

一方で、 定理 1.5(余事象の確率)を用いれば、余事象 $\overline{A \, \vphantom{\big(\big)}}$($3$ 回とも $1$ 以外の目が出る)の確率のみを考えればよいため、計算が簡単になります。

このように、「○○でない」や「少なくとも○○」といった表現が含まれる確率の問題では、 定理 1.5(余事象の確率)を用いることが有効です。


(別解)直接計算する方法

事象 $A$(少なくとも $1$ 回は $1$ の目が出る)の確率を直接求めます。

「少なくとも $1$ 回は $1$ の目が出る」という事象は、次の $3$ つの(それぞれ排反な)事象に分けられます。

これらの確率を $P(1), P(2), P(3)$ として別々に計算し、その和を求めます。

(1)1 の目が 1 回出る確率

何回目に $1$ の目が出るかは $\displaystyle\binom{3}{1} = 3$ 通りあるので、

$$ \begin{align*} P(1) &= \binom{3}{1} \cdot \left(\frac{\, 1 \,}{\, 6 \,}\right) \left(\frac{\, 5 \,}{\, 6 \,}\right)^{2} \\ &= \frac{\, 75 \,}{\, 216 \,} \vphantom{\bigcup^{\infin}} \\ \end{align*} $$

(2)1 の目が 2 回出る確率

何回目に $1$ の目が出るかは $\displaystyle\binom{3}{2} = 3$ 通りあるので、

$$ \begin{align*} P(2) &= \binom{3}{2} \cdot \left(\frac{\, 1 \,}{\, 6 \,}\right)^{2} \left(\frac{\, 5 \,}{\, 6 \,}\right) \\ &= \frac{\, 15 \,}{\, 216 \,} \vphantom{\bigcup^{\infin}} \\ \end{align*} $$

(3)1 の目が 3 回出る確率

$3$ 回とも $1$ の目が出るので、

$$ \begin{align*} P(3) &= \left(\frac{\, 1 \,}{\, 6 \,}\right)^{3} \\ &= \frac{\, 1 \,}{\, 216 \,} \vphantom{\bigcup^{\infin}} \\ \end{align*} $$

少なくとも $1$ 回は $1$ の目が出る確率

以上から、事象 $A$ の確率は、

$$ \begin{align*} P(A) &= P(1) + P(2) + P(3) \\ &= \frac{\, 75 \,}{\, 216 \,} + \frac{\, 15 \,}{\, 216 \,} + \frac{\, 1 \,}{\, 216 \,} \vphantom{\bigcup^{\infin}} \\ &= \frac{\, 91 \,}{\, 216 \,} \vphantom{\bigcup^{\infin}} \\ \end{align*} $$


解答の考え方の比較

$1$ の目が出る回数により標本空間 $\varOmega$ を分割すると、次が成り立ちます。

$$ \begin{align*} \Big\{ P(\varOmega) = \! \Big\} \; P(0) + P(1) + P(2) + P(3) = 1 \\ \end{align*} $$

したがって、事象 $A$(少なくとも $1$ 回は $1$ の目が出る)の確率は、 別解のように直接計算するよりも、

$$ \begin{align*} P(A) = P(1) + P(2) + P(3) \\ \end{align*} $$

上記の解答のように、余事象を考えて計算する方が簡単になります。

$$ \begin{align*} P(A) = 1 - P(0) \\ \end{align*} $$

例題 1 はサイコロを振る試行を $3$ 回繰り返す問題なので、 別解の計算量もまだ許容の範囲内といえます。しかしながら、繰り返し回数が $10$ 回、$20$ 回、$\cdots$ と増えていくと、 別解のような直接計算は現実的に難しくなっていきます。



確率の単調性

最後に、確率の単調性について示します。


定理 1.6(確率の単調性)

任意の事象 $A, B$ について、次が成り立つ。

$$ \begin{align*} \tag{1.2.5} A \sub B \quad \Rightarrow \quad P(A) \leqslant P(B) \end{align*} $$


解説

確率の単調性とは

確率の単調性とは、任意の事象 $A, B$ について、「$A$ が $B$ の部分集合であれば、$A$ の確率は $B$ の確率を超えない」という性質です。

単調性が成り立つとき、事象の(集合としての)包含関係が、確率の値の大小関係に移されるといえます。

例:確率の単調性

確率の単調性は、直感的には「より範囲の広い事象の方が、起こる確率が大きい」という性質と理解できます。

例えば、サイコロを $1$ 回振るとき、事象 $A$: 「$6$ の目が出る」、事象 $B$: 「偶数の目が出る」とすると、事象 $A$ は事象 $B$ に含まれます。

このとき、$6$ の目が出る確率 $\displaystyle\frac{\, 1 \,}{\, 6 \,}$ よりも、偶数の目が出る確率 $\displaystyle\frac{\, 1 \,}{\, 2 \,}$ の方が大きくなるというのは、直感的にも妥当といえます。

測度の単調性

単調性は( 確率測度に限らない)一般の測度について成り立ちます。すなわち、 可測空間 $(S, \mathcal{A})$ 上で定義された測度 $\mu$ について、$A_{1}, A_{2} \in \mathcal{A}$ かつ $A_{1} \sub A_{2}$ であれば $\mu(A_{1}) \leqslant \mu(A_{2})$ が成り立ちます。

確率測度とは、全測度が $1$ となるように規格化された測度のことでした( 定義 1.8(確率測度)を参照)。このことからも、単調性は確率の基本的な性質であるといえます。



証明(定理 1.6)

$A \sub B$ のとき、$B$ は $A$ と差集合 $B \setminus A$ の和に等しく、次が成り立つ。

$$ \begin{gather*} B = A \cup (B \setminus A) \end{gather*} $$

また、$A$ と $B \setminus A$ は排反であるから、

$$ \begin{alignat*} {3} && P(B) = P(A) &+ P(B \setminus A) \\ & \Leftrightarrow \quad & P(B) - P(A) &= P(B \setminus A) \\ &&& \geqslant 0 \\ \end{alignat*} $$

したがって、

$$ \begin{gather*} \tag*{$\square$} P(B) \geqslant P(A) \\ \end{gather*} $$



証明の考え方(定理 1.6)

確率の定義より直ちに導けます。特に、確率が 規格化されていることを用います。

具体的には、$A \sub B$ であることから、$B$ を $A$ とそれ以外の部分($B \setminus A$)の和に分解して確率を求め、$P(B) \geqslant P(A)$ を導きます。

前提事項の整理

  • $A \sub B$ のとき、$B$ は $A$ と $B \setminus A$ の和に分解できます。

    $$ \begin{align*} B &\overset{(\text{i})}{=} (B \cap A) \, \cup \, (B \cap \overline{A \, \vphantom{\big(\big)}}) \\ &\overset{(\text{ii})}{=} (B \cap A) \, \cup \, (B \setminus A) \\ &\overset{(\text{iii})}{=} A \, \cup \, (B \setminus A) \tag{$\ast 1$} \\ \end{align*} $$

    • ($\text{i}$)集合 $B$ は、$B \cap A$ と $B \cap \overline{A \, \vphantom{\big(\big)}}$ の和に分解できます。これは、一般の集合について成り立ちます。

    • ($\text{ii}$)差集合の定義によります。( 差集合による表し方を参照)。 $$ \begin{align*} B \setminus A = B \cap \overline{A \, \vphantom{\big(\big)}} \end{align*} $$

    • ($\text{iii}$)$A \sub B$ であるとき、$A \cap B = A$ が成り立ちます。このことは、次のように確かめられます。

      • まず、$a \in A \cap B$ $\Rightarrow$ $a \in A$ より、$A \cap B \sub A$ が成り立ちます。
      • 次に、$A \sub B$ であることから、$a \in A$ $\Rightarrow$ $a \in B$ なので、$A \sub A \cap B$ が成り立ちます。
      • したがって、$A \cap B \sub A$ かつ $A \sub A \cap B$ より、$A \cap B = A$ が成り立ちます。
  • また、$A$ と $B \setminus A$ は排反です。

    $$ \begin{align*} A \, \cap \, (B \setminus A) = \phi \\ \end{align*} \tag{$\ast 2$} $$

単調性の証明

  • ($\ast 1$)式($\ast 2$)式より、$B$ の確率について、次が成り立ちます。

    $$ \begin{gather*} & P(B) = P(A) + P(B \setminus A) \\ \Leftrightarrow \quad & P(B) - P(A) = P(B \setminus A) \\ \end{gather*} $$

  • ここで、$P(B \setminus A) \geqslant 0$ であることから、次が成り立ちます。

    $$ \begin{align*} P(B) - P(A) &= P(B \setminus A) \\ & \geqslant 0 \\ \end{align*} $$

  • したがって、$A \sub B$ のとき、$A$ の確率が $B$ の確率を超えないことが導かれます。

    $$ \begin{gather*} P(B) \geqslant P(A) \\ \end{gather*} $$

  • 以上から、確率の単調性が示されました。



参考文献

[1] 舟木直久. 確率論. 朝倉書店. 2004.
[2] 縄田和満. 確率・統計 $\text{I}$. 丸善出版. 2013.
[3] 小針晛宏. 確率・統計入門. 岩波書店. 1973.
[4] 真貝寿明. 徹底攻略 確率統計. 共立出版. 2012.
[5] 東京大学教養学部統計学教室 編. 統計学入門. 東京大学出版会. 1991.
[6] W. Feller. An Introduction to Probability Theory and Its Applications. John Wiley & Sons, Inc.. 1968.
[7] Robert B. Ash. Basic Probability Theory. Dover Publications, Inc.. 2008.
[8] G. Andrews. Special Functions. Cambridge University Press. 1999.
[9] 杉浦光夫. 解析入門 $\text{I}$. 東京大学出版会. 1980.
[10] 吉田伸生. [新装版] ルベーグ積分入門. 日本評論社. 2021.


初版:2025-09-30   |   改訂:2025-10-08