確率の基本的性質(1)
空事象の確率、余事象の確率、確率の単調性に関する定理を示します。
これらは、確率の基本的な性質を示す定理であり、いずれも 確率の定義から導くことができます。
空事象の確率
まず、空事象の確率について成り立つ性質を示します。
定理 1.4(空事象の確率)
$\phi$ を空事象とすると、次が成り立つ。
解説
空事象の確率
定理 1.4(空事象の確率)は、空事象の確率が $0$ に等しいことを示しています。
空事象とは:根元事象を含まない事象
空事象($\text{null}$ $\text{event}$ $\text{/}$ $\text{empty}$ $\text{event}$)とは、「どの根元事象(標本)も含まない事象」であり、記号 $\phi$ を用いて表します。
起こり得ることがら全体の集合(標本空間)を $\varOmega$ とすると、事象とは $\varOmega$ の部分集合(正確には、$\varOmega$ 上の 可算加法族)のことでした( 確率の定義)。
ここで、空事象は空集合に対応する事象です。このような意味で、空事象は空集合と同じ文字 $\phi$ を用いて表されます。
空事象が事象であることの確認
空事象が事象であることは、次のようにして確かめられます。
まず、空集合 $\phi$ が標本空間 $\varOmega$ の部分集合であることは明らかです。
更に、空集合 $\phi$ が 可算加法族の要素であることは、空集合が標本空間の補集合であること($\phi = \overline{\varOmega \, \vphantom{\big(\big)}}$)と 可算加法族の条件($\text{i}$)($\text{ii}$)から直ちに導けます。
空事象の意味
空事象 $\phi$ は「どの根元事象(標本)も含まない事象」であり、 確率空間(確率モデル)における下限を表す「基準的な事象」といえます。
基準的な事象(標本空間と空事象)
標本空間 $\varOmega$ は「試行により起こり得るすべての結果を含む集合」であり、 確率の定義より、$P(\varOmega) = 1$ です。
これに対して、空事象 $\phi$ は「いかなる結果も含まない集合」に対応する事象であり、 定理 1.4(空事象の確率)より、$P(\phi) = 0$ となります。
また、確率は、その値が $0 \sim 1$ の範囲に収まるように 規格化されています( 確率の定義)。
したがって、標本空間と空事象は、それぞれ、 確率空間(確率モデル)の上限と下限を表す「基準的な事象」としての意味合いを持ちます。
空事象の表現とその解釈
空事象は「どの根元事象(標本)も含まない事象」です。「何も起こらない事象」や「決して起こり得ない事象」などと表現されることもありますが、その解釈には注意が必要です。
「何も起こらない事象」の意味
「何も起こらない事象」というと、試行が実行されていない状態や、試行の結果が定まらない(観測できない)状態をイメージしてしまうかもしれませんが、これは誤りです。
確率論においては、試行の結果が客観的に定まるという前提の下、起こり得る結果全体の集合(すなわち標本空間)が定義されます。
したがって、空事象を「何も起こらない事象」というとき、これは「どのような結果もその事象に属さない」ということを意味しています。「試行の結果が定まらない」という意味ではないので、その点注意が必要です。
「決して起こり得ない事象」の意味
「決して起こり得ない事象」、すなわち確率が $0$ に等しい事象が、必ずしも空事象であるとは限りません。
空事象の確率は $0$ に等しい( 定理 1.4(空事象の確率))ですが、空事象ではないものの、確率が $0$ に等しい事象は多く存在します。例えば、「硬貨投げで表が出続ける」という事象の確率は $0$ に等しくなりますが、これは空事象ではありません。(測度論において、このような事象に対応する集合は、測度零集合と呼ばれます)。
したがって、空事象を「決して起こり得ない事象」というとき、これは「根元事象を $1$ つも含まない」(だから、確率が $0$ に等しい)ということを意味しています。「確率が $0$ に等しい事象」が空集合とはいえないので、その点注意が必要です。
証明(定理 1.4)
標本空間を $\varOmega$ とすると、$\varOmega$ と $\phi$ の和について、次が成り立つ。
よって、
また、$\varOmega$ と $\phi$ は排反であるから、
したがって、
証明の考え方(定理 1.4)
確率の定義より直ちに導けます。特に、確率が 可算加法性を満たすことを用います。
具体的には、標本空間 $\varOmega$ と空事象 $\phi$ の和の確率を $2$ 通りに表すことで、空事象の確率が $0$ に等しいことを導きます。
前提事項の整理
標本空間を $\varOmega$ 、空事象を $\phi$ とします。
空事象 $\phi$ は「どの根元事象も含まない事象」であり、空集合に対応しています( 空事象とはを参照)。
したがって、$\varOmega$ と $\phi$ の和、共通部分について、それぞれ次が成り立ちます。
$$ \begin{align*} \varOmega \cup \phi &= \varOmega \tag{$\ast 1$} \\ \varOmega \cap \phi &= \phi \tag{$\ast 2$} \end{align*} $$- ($\ast 2$)式は、$\varOmega$ と $\phi$ が排反であることを表しています。
標本空間と空事象の和の確率
($\ast 1$)式より、標本空間 $\varOmega$ と空事象 $\phi$ の和の確率について、次が成り立ちます。
$$ \begin{align*} \tag{${\ast 1}^{\prime}$} P(\varOmega \cup \phi) = P(\varOmega) \end{align*} $$左辺の $P(\varOmega \cup \phi)$ について、 ($\ast 2$)式より、次が成り立ちます。
$$ \begin{align*} \tag{${\ast 2}^{\prime}$} P(\varOmega \cup \phi) = P(\varOmega) + P(\phi) \end{align*} $$- ($\ast 2$)式より、$\varOmega$ と $\phi$ は排反です。
- 確率の 可算加法性より、排反な事象の和の確率は、それぞれの確率の和に等しくなります( 確率の定義)。
以上から、次が成り立ちます。
$$ \begin{gather*} & P(\varOmega) = P(\varOmega) + P(\phi) \\ \Rightarrow & P(\phi) = 0 \end{gather*} $$- 上記の 証明では、標本空間 $\varOmega$ と空事象 $\phi$ の和を考えましたが、任意の事象 $A \in \mathcal{F}$ と空事象 $\phi$ の和を考えても、同様に証明できます。
余事象の確率
次に、余事象の確率について成り立つ性質を示します。
定理 1.5(余事象の確率)
任意の事象 $A$ について、次が成り立つ。ただし、$\overline{A \, \vphantom{\big(\big)}}$ は $A$ の余事象を表す。
解説
余事象の確率
定理 1.5(余事象の確率)は、任意の事象 $A$ とその余事象 $\overline{A \, \vphantom{\big(\big)}}$ の確率について成り立つ関係を示しています。すなわち、余事象 $\overline{A \, \vphantom{\big(\big)}}$ の確率は、$1$ からもとの事象 $A$ の確率を減じた値に等しくなります。
余事象とは:ある事象が起こらない事象
余事象($\text{complementary}$ $\text{event}$)とは、ある事象 $A$ に対して「$A$ が起こらない事象」のことです。
事象を標本空間 $\varOmega$ の部分集合とすると、$A$ の余事象は、$A$ の補集合に対応します。このような意味で、余事象は補集合と同じ記号 $\overline{A \, \vphantom{\big(\big)}}$ や $A^{c}$ などを用いて表されます。
差集合による表し方
また、$A$ の余事象は、集合の差(差集合)を用いて、次のようにも表せます。
ここで、$2$ つの集合 $X, Y$ の差(差集合)$X \setminus Y$ は、$X$ の要素であって $Y$ の要素ではないもの全体の集合を表します。

したがって、上記 (1.2.4)式は、$A$ の余事象 $\overline{A \, \vphantom{\big(\big)}}$ が、標本空間 $\varOmega$ の要素(根元事象)であって $A$ には含まれないもの全体であることを表しています。
余事象の確率を考える意義
確率の問題では、事象 $A$ そのものを考えるよりも、$A$ の余事象を考えた方が見通しが良い場合があります。
典型的な例は、「○○ が起こらない確率」や「少なくとも $1$ 回 ○○ が起こる確率」などです( 例題 1 を参照)。このような問題では、余事象をうまく使うことで計算が大幅に簡単になります。
証明(定理 1.5)
標本空間を $\varOmega$ とすると、事象 $A$ とその余事象 $\overline{A \, \vphantom{\big(\big)}}$ について、次が成り立つ。
よって、
いま、$A$ と $\overline{A \, \vphantom{\big(\big)}}$ は排反であるから、
また、 確率の定義より、
したがって、
証明の考え方(定理 1.5)
確率の定義より直ちに導けます。特に、確率が 規格化されていることを用います。
具体的には、標本空間 $\varOmega$ を事象 $A$ と余事象 $\overline{A \, \vphantom{\big(\big)}}$ の和として表し、それぞれの確率の和が $1$ に等しいことを導きます。
前提事項の整理
標本空間を $\varOmega$ として、ある事象 $A$ とその余事象 $\overline{A \, \vphantom{\big(\big)}}$ を考えます。
$A$ の余事象は「$A$ が起こらない事象」であり、$A$ の補集合に対応します( 余事象とはを参照)。
したがって、$A$ と $\overline{A \, \vphantom{\big(\big)}}$ の和、共通部分について、それぞれ次が成り立ちます。
$$ \begin{align*} A \cup \overline{A \, \vphantom{\big(\big)}} &= \varOmega \tag{$\ast 1$} \\ A \cap \overline{A \, \vphantom{\big(\big)}} &= \phi \tag{$\ast 2$} \end{align*} $$- ($\ast 1$)式は、$A$ と $\overline{A \, \vphantom{\big(\big)}}$ の和が標本空間に等しいことを表しています。
- ($\ast 2$)式は、$A$ と $\overline{A \, \vphantom{\big(\big)}}$ が排反であることを表しています。
ある事象と余事象の和の確率
($\ast 1$)式より、事象 $A$ とその余事象 $\overline{A \, \vphantom{\big(\big)}}$ の和の確率について、次が成り立ちます。
$$ \begin{align*} \tag{${\ast 1}^{\prime}$} P(A \cup \overline{A \, \vphantom{\big(\big)}}) = P(\varOmega) \end{align*} $$左辺の $P(A \cup \overline{A \, \vphantom{\big(\big)}})$ について、 ($\ast 2$)式より、次が成り立ちます。
$$ \begin{align*} \tag{${\ast 2}^{\prime}$} P(A \cup \overline{A \, \vphantom{\big(\big)}}) = P(A) + P(\overline{A \, \vphantom{\big(\big)}}) \end{align*} $$- ($\ast 2$)式より、$\varOmega$ と $\phi$ は排反です。
- 確率の 可算加法性より、排反な事象の和の確率は、それぞれの確率の和に等しくなります( 確率の定義)。
また、右辺の $P(\varOmega)$ について、 確率の定義より、次が成り立ちます。
$$ \begin{align*} P(\varOmega) = 1 \end{align*} $$以上から、次が成り立ちます。
$$ \begin{gather*} & P(A) + P(\overline{A \, \vphantom{\big(\big)}}) = 1 \\ \Leftrightarrow & P(\overline{A \, \vphantom{\big(\big)}}) = 1 - P(A) \end{gather*} $$
例題 1
サイコロを $3$ 回投げたとき、少なくとも $1$ 回は $1$ の目が出る確率を求めよ。
解答
事象 $A$ を「少なくとも $1$ 回は $1$ の目が出る」とすると、余事象 $\overline{A \, \vphantom{\big(\big)}}$ は「$1$ の目が $1$ 回も出ない」ことである。これは、「$3$ 回とも $1$ 以外の目が出る」ということだから、$\overline{A \, \vphantom{\big(\big)}}$ の確率は次の通り。
したがって、$A$ の確率は次の通り。
解答の考え方
「少なくとも $1$ 回 ○○ が起こる確率」を求める問題では、余事象を考えると見通しが良くなります。
例題 1 において、事象 $A$(少なくとも $1$ 回は $1$ の目が出る)の確率を直接求めようとすると、$1$ の目が $1$ 回出る場合、$2$ 回出る場合、$3$ 回出る場合、の $3$ つの場合の確率をそれぞれ計算する必要があります( 別解を参照)。
一方で、 定理 1.5(余事象の確率)を用いれば、余事象 $\overline{A \, \vphantom{\big(\big)}}$($3$ 回とも $1$ 以外の目が出る)の確率のみを考えればよいため、計算が簡単になります。
このように、「○○でない」や「少なくとも○○」といった表現が含まれる確率の問題では、 定理 1.5(余事象の確率)を用いることが有効です。
(別解)直接計算する方法
事象 $A$(少なくとも $1$ 回は $1$ の目が出る)の確率を直接求めます。
「少なくとも $1$ 回は $1$ の目が出る」という事象は、次の $3$ つの(それぞれ排反な)事象に分けられます。
これらの確率を $P(1), P(2), P(3)$ として別々に計算し、その和を求めます。
(1)1 の目が 1 回出る確率
何回目に $1$ の目が出るかは $\displaystyle\binom{3}{1} = 3$ 通りあるので、
(2)1 の目が 2 回出る確率
何回目に $1$ の目が出るかは $\displaystyle\binom{3}{2} = 3$ 通りあるので、
(3)1 の目が 3 回出る確率
$3$ 回とも $1$ の目が出るので、
少なくとも $1$ 回は $1$ の目が出る確率
以上から、事象 $A$ の確率は、
解答の考え方の比較
$1$ の目が出る回数により標本空間 $\varOmega$ を分割すると、次が成り立ちます。
したがって、事象 $A$(少なくとも $1$ 回は $1$ の目が出る)の確率は、 別解のように直接計算するよりも、
上記の解答のように、余事象を考えて計算する方が簡単になります。
例題 1 はサイコロを振る試行を $3$ 回繰り返す問題なので、 別解の計算量もまだ許容の範囲内といえます。しかしながら、繰り返し回数が $10$ 回、$20$ 回、$\cdots$ と増えていくと、 別解のような直接計算は現実的に難しくなっていきます。
確率の単調性
最後に、確率の単調性について示します。
定理 1.6(確率の単調性)
任意の事象 $A, B$ について、次が成り立つ。
解説
確率の単調性とは
確率の単調性とは、任意の事象 $A, B$ について、「$A$ が $B$ の部分集合であれば、$A$ の確率は $B$ の確率を超えない」という性質です。
単調性が成り立つとき、事象の(集合としての)包含関係が、確率の値の大小関係に移されるといえます。
例:確率の単調性
確率の単調性は、直感的には「より範囲の広い事象の方が、起こる確率が大きい」という性質と理解できます。
例えば、サイコロを $1$ 回振るとき、事象 $A$: 「$6$ の目が出る」、事象 $B$: 「偶数の目が出る」とすると、事象 $A$ は事象 $B$ に含まれます。
このとき、$6$ の目が出る確率 $\displaystyle\frac{\, 1 \,}{\, 6 \,}$ よりも、偶数の目が出る確率 $\displaystyle\frac{\, 1 \,}{\, 2 \,}$ の方が大きくなるというのは、直感的にも妥当といえます。
測度の単調性
単調性は( 確率測度に限らない)一般の測度について成り立ちます。すなわち、 可測空間 $(S, \mathcal{A})$ 上で定義された測度 $\mu$ について、$A_{1}, A_{2} \in \mathcal{A}$ かつ $A_{1} \sub A_{2}$ であれば $\mu(A_{1}) \leqslant \mu(A_{2})$ が成り立ちます。
確率測度とは、全測度が $1$ となるように規格化された測度のことでした( 定義 1.8(確率測度)を参照)。このことからも、単調性は確率の基本的な性質であるといえます。
証明(定理 1.6)
$A \sub B$ のとき、$B$ は $A$ と差集合 $B \setminus A$ の和に等しく、次が成り立つ。
また、$A$ と $B \setminus A$ は排反であるから、
したがって、
証明の考え方(定理 1.6)
確率の定義より直ちに導けます。特に、確率が 規格化されていることを用います。
具体的には、$A \sub B$ であることから、$B$ を $A$ とそれ以外の部分($B \setminus A$)の和に分解して確率を求め、$P(B) \geqslant P(A)$ を導きます。
前提事項の整理
$A \sub B$ のとき、$B$ は $A$ と $B \setminus A$ の和に分解できます。
$$ \begin{align*} B &\overset{(\text{i})}{=} (B \cap A) \, \cup \, (B \cap \overline{A \, \vphantom{\big(\big)}}) \\ &\overset{(\text{ii})}{=} (B \cap A) \, \cup \, (B \setminus A) \\ &\overset{(\text{iii})}{=} A \, \cup \, (B \setminus A) \tag{$\ast 1$} \\ \end{align*} $$($\text{i}$)集合 $B$ は、$B \cap A$ と $B \cap \overline{A \, \vphantom{\big(\big)}}$ の和に分解できます。これは、一般の集合について成り立ちます。
($\text{ii}$)差集合の定義によります。( 差集合による表し方を参照)。 $$ \begin{align*} B \setminus A = B \cap \overline{A \, \vphantom{\big(\big)}} \end{align*} $$
($\text{iii}$)$A \sub B$ であるとき、$A \cap B = A$ が成り立ちます。このことは、次のように確かめられます。
- まず、$a \in A \cap B$ $\Rightarrow$ $a \in A$ より、$A \cap B \sub A$ が成り立ちます。
- 次に、$A \sub B$ であることから、$a \in A$ $\Rightarrow$ $a \in B$ なので、$A \sub A \cap B$ が成り立ちます。
- したがって、$A \cap B \sub A$ かつ $A \sub A \cap B$ より、$A \cap B = A$ が成り立ちます。
また、$A$ と $B \setminus A$ は排反です。
$$ \begin{align*} A \, \cap \, (B \setminus A) = \phi \\ \end{align*} \tag{$\ast 2$} $$
単調性の証明
($\ast 1$)式と ($\ast 2$)式より、$B$ の確率について、次が成り立ちます。
$$ \begin{gather*} & P(B) = P(A) + P(B \setminus A) \\ \Leftrightarrow \quad & P(B) - P(A) = P(B \setminus A) \\ \end{gather*} $$ここで、$P(B \setminus A) \geqslant 0$ であることから、次が成り立ちます。
$$ \begin{align*} P(B) - P(A) &= P(B \setminus A) \\ & \geqslant 0 \\ \end{align*} $$したがって、$A \sub B$ のとき、$A$ の確率が $B$ の確率を超えないことが導かれます。
$$ \begin{gather*} P(B) \geqslant P(A) \\ \end{gather*} $$以上から、確率の単調性が示されました。
参考文献
[1] 舟木直久. 確率論. 朝倉書店. 2004.
[2] 縄田和満. 確率・統計 $\text{I}$. 丸善出版. 2013.
[3] 小針晛宏. 確率・統計入門. 岩波書店. 1973.
[4] 真貝寿明. 徹底攻略 確率統計. 共立出版. 2012.
[5] 東京大学教養学部統計学教室 編. 統計学入門. 東京大学出版会. 1991.
[6] W. Feller. An Introduction to Probability Theory and Its Applications. John Wiley & Sons, Inc.. 1968.
[7] Robert B. Ash. Basic Probability Theory. Dover Publications, Inc.. 2008.
[8] G. Andrews. Special Functions. Cambridge University Press. 1999.
[9] 杉浦光夫. 解析入門 $\text{I}$. 東京大学出版会. 1980.
[10] 吉田伸生. [新装版] ルベーグ積分入門. 日本評論社. 2021.