確率の定義

確率とは、「事象の起こりやすさ」を表す概念です。数学的には、起こり得ることがら全体(標本空間)の部分集合(事象)の関数として定義されます。

ここでは、確率の $3$ つの定義(ラプラスによる 古典的な定義、相対頻度による 統計的な定義、コルモゴロフによる 公理的な定義)について整理するとともに、公理的な定義が他の定義を包含するものであることを確かめます。

確率の定義

まず、確率の定義を示します。これは、確率の 公理的な定義に則った定義です。


定義 1.4(確率)

起こり得ることがら全体の集合を $\varOmega$ として、事象 $A$ を $\varOmega$ の部分集合とする。このとき、次の $3$ つの条件を満たす実数値関数 $P(A)$ を、事象 $A$ の確率($\text{probability}$)という。

($\text{i}$)任意の $A$ に対して、$0 \leqslant P(A) \leqslant 1 \vphantom{\bigcup_{i}}$ が成り立つ。

($\text{ii}$)$P(\varOmega \,) = 1 \vphantom{\bigcup_{i}}$

($\text{iii}$)互いに排反である事象 $A_{1}, A_{2}, \cdots$ に対して、次が成り立つ。 $$ \begin{align*} P \Big(\bigcup_{i}^{\infin} A_{i} \Big) = \sum_{i}^{\infin} \, P(A_{i}) \end{align*} $$



解説

確率の概念

確率とは、一般的に「事象の起こりやすさ」を表す概念です。数学的には、起こり得ることがら全体の部分集合(事象)の関数であり、 上記の条件($\text{i}$)$\sim$($\text{iii}$)を満たすものとして定義されます。


基本的な用語(標本空間、事象、確率)

確率について考えるために必要となる、基本的な用語について整理します。

標本空間 $\varOmega$:起こり得ることがら全体の集合

標本空間($\text{sample}$ $\text{space}$)とは、起こり得ることがら全体の集合であり、$\varOmega$ などの文字で表します。また、標本空間の $\varOmega$ の要素を標本($\text{sample}$)といい、$\omega$ などで表します。

例えば、サイコロを $1$ 回振る場合、標本空間は $\varOmega = \{\, 1, 2, 3, 4, 5, 6 \, \}$ です。また、サイコロを振った結果として出た目のそれぞれが標本に対応しており、$\omega_{1} = 1, \, \omega_{2} = 2, \cdots \,$ と表せます。

事象 $A$:標本空間 $\varOmega$ の部分集合

標本空間 $\varOmega$ の部分集合を事象($\text{event}$)といい、$A$ などで表します。$A$ が $\varOmega$ の部分集合であることを $A \sub \varOmega$ と表します。

特に、$1$ つの標本のみからなり、それ以上分解できない事象を根元事象($\text{elementary}$ $\text{event}$)といいます。これに対して、複数の標本からなり、複数の根元事象の和として表せるものを複合事象($\text{compound}$ $\text{event}$)といいます。

例えば、サイコロを $1$ 回振る場合、「$4$ の目が出る」という事象を $A_{4}$ とすると、$A_{4}$ は根元事象であり、$A_{4} = \{\,\omega_{4}\,\} = \{\, 4 \, \}$ のように表せます。また、「偶数の目が出る」という事象を $A_{\text{e}}$ とすると、$A_{\text{e}}$ は複合事象であり、$A_{\text{e}} = \{\, \omega_{2}, \omega_{4}, \omega_{6} \, \} = \{\, 2, 4, 6 \, \}$ です。

事象であるための条件

一般に、事象であるためには、標本空間の任意の部分集合であるだけではなく、可算回の集合演算について閉じている必要があります。

標本空間 $\varOmega$ が有限個の標本からなる(有限集合である)場合、$\varOmega$ のべき集合(部分集合全体の集合)は、可算回の集合演算について閉じています。したがって、この場合、$\varOmega$ の任意の部分集合は事象たり得ます。

しかしながら、より一般に標本空間 $\varOmega$ が無限個の標本からなる(無限集合である)場合もあります。例えば、実数全体の集合 $\mathbb{R} = (- \infin, + \infin)$ を標本空間とする場合などです。

このような場合において、確率を矛盾なく定義するためには、事象は 可算加法族の要素である必要があります。可算加法族とは、簡単にいえば、$\varOmega$ のべき集合のうち、可算回の集合演算について閉じている集合の集まりです( 下記を参照)。

確率 $P$:集合関数

確率($\text{probability}$)とは、任意の事象に対して $0 \sim 1$ の実数を対応させる関数です。事象 $A$ の確率を $P(A)$ と表します。

上記の通り、事象 $A$ とは標本空間 $\varOmega$ の部分集合に他なりません。したがって、確率 $P$ は部分集合 $A$ に対して定義される関数、すなわち集合関数であるといえます。

$$ \begin{align*} P : A \to [\, 0, 1 \,] \end{align*} $$


確率が満たすべき公理

定義 1.4(確率)は、下記に詳述する、確率の 公理的な定義に則っています。すなわち、 定義 1.4(確率)の条件($\text{i}$)$\sim$($\text{iii}$)は、確率が満たすべき公理を示しています。

規格化されていること

条件($\text{i}$)と($\text{ii}$)は、確率の値が $0 \sim 1$ の範囲に規格化されていることを示しています。

$$ \begin{gather*} (\text{i}) & 0 \leqslant P(A) \leqslant 1 \\ (\text{ii}) & P(\varOmega) = 1 \\ \end{gather*} $$

すなわち、($\text{i}$)任意の事象 $A$ について、確率の値 $P(A)$ は $0 \sim 1$ の範囲にあり、($\text{ii}$)標本空間全体の確率 $P(\varOmega)$ は $1$ に等しくなります。

可算加法性($\sigma\text{-}$加法性)を満たすこと

条件($\text{iii}$)は、互いに排反な(同時に起こらない)事象の和の確率が、それぞれの確率の和に等しくなることを示しています。

$$ \begin{gather*} (\text{iii}) & A_{i} \cap A_{j} \! = \! \phi \quad (i \neq j) \; \Rightarrow \; P \Big(\bigcup_{i}^{\infin} A_{i} \Big) \! = \! \sum_{i}^{\infin} \, P(A_{i}) \\ \end{gather*} $$

すなわち、事象 $A_{1}, A_{2}, \cdots$ が互いに排反であるとすると、次が成り立ちます。

$$ \begin{gather*} P (A_{1} \cup A_{2} \cup \cdots) = P(A_{1}) + P(A_{2}) + \cdots \\ \end{gather*} $$

このような性質を可算加法性(または、$\sigma\text{-}$加法性、完全加法性)といいます。

有限加法性と可算加法性の違い

一般に、確率の加法性とは、互いに排反な(同時に起こらない)$2$ つの事象 $A, B$ に対して、$P(A \cup B) = P(A) + P(B)$ が成り立つことをいいます。

特に、有限個の事象に対して加法性が成り立つことを有限加法性といいます。これに対して、可算無限個の事象に対して加法性が成り立つことを可算加法性といいます。

硬貨投げやサイコロ振りなど、標本空間が有限個の標本からなる場合、その部分集合である事象も有限個になります。したがって、確率が 条件($\text{iii}$)の要求する可算加法性を満たすことは、さほど重要ではありません。(有限加法性を満たせば十分です。)

しかしながら、標本空間が無限個の標本からなる場合や、確率変数の収束などについて考える場合、確率が可算加法性を満たしていることは大変重要です。


確率の考え方(3つの定義)

次に、歴史的に様々な立場から与えられてきた、確率の $3$ つの定義とその考え方を示します。

古典的な定義(ラプラス)

まずは、確率の古典的な定義を示します。シンプルでわかりやすい考え方に基づく定義で、高校数学でも用いられます。


定義 1.5(古典的な確率)

$N$ 個の根元事象があり、それらは同様に確からしい($\text{equally}$ $\text{likely}$)とする。このとき、事象 $A$ が $r$ 個の根元事象を含むとすると、$A$ の起こる確率 $P(A)$ は、次の式で与えられる。

$$ \begin{align*} \tag{1.2.1} P(A) = \frac{\; r \;}{\; N \vphantom{\big(\big)} \;} \end{align*} $$


確率の古典的な定義とは

確率の古典的な定義は、$18$ 世紀から $19$ 世紀初頭にかけて、ラプラス($\text{Pierre-Simon}$ $\text{Laplace}$)により体系的にまとめられたものです。

「すべての根元事象(標本)が同等に起こりやすい」と仮定した上で、ある事象 $A$ が起こる確率 $P(A)$ を、次のように定義します。

$$ \begin{align*} P(A) = \frac{\footnotesize{事象Aに含まれる根元事象の数}}{\footnotesize{すべての根元事象の数}} \end{align*} $$

このような定義は場合の数の数え上げと相性が良く、事象 $A$ が起こる確率 $P(A)$ は、次のように計算できます。

$$ \begin{align*} P(A) = \frac{\footnotesize{事象Aが起こる場合の数}}{\footnotesize{試行の結果起こるすべての場合の数}} \end{align*} $$

例:古典的な確率の計算

古典的な確率で扱いやすい問題は、標本空間が有限個の標本からなる(場合の数が数え上げられる)かつ、「すべての根元事象(標本)が同等に起こりやすい」とみなせるような問題です。

典型的には、硬貨投げやトランプ、くじ引きなどがあります。高校数学で扱う問題は、主に古典的な確率の問題といえます。

例 1:サイコロを $1$ 回振って偶数の目が出る確率
  • 標本空間:$\varOmega = \{\, 1, 2, 3, 4, 5, 6 \, \}$
  • 事象 $A = \{\, 2, 4, 6 \, \}$

したがって、サイコロを $1$ 回振った結果として偶数の目が出る確率は、次の通りです。

$$ \begin{align*} P(A) = \frac{\, 3 \,}{\, 6 \,} = \frac{\, 1 \,}{\, 2 \,} \end{align*} $$

例 1:トランプを $2$ 枚引いた結果、どちらもハートである確率
  • トランプから $2$ 枚のカードを引く場合の数:

    $$ \begin{align*} \binom{52}{2} &= \frac{\, 52 \cdot 51 \,}{\, 2 \cdot 1 \,} \\ &= 1326 \; (\small{\text{通り}}) \vphantom{\Big(\Big)} \end{align*} $$

  • 事象 $A$(ハートを $2$ 枚引く)が起こる場合の数:

    $$ \begin{align*} \binom{13}{2} &= \frac{\, 13 \cdot 12 \,}{\, 2 \cdot 1 \,} \\ &= 78 \; (\small{\text{通り}}) \vphantom{\Big(\Big)} \end{align*} $$

したがって、トランプを $2$ 枚引いた結果どちらもハートである確率は、次の通りです。

$$ P(A) = \frac{\, 78 \,}{\, 1326 \,} = \frac{\, 1 \,}{\, 17 \,} $$

同様の考え方により、ポーカーなどのゲームで手札に役(特定のカードの組合せ)がそろう確率が計算できます。

古典的な定義の限界

確率の 古典的な定義は、シンプルでわかりやすい考え方です。しかしながら、より一般的な現象を扱うにはいくつかの限界があります。

主な問題点は、次の通りです。

「同様に確からしい」という仮定が曖昧

「すべての根元事象が同等に起こりやすい」と仮定してよい数学的な根拠はありません。

また、このような仮定が妥当と考えられる場合もありますが、何をもって「同様に起こりやすい」とするかという点に曖昧さが残ります($\text{Bertrand}$ の逆説など)。

無限集合に対応できない

古典的な確率で扱えるのは、標本空間が有限個の標本からなる(有限集合である)場合に限られます。

例えば、「区間 $[\, 0, 1 \,]$ から実数を $1$ つ選ぶ」ような試行を考えるとき、標本空間は無限集合(非可算集合)となり、「場合の数」を数えることができません。


統計的な定義(相対頻度)

次に、確率の統計的な定義を示します。統計学と相性が良い実践的な定義で、様々な分野で活用されています。


定義 1.6(統計的な確率)

$n$ 回の試行で事象 $A$ が $n_{A}$ 回起こるとき、その割合 $\displaystyle\frac{\, n_{A} \,}{\, n \,}$ を相対頻度($\text{relative}$ $\text{frequency}$)という。$n$ を限りなく大きくしたときに、相対頻度が一定の値 $p$ に近づくとき、$p$ を事象 $A$ の起こる確率とする。



確率の統計的な定義とは

確率の統計的な定義とは、確率を相対頻度の極限値として定義するものです。

相対頻度

相対頻度とは、同じ試行を繰り返し行った結果、注目する事象が起こる割合のことです。

ある試行を $n$ 回繰り返し行った結果、事象 $A$ が $n_{A}$ 回起こったとすると、相対頻度は $\displaystyle\frac{\, n_{A} \,}{\, n \,}$ となります。

相対頻度の極限値

いま、試行回数 $n$ を限りなく大きくすると、相対頻度はある一定の値( $p$ とします)に収束すると予想されます。

$$ \begin{align*} \frac{\, n_{A} \,}{\, n \,} \to p \quad (n \to + \infin) \end{align*} $$

このように「相対頻度が一定値に収束する」という前提の下、その極限値を確率として定義します。

$$ \begin{align*} P(A) = \lim_{n \to + \infin} \frac{\, n_{A} \,}{\, n \,} = p \end{align*} $$

統計的な定義の考え方(経験的な確率)

確率の 統計的な定義は、実験や観測を繰り返すことで「真の確率」が得られる、という考え方に基づいています。

例えば、硬貨を投げて表裏を確認するという試行を $100$ 回繰り返した結果、表が出た回数が $52$ 回であったとすると、$100$ 回までの試行で表が出る相対頻度は $\displaystyle\frac{\, 52 \,}{\, 100 \,} = 0.52$ です。

硬貨に偏りがなければ、試行回数を $1000$ 回、$10000$ 回、$100000$ 回、$\cdots$ と増やしていくにつれて、相対頻度は $0.5$ に近づいていくと予想されます。あくまで、これは経験則(あるいは直感)に基づく予想です。

このように、実験や観測を繰り返すことで得られる値を「真の確率」であるとするのが、確率の統計的な定義の基礎にある考え方です。

例:統計的な確率の活用

統計的な確率は、過去の実績に基づき将来を予測・評価する枠組みとして、様々な分野で活用されています。

例 1:人口動態の推計

例えば、人口推計では、出生率や死亡率を「ある年齢階級・性別の集団で一定期間に観測された出生や死亡の比率」として算出し、これらの指標をもとに将来の人口動態を推計します。

例 2:その他自然現象・社会現象における応用例

また、天気予報における降水確率、製造業における不良品の発生率、疫学における疾病の発症率・死亡率、保険数理における事故や災害の発生率なども、基本的には過去の観測データに基づく統計的な確率を用いています。

実際には、多くの分野で複雑な統計的手法や数理モデルによる補正が組み合わされています。しかしながら、その根底には統計的な確率の考え方があります。

統計的な定義の限界

確率の 統計的な定義は、様々な現象に応用できる実践的なものです。しかしながら、数学的な厳密さの点で不足があります。

主な問題点は、次の通りです。

相対頻度が収束する根拠がない

定義 1.6(統計的な確率)の前提である「相対頻度が一定値に収束する」ことに、数学的に厳密な根拠はありません。

試行回数を限りなく大きくすれば、ある事象が起こる割合(相対頻度)が一定値に収束するということは、直感的には正しいと感じられます。

しかしながら、あくまでこれは経験則(あるいは直感)に基づく予想であり、数学的に厳密な根拠はありません。

「無限回の試行」は現実的に不可能

極限値への収束は、無限に試行を繰り返した結果はじめて確認できますが、現実的には、実験は有限回しか行えません。

仮に「無限回の試行」が可能だとしても、毎回同じ値に収束するという保証はどこにもありません。

したがって、「相対頻度が一定値に収束する」ことを実際に確かめることは出来ません。


公理的な定義(コルモゴロフ)

最後に、確率の公理的な定義を示します。これは、確率の 古典的な定義統計的な定義の限界を踏まえて、数学的に厳密な論理体系として確率を定義するものです。

確率の公理的な定義とは

確率の公理的な定義は、$20$ 世紀にロシアの数学者コルモゴロフ($\text{Andrey}$ $\text{Nikolaevich}$ $\text{Kolmogorov}$)により体系化されました。コルモゴロフは、確率の 古典的な定義統計的な定義の限界を踏まえ、ルベーグの 測度論($\text{measure}$ $\text{theory}$) を用いて、数学的に厳密な論理体系として確率を定義しました。

測度とは、「長さ」や「面積」などの「大きさ」の概念を一般化したものです。また、測度論は、集合に対して一貫した大きさを割り当てる理論です。このような枠組みの中で、確率(確率測度)は「確率空間上の測度」として定義されます。

確率の公理的な定義により、「事象の起こりやすさ」といった曖昧で直感的な概念から切り離して、公理に基づく理論的な体系(確率空間)として、確率を扱うことができます。

確率空間 $(\varOmega, \mathcal{F}, P)$

確率空間は、次の $3$ つの結合概念です。

すなわち、標本空間 $\varOmega$ と、$\varOmega$ 上の可算加法族 $\mathcal{F}$ 、確率測度 $P$ を合わせて確率空間といい、$(\varOmega, \mathcal{F}, P)$ と表します。確率空間は、確率モデルと呼ばれることもあります。

ここで、標本空間 $\varOmega$ とは、起こり得ることがら全体の集合です。また、 可算加法族 $\mathcal{F}$ とは、$\varOmega$ 上の集合族であり、可算回の集合演算について閉じているもののことです( 下記を参照)。

このとき、確率 $P$ は、$(\varOmega, \mathcal{F})$ 上で定義された測度、すなわち、 確率測度として定義されます( 下記を参照)。

標本空間 $\varOmega$

標本空間とは、起こり得ることがら全体の集合であり、$\varOmega$ を用いて表します。これは、確率の 古典的な定義における標本空間と同じです。

ただし、 公理的な定義において、標本空間は有限集合に限らず無限集合でもよいとします。

つまり、標本空間は一般的な(特に何の構造も持たない)集合であるとして、有限個の標本からなる場合だけでなく、無限個の標本からなる場合(実数全体の集合 $\mathbb{R} = (- \infin, + \infin)$ など)を含めて考えます。

事象とは

標本空間 $\varOmega$ の部分集合のうち、特定の条件を満たすものを事象といいます。

上記において、事象とは標本空間 $\varOmega$ の部分集合であるとしました。しかしながら、標本空間が無限集合である場合を含めて数学的に矛盾なく扱うためには、部分集合であることに加えて、特定の条件を満たす必要があります。具体的には、可算回の集合演算について閉じている必要があります。

このような条件を満たす事象(部分集合)を扱うために、次のような 可算加法族を定義します。


定義 1.7(可算加法族)

集合 $\varOmega$ の部分集合からなる集合族 $\mathcal{F}$ で、次の $3$ つの条件を満たすものを可算加法族($\text{countably}$ $\text{additive}$ $\text{family}$)という。

$$ \begin{gather*} (\text{i}) & \varOmega \in \mathcal{F} \vphantom{\bigcup} \\ (\text{ii}) & A \in \mathcal{F} \; \Rightarrow \; \overline{A \vphantom{\big(\big)}\,} \in \mathcal{F} \vphantom{\bigcup^{\infin}} \\ (\text{iii}) & A_{i} \in \mathcal{F} \; (i = 1, 2, \cdots) \; \Rightarrow \; \bigcup_{i}^{\infin} \, A_{i} \in \mathcal{F} \\ \end{gather*} $$


可算加法族とは

可算加法族とは、次のような性質を満たす $\varOmega$ の部分集合の集まり(集合族)です。

  • ($\text{i}$)標本空間 $\varOmega$ を要素に持つ。
  • ($\text{ii}$)$A$ が $\mathcal{F}$ の要素であれば、$A$ の補集合 $\overline{A \vphantom{\big(\big)}\,}$ も $\mathcal{F}$ の要素である。
  • ($\text{iii}$)可算個の要素の和について閉じている。すなわち、$\mathcal{F}$ の要素(集合)の可算個の和(和集合)もまた $\mathcal{F}$ に含まれる。

条件($\text{ii}$)と($\text{iii}$)より、直ちに、$\mathcal{F}$ の要素の可算個の共通部分もまた $\mathcal{F}$ に含まれることが導かれます。したがって、可算加法族とは、可算回の集合演算に関して閉じている集合族といえます。

このような意味で、可算加法族は、完全加法族や $\sigma\text{-}$加法族、可算加法的集合族、$\sigma\text{-}$集合体などということもあります。

用語は教科書によって異なり、 [1][10] では $\sigma\text{-}$加法族が、 [2] では $\sigma\text{-}$集合体が、 [3] では $\sigma\text{-}$加法的集合族が、それぞれ用いられています。また、 [7] では $\sigma\text{-}$集合体に相当する、$\sigma\text{-field}$ が用いられています。

可測空間 $(\varOmega, \mathcal{F})$ とは

標本空間 $\varOmega$ と、$\varOmega$ 上の可算加法族 $\mathcal{F}$ の組を可測空間($\text{measurable}$ $\text{space}$)といい、$(\varOmega, \mathcal{F})$ と表します。

測度とは

$(\varOmega, \mathcal{F})$ が可測空間であり、$A \in \mathcal{F}$ であるとき、$A$ は可測($\text{measurable}$)であるといいます。これは、任意の $A \in \mathcal{F}$ に対して非負の実数を対応させる、次のような関数 $\mu$ が定義できるということを意味します。

$$ \begin{align*} \mu : \mathcal{F} \to [\, 0, +\infin \,] \end{align*} $$

また、可測空間上で定義された、上記の $\mu$ のような関数(集合関数)を測度($\text{measure}$)といいます。

ここで、$A$ の測度 $\mu (A)$ は「集合 $A$ の大きさ」を表す数であり、「長さ」や「面積」、「個数」」(あるいは「確率」 )などの概念を一般化したものです。


定義 1.8(確率測度)

$\varOmega$ を標本空間とし、$\mathcal{F}$ を $\varOmega$ 上の可算加法族とする。このとき、$\mathcal{F}$ 上で定義された実数値関数で、次の条件を満たすものを確率測度($\text{probability}$ $\text{measure}$)という。

($\text{i}$)任意の $A \in \mathcal{F}$ に対して、$0 \leqslant P(A) \leqslant 1 \vphantom{\bigcup_{i}}$ が成り立つ。
($\text{ii}$)$P(\varOmega \,) = 1 \vphantom{\bigcup_{i}}$
($\text{iii}$)互いに排反である事象 $A_{1}, A_{2}, \cdots \in \mathcal{F}$ に対して、次が成り立つ。 $$ \begin{align*} P \Big(\bigcup_{i}^{\infin} A_{i} \Big) = \sum_{i}^{\infin} \, P(A_{i}) \end{align*} $$


確率測度とは

可測空間 $(\varOmega, \mathcal{F})$ 上に定義された測度で、上記の 条件($\text{i}$)$\sim$($\text{iii}$)を満たすものを確率測度といいます。

規格化されていること

条件($\text{i}$)と($\text{ii}$)は、確率測度の値が $0 \sim 1$ の間に規格化されていることを示しています。すなわち、確率測度 $P$ は、次のような関数(集合関数)です。

$$ \begin{align*} P : \mathcal{F} \to [\, 0, 1 \,] \end{align*} $$

可算加法性を満たすこと

条件($\text{iii}$)は、確率測度が可算加法性を満たすことを示しています。

すなわち、互いに排反である可算個の事象の和(和集合)の確率測度は、それぞれの事象の確率測度の和(実数の和)に等しいということが成り立ちます。

$$ \begin{align*} P \Big(\bigcup_{i}^{\infin} A_{i} \Big) = \sum_{i}^{\infin} \, P(A_{i}) \end{align*} $$

具体的に、事象 $A_{1}, A_{2}, \cdots$ が互いに排反であるとすると、次が成り立ちます。

$$ \begin{gather*} P (A_{1} \cup A_{2} \cup \cdots) = P(A_{1}) + P(A_{2}) + \cdots \\ \end{gather*} $$

確率とは:規格化された測度

なお、一般に(確率測度に限らない)測度は 上記の条件のうち($\text{ii}$)以外のすべてを満たします。すなわち、一般に、測度とは可算加法性を満たす集合関数 $\mu : \mathcal{F} \to [\, 0, +\infin \,]$ であるといえます。

逆にいえば、確率とは、全測度が $1$ となるように、とり得る値が $[\, 0, 1 \,]$ に規格化された測度であるといえます。

確率空間とは

以上から、測度論を用いて公理的に確率を定義するには、標本空間 $\varOmega$ と、$\varOmega$ 上の可算加法族 $\mathcal{F}$ 、確率測度 $P$ の $3$ つの概念が必要であることがわかります。

これらを合わせて確率空間(または確率モデル)といい、$(\varOmega, \mathcal{F}, P)$ のように表すということです。

なお、一般に集合 $S$ と、$S$ 上の可算加法族 $\mathcal{A}$ 、測度 $\mu$ の組 $(S, \mathcal{A}, \mu)$ を測度空間($\text{measure}$ $\text{space}$)といいます。


まとめ(3つの定義)

これまでに見た確率の $3$ つの定義の特徴は、それぞれ次の通りです。

古典的な定義(ラプラス)

  • 確率を、事象に含まれる根元事象の割合として定義する。
  • 「すべての根元事象(標本)が同等に起こりやすい」という仮定に基づく。
  • 標本空間が有限個の標本からなる(有限集合である)場合に限り適用できる。

統計的な定義(相対頻度による定義)

  • 確率を、事象の起こる相対頻度の極限値として定義する。
  • 「試行回数を限りなく大きくしたとき、相対頻度が一定値に収束する」という仮定に基づく。
  • 過去の実績に基づき将来を予測・評価する枠組みとして、様々な分野で活用されている。

公理的な定義(コルモゴロフ)

  • 確率を、確率空間上の測度(可算加法性を満たす集合関数)として定義する。
  • 測度論の枠組みを用いて、「事象の起こりやすさ」という概念から切り離し、公理に基づく理論的な体系(確率空間)として確率を扱う。
  • 標本空間が無限個の標本からなる(無限集合である)場合も扱える。

3つの定義の関係

確率の $3$ つの定義は、それぞれまったく無関係ではありません。

確率の 公理的な定義は、 古典的な定義統計的な定義を含む、より一般化された枠組みです。つまり、古典的な定義や統計的な定義は、公理的な定義の枠組みの中で説明できます。

古典的な定義の包含

確率の 古典的な定義は、 公理的な定義において、有限集合上の一様分布として表現されます。

古典的な定義と仮定

ラプラスによる 古典的な定義は、「すべての根元事象(標本)が同等に起こりやすい」という仮定の下、ある事象 $A$ が起こる確率 $P(A)$ を、次のように定めるものでした( 定義 1.5(古典的な確率))。

$$ \begin{align*} \tag{1.2.1} P(A) = \frac{\; r \;}{\; N \vphantom{\big(\big)} \;} \end{align*} $$

ここで、$N$ はすべての根元事象の数、$r$ は事象 $A$ に含まれる根元事象の数を表します。

これは、コルモゴロフによる 公理的な定義の枠組みの中で、次のように説明できます。

「同様に確からしい」ことの意味

まず、$N$ 個の根元事象(標本)からなる、次のような標本空間 $\varOmega$ を考えると、

$$ \begin{align*} \varOmega = \{\, \omega_{1}, \omega_{2}, \cdots, \omega_{N} \, \} \end{align*} $$

「すべての根元事象(標本)が同等に起こりやすい」という仮定は、次のように表せます。

$$ \begin{align*} P(\{\omega_{1}\}) = P(\{\omega_{2}\}) = \cdots = P(\{\omega_{N}\}) \end{align*} $$

ここで、$\{\omega_{1}\}$ は根元事象 $\omega_{1}$ のみを含む $\varOmega$ の部分集合であり、 定義 1.8(確率測度)より、次が成り立ちます。

$$ \begin{split} P(\varOmega) &\overset{(\text{i})}{=} P(\{\, \omega_{1}, \omega_{2}, \cdots, \omega_{N} \, \}) \\ &\overset{(\text{ii})}{=} P(\{\omega_{1}\} \cup \{\omega_{2}\} \cup \cdots \cup \{\omega_{N}\}) \\ &\overset{(\text{iii})}{=} P(\{\omega_{1}\}) + P(\{\omega_{2}\}) + \cdots + P(\{\omega_{N}\}) \\ % &= \sum_{i}^{N} \, P(\{\omega_{i}\}) \\ &\overset{(\text{iv})}{=} P(\{\omega_{i}\}) \cdot N \qquad (i = 1, 2, \cdots, N)\\ &\overset{(\text{v})}{=} 1 \\ \end{split} $$

  • ($\text{ii}$)すべての根元事象(標本)が互いに排反であることによります。すなわち、標本空間は、各標本のみを含む部分集合の総和に等しくなります。

    $$ \begin{align*} \{\, \omega_{1}, \omega_{2}, \cdots, \omega_{N} \, \} &= \bigcup_{i}^{N} \; \{\omega_{i}\} \\ &= \{\omega_{1}\} \cup \{\omega_{2}\} \cup \cdots \cup \{\omega_{N}\} \\ \end{align*} $$

  • ($\text{iii}$)確率の可算加法性によります( 定義 1.8(確率測度)の公理($\text{iii}$))。

  • ($\text{iv}$)仮定より、すべての根元事象の起こる確率は等しいとします。

  • ($\text{v}$) 定義 1.8(確率測度)の公理($\text{ii}$)より、$P(\varOmega \,) = 1 \vphantom{\bigcup_{i}}$ であることによります。

したがって、次が成り立ちます。

$$ \begin{align*} P(\{\omega_{i}\}) = \frac{\, 1 \,}{\, N \,} \quad (i = 1, 2, \cdots, N) \end{align*} $$

つまり、「$N$ 個の根元事象が同等に起こりやすい」ということは、「各根元事象が起こる確率が等しく $\displaystyle\frac{\, 1 \,}{\, N \,}$ である」ということを意味しています。

事象 $A$ の起こる確率

次に、事象 $A$ に含まれる根元事象が $r$ 個であるとして、次のように表すとします。

$$ \begin{align*} A = \{\, \omega_{1}^{(a)}, \omega_{2}^{(a)}, \cdots, \omega_{r}^{(a)} \, \} \\ \end{align*} $$

ここで、事象 $A$ は標本空間 $\varOmega$ の部分空間であることから、任意の $\omega_{j}^{(a)} \in A$ に対応する $\omega_{i} \in \varOmega$ が存在し、次が成り立ちます。

$$ \begin{align*} P(\{\omega_{j}^{(a)}\}) &= P(\{\omega_{i}\}) \\ &= \frac{\, 1 \,}{\, N \,} \quad (j = 1, 2, \cdots, r) \\ \end{align*} $$

したがって、事象 $A$ の起こる確率は、次のように表せます。

$$ \begin{split} P(A) &\overset{(\text{i})}{=} P(\{\, \omega_{1}^{(a)}, \omega_{2}^{(a)}, \cdots, \omega_{r}^{(a)} \, \}) \\ &\overset{(\text{ii})}{=} P \Big(\bigcup_{j}^{r} \; \{\omega_{j}^{(a)}\} \Big) \\ &\overset{(\text{iii})}{=} \sum_{j}^{r} \, P(\{\omega_{j}^{(a)}\}) \\ &\overset{(\text{iv})}{=} \frac{\, r \,}{\, N \,} \\ \end{split} $$

  • ($\text{ii}$)根元事象(標本)が互いに排反であることによります。すなわち、$A$ は、$A$ に含まれる標本の総和として表せます。

    $$ \begin{align*} \{\, \omega_{1}^{(a)}, \omega_{2}^{(a)}, \cdots, \omega_{r}^{(a)} \, \} &= \bigcup_{j}^{r} \; \{\omega_{j}^{(a)}\} \\ % &= \{\omega_{1}^{(a)}\} \cup \{\omega_{2}^{(a)}\} \cup \cdots \cup \{\omega_{r}^{(a)}\} \\ \end{align*} $$

  • ($\text{iii}$)確率の可算加法性によります( 定義 1.8(確率測度)の公理($\text{iii}$))。

  • ($\text{iv}$)各根元事象の起こる確率が $\displaystyle\frac{\, 1 \,}{\, N \,}$ であることによります。

また、このことは、次のようにも表せます。

$$ \begin{split} P(A) &= \sum_{\omega \, \in \, A} \, P(\{\omega\}) \\ &= \frac{\, r \,}{\, N \,} \vphantom{\bigcup^{\infin}} \\ \end{split} $$

すなわち、事象 $A$ の起こる確率は、すべての根元事象に対する、$A$ に含まれる根元事象の割合に等しくなります。これは、確率の 古典的な定義に一致します。

古典的な定義の包含(まとめ)

以上から、確率の 古典的な定義公理的な定義の特別な場合(有限集合上の一様分布)として説明できます。

重要なのは、確率の古典的な定義は「すべての根元事象(標本)が同等に起こりやすい」という強力な仮定の下でしか成り立たないことです。具体的な問題について考える際は、このような仮定が妥当であるかを慎重に吟味する必要があります。

逆にいえば、確率の公理的な定義は、このような仮定に依存しないより一般的な枠組みであるといえます。


統計的な定義の包含

確率の 統計的な定義は、 公理的な定義の枠組みで示される大数の法則により根拠付けられます。

統計的な定義と仮定

確率の 統計的な定義は、「試行回数を限りなく大きくしたとき、相対頻度が一定の値に収束する」という仮定の下、相対頻度の極限値として確率を定義するものでした( 定義 1.6(統計的な確率))。

$$ \begin{align*} P(A) = \lim_{n \to + \infin} \frac{\, n_{A} \,}{\, n \,} \end{align*} $$

ここで $n$ は試行回数、$n_{A}$ は事象 $A$ が回起こった回数を表します。

「試行回数を限りなく大きくしたとき、相対頻度が一定の値に収束する」という仮定は、コルモゴロフの公理的な定義の枠組みの中で、大数の法則としてその根拠が与えられます。

大数の法則とは(概要)

大数の法則とは、確率空間 $(\Omega, \mathcal{F}, P)$ 上の確率変数列 $X_{1}, X_{2}, \ldots, X_{n}, \ldots$ について、その標本平均が期待値 $\mu$ に収束することを示す定理です。

$$ \begin{align*} \frac{\, X_{1} + X_{2} + \cdots + X_{n} \,}{n} \longrightarrow \mu \quad (n \to + \infin) \end{align*} $$

大数の弱法則と強法則

収束の仕方により、大数の法則には $2$ つの形があります。

  • 大数の弱法則:標本平均が期待値 $\mu$ に確率収束する。
  • 大数の強法則:標本平均が期待値 $\mu$ に概収束(ほとんど確実に収束) する。

いずれも、測度論に基づく確率の 公理的な定義の枠組みのなかで定式化・証明されます。

相対頻度と大数の法則

ベルヌーイ試行などの特別な場合を考えると、大数の法則は「ある事象の相対頻度が、その事象の確率に収束する」ことを意味します。

例えば、硬貨投げにおいて「表が出る割合(相対頻度)」が、試行回数を増やすにつれて真の確率($1/2$)に収束することが示されます。

統計的な定義の包含(まとめ)

このように、大数の法則は、「相対頻度が一定値に収束する」という 統計的な定義の前提にある経験則(あるいは直感)を、数学的に正当化するものです。

すなわち、確率の 統計的な定義は、 公理的な定義の枠組みの中に位置づけられ、大数の法則によってその根拠が示されるといえます。


まとめ

  • 起こり得ることがら全体の集合を $\varOmega$ 、事象 $A$ を $\varOmega$ の部分集合として、次の $3$ つの条件を満たす関数 $P(A)$ を、事象 $A$ の確率($\text{probability}$)という。

($\text{i}$)任意の $A$ に対して、$0 \leqslant P(A) \leqslant 1 \vphantom{\bigcup_{i}}$ が成り立つ。

($\text{ii}$)$P(\varOmega \,) = 1 \vphantom{\bigcup_{i}}$

($\text{iii}$)互いに排反である事象 $A_{1}, A_{2}, \cdots$ に対して、次が成り立つ。 $$ \begin{align*} P \Big(\bigcup_{i}^{\infin} A_{i} \Big) = \sum_{i}^{\infin} \, P(A_{i}) \end{align*} $$



参考文献

[1] 舟木直久. 確率論. 朝倉書店. 2004.
[2] 縄田和満. 確率・統計 $\text{I}$. 丸善出版. 2013.
[3] 小針晛宏. 確率・統計入門. 岩波書店. 1973.
[4] 真貝寿明. 徹底攻略 確率統計. 共立出版. 2012.
[5] 東京大学教養学部統計学教室 編. 統計学入門. 東京大学出版会. 1991.
[6] W. Feller. An Introduction to Probability Theory and Its Applications. John Wiley & Sons, Inc.. 1968.
[7] Robert B. Ash. Basic Probability Theory. Dover Publications, Inc.. 2008.
[8] G. Andrews. Special Functions. Cambridge University Press. 1999.
[9] 杉浦光夫. 解析入門 $\text{I}$. 東京大学出版会. 1980.
[10] 吉田伸生. [新装版] ルベーグ積分入門. 日本評論社. 2021.


初版:2025-08-30   |   改訂:2025-09-28