確率論

提供: miniwiki
2018/8/19/ (日) 17:41時点におけるAdmin (トーク | 投稿記録)による版 (1版 をインポートしました)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
移動先:案内検索

確率論(かくりつろん、: probability theory, : théorie des probabilités, : Wahrscheinlichkeitstheorie)とは、偶然現象に対して数学的な模型(モデル)を与え、解析する数学の一分野である。

もともとサイコロ賭博といった賭博の研究として始まった[1]。現在でも保険投資などの分野で基礎論として使われる。

なお、確率の計算を問題とする分野を指して「確率論」と呼ぶ用例もあるが、本稿では取り扱わない。

歴史

古典的確率論

確率論は16世紀から17世紀にかけてカルダーノパスカルフェルマーホイヘンス等によって数学の一分野としての端緒が開かれた。イタリアのカルダーノは賭博師でもあり、1560年代に『さいころあそびについて』(: Liber de ludo aleae)を執筆して初めて系統的に確率論を論じた。その書は彼の死後の1663年に出版された[2]。 18世紀から19世紀にかけて、ラプラスはそれまでの確率論を統合する研究をおこない、1814年2月に『確率の哲学的試論』を著し、古典的確率論と呼ばれる理論にまとめた[3]

公理的確率論

現代数学の確率論は、アンドレイ・コルモゴロフの『確率論の基礎概念』(1933年[4]に始まる公理的確率論である。他の現代数学と同様に、この確率論では「確率」が何を意味しているのかという問題は取り扱わず、「確率」が満たすべき性質をいくつか規定し、その性質から導くことのできる定理を突き詰めていく学問である。この確率論の基礎には集合論測度論ルベーグ積分があり、確率論を学ぶためにはこれらの知識が要求される。公理的確率論の必要性に関しては確率空間の項を参照。

現在、確率論は解析学の一分野として分類されている。特にルベーグ積分論や関数解析学とは密接なつながりがある。もちろん離散数学との関係も依然として深いが、離散的な場合であってもその内容は解析的なものであることが多い​。また、確率論は統計学を記述する際の言語や道具としても重要である。

基礎概念の概略

確率論で使われるいくつかの重要な概念を簡単に解説する。詳しい内容は各項目のページを参照。

事象 (event)
標本空間の部分集合のうち特別に選ばれたものを事象と呼ぶ。事象とする部分集合は勝手に決めてよいが、すべての事象を集めた集合 F可算加法族になっている必要がある。確率論において、事象だけが確率を測ることのできる対象である。それ以外に、F は情報としての意味を持つ。事象 A に対して、Ω からランダムに選ばれた ω が A に含まれるか含まれないかは判断できる。F に含まれるすべての事象を使えば ω をひとつに特定できるかもしれないし、できないかもしれない。F の代わりに F より小さな可算加法族を使えば、特定できない ω が増加する。このように、可算加法族の大きさは標本空間を観察する目の細かさを表している。選ばれたものが一つだけの時、単純事象(simple event)といい、二つ以上の時、複合事象(compound event)という。
標本空間
確率論においてはただの集合であり Ω と書く。空集合でない集合ならなんでも標本空間としてよい。意味的には、確率を問題としている領域において、ランダムに起こりうる現象の原因をすべて集めてきた集合である。このため、通常は非常に巨大な集合となる。この領域における確率論的な現象は「Ω からひとつの元 ω が選ばれるが、どの元が選ばれたのか分からない」ということがすべてのランダムさの原因になるように記述される。
確率変数
Ω 上で定義された実数値関数で、F 可測であるものを確率変数と呼ぶ。確率変数は、例えば「サイコロの目」のように、ランダムに値が決まる対象を定式化するものである。この定式化では、確率変数の値は「Ω からランダムに選ばれた ω」を元に自動的にひとつに定まる。すなわち、確率変数のランダムさの要因は「Ω からランダムに ω が選ばれる」ということのみになる。F 可測であるというのは、確率変数が ω に関してもたらす情報が F による情報を超えないということである。例えば、F によって区別できない複数の ω があるとすると、確率変数の値によっても、それらを区別することはできない。
確率空間
標本空間 Ω と事象の全体 F と確率測度 P の組を確率空間と呼ぶ。確率の問題を確率論的に定式化するということは、この確率空間を定めることである。しかし、通常はその問題にはどのような確率変数が存在するかということを調査し、必要となる確率変数をすべて含むことができるぐらい巨大な Ω を定める。
確率測度
各事象に対して 0 以上 1 以下の数を対応させる関数を確率測度といい P と書き、事象 A の起こる確率は P(A) となる。Ω 自体は常に全事象と呼ばれる事象であり、全事象の起こる確率は 1 でなければならない。P も勝手に決めていい関数であるが、確率測度の公理を満たすように定める必要がある。「確率」が何を意味しているかは議論の対象ではない[5]
確率過程
確率過程は、時間とともに変化する確率変数。
確率分布
確率変数の各々の値に対して、その起こりやすさの記述。

基礎概念の数学的定義

現代確率論における基礎概念たちは測度論をベースとして次のように厳密に定義される。

確率空間

  • [math] (\Omega ,\mathcal{F}) [/math]可測空間とする。すなわち [math] \Omega [/math]標本空間と呼ばれる空でない集合であり、[math] \mathcal{F} [/math][math] \Omega [/math] 上の完全加法族である。
  • 完全加法族 [math]\mathcal{F}[/math] とは、[math] 2 ^\Omega [/math][math] \Omega [/math] の部分集合の全体(冪集合)としたとき、[math] \mathcal{F} \subset 2 ^\Omega [/math] であって以下の性質を持つものである:
  1. [math] \Omega \in \mathcal{F}, [/math]
  2. 任意の [math] A \in \mathcal{F} [/math] に対して [math] A^{c}=\Omega \setminus A \in \mathcal{F}, [/math]
  3. 任意の [math] A _n \in \mathcal{F}, n=1,2,\ldots [/math] に対して
    [math] \bigcup _{n=1} ^{\infty} A _n \in \mathcal{F}. [/math]
  • P を可測空間 [math](\Omega ,\mathcal{F})[/math] 上の確率測度とする。すなわち、写像 [math] P \colon \mathcal{F} \to [0 , 1] [/math] であって、以下の性質を持つものとする:
  1. 完全加法性):[math] A _n \in \mathcal{F}, n=1,2,\ldots [/math][math] A _i \cap A _j = \emptyset \, (\forall i \neq j) [/math] を満たすものに対し、
    [math] P \left( \bigcup _{n=1} ^\infty A _n \right) = \sum _{n=1} ^\infty P ( A _n ) .[/math]
  2. 正規性):[math]P(\Omega )=1.[/math]
  • このときの三つ組 [math] ( \Omega , \mathcal{F} , P ) [/math]確率空間 (probability space) と呼び、可測集合 [math]A\in \mathcal{F}[/math]事象 (event) と呼ぶ。

確率変数

  • 確率空間 [math]( \Omega , \mathcal{F} , P)[/math] 上の可測関数確率変数 (random variable) と呼ぶ。すなわち、ある可測空間 [math](E,\mathcal{E})[/math] に対して、写像 [math]X\colon\Omega \to E[/math] であって任意の [math]A\in \mathcal{E}[/math] に対して [math]X^{-1}(A):=\{\omega \in \Omega \mid X(\omega )\in A\}\in \mathcal{F}[/math] をみたすものをいう。多くの場合、E位相空間であって、そのときの完全加法族 [math]\mathcal{E}[/math] としてはボレル集合族 [math]\mathcal{B}(E)[/math] を採用する。[math]E=\mathbb{R}^{d}[/math] のとき、Xd 次元確率変数といい、特に d = 1 のときは単に確率変数と呼ぶことが多い。
  • 確率変数 [math]X\colon\Omega \to E[/math]確率分布 (probability distribution)、または分布 (distribution)、法則 (law) とは、[math]P_{X}(A):=P(X^{-1}(A)),\;A\in \mathcal{E}[/math] によって定まる、可測空間 [math](E,\mathcal{E})[/math] 上の確率測度 [math]P_{X}[/math] のことをいう。すなわち、[math]P_{X}[/math] は確率変数 X による確率測度 P の像測度 (image measure)、押し出し測度English版 (push-forward measure) のことである。しばしば [math]P(X\in A)[/math] と略記される。一般的な [math](\mathbb{R}^{d},\mathcal{B}(\mathbb{R}^{d}))[/math] 上の確率測度も分布と呼ばれる。

確率空間の例

コイントス

コインを投げて裏と表が出る確率がそれぞれ 1/2 であることを、確率空間として表すと例えば次のようになる。

  • [math] \Omega := \{ 0, 1 \} [/math],
  • [math] \mathcal{F} := 2 ^\Omega = \{ \emptyset, \{ 0 \} , \{ 1 \} , \{ 0 , 1 \} \} [/math],
  • [math] P ( \{ 0 \} ) = P ( \{ 1 \} ) = 1/2 [/math]

とする。0 を裏、1 を表と考えると確率空間 [math] ( \Omega, \mathcal{F} , P ) [/math] はコイントスのモデルとなっている。

ここでもう一つ違う表現を考える。

  • [math] \tilde{\Omega} := [0,1], [/math]
  • [math] \tilde{\mathcal{F}} [/math] :ボレル集合族、
  • [math] \tilde{P} [/math] :ルベーグ測度

とする。さらに確率変数 [math] X \colon \tilde{\Omega} \rightarrow \{ 0 , 1 \} [/math]

[math] X (\omega) = \begin{cases} 0 & \text{if } \omega \in [0,1/2] \\ 1 & \text{if } \omega \in ( 1/2 , 1] \end{cases}[/math]

と定義する。すると [math] \tilde{P} _X = P [/math] であり、X は確率空間 [math] ( \tilde{\Omega} , \tilde{\mathcal{F}} , \tilde{P} ) [/math] 上に定義されたコイントスを表す確率変数であると言える。

ここで、さらに確率変数 [math] Y \colon \tilde{\Omega} \rightarrow \{ 0 , 1 \} [/math]

[math] Y (\omega) = \begin{cases} 0 & \text{if } \omega \in [0,1/4] \cup (1/2, 3/4] \\ 1 & \text{if } \omega \in ( 1/4 , 1/2] \cup ( 3/4 , 1 ] \end{cases} [/math]

と定義してみる。再び [math] \tilde{P} _Y = P [/math] であるので、これもコイントスを表す確率変数である。実は、確率空間 [math] ( \tilde{\Omega} , \tilde{\mathcal{F}} , \tilde{P} ) [/math] 上に同時に定義されたこの確率変数 [math] X [/math][math] Y [/math] は二つの独立なコイントスを表している。例えば、二枚とも裏が出る確率は [math] \tilde{P} ( X = 0 , Y = 0 ) = \tilde{P} ( [0, 1/4] ) = 1/4 [/math] という具合になる。もう少し厳密に書くと、確率変数 [math] Z \colon \tilde{\Omega} \rightarrow \{ 0 , 1 \} ^2 [/math]

[math] Z ( \omega ) := ( X ( \omega ) , Y ( \omega ) ) [/math]

と定義すると、Z が二枚の独立なコイントスを表しているということである。

期待値、分散

独立性

条件付き確率

特性関数

確率過程

確率分布

確率測度、確率変数の収束

重要な定理

確率の乗法定理

事象 E, F に対して、それらの積事象 EF の生起確率が

[math]P(E \cap F) = P(E)P_E(F)[/math]

となることを確率の乗法定理という[6]

確率事象 EF とが独立である場合に限り、次の関係が成り立つ。

[math]P(E \cap F) = P(E)P(F).[/math]

脚注

  1. 日本数学会 2007, 60 確率論.
  2. Cardano 1961.
  3. ラプラス 1997.
  4. コルモゴロフ 2010.
  5. 確率測度は、客観確率の持ついくつかの性質を選んだものであるが、ベイズ統計学のような主観確率も確率測度の条件を満たす。
  6. 西岡 2013, 4.3 乗法定理.

参考文献

関連項目

外部リンク