ベイズ確率

提供: miniwiki
2018/8/19/ (日) 17:44時点におけるAdmin (トーク | 投稿記録)による版 (1版 をインポートしました)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
移動先:案内検索

ベイズ確率(ベイズかくりつ)とは、ベイズ主義による「確率」の考え方(およびその値)を指す。

これら(およびベイズ統計学ベイズ推定)の「ベイズ(的)」の名は、元々はトーマス・ベイズおよび彼が示したベイズの定理に由来する。

ロナルド・フィッシャー以降の推計統計学等で前提とされる「頻度主義」、すなわちランダム事象が生起・発生する頻度をもって「確率」と定義する考え方と対比されることが多い[1]

概要

統計学[2]においてベイズ確率の考え方を採用する立場を、頻度主義に対比してベイズ主義(またベイズ主義的・ベイズ主義者という意味でベイジアン)という。さらにベイズ確率に関しては、ベイズの定理を利用してベイズ推定の方法が導かれ、これはベイズ統計学の基礎概念となっている。

ベイズ確率の歴史

ベイズ確率(およびベイズ統計学)は、ベイズの定理の特別な場合を証明したトーマス・ベイズにちなんだ命名(実際の命名は1950年代)ではあるが、ベイズ自身が現在のようなベイズ確率やベイズ推定の考え方を持っていたかどうかは定かでない。

ベイズ確率の考え方を積極的に用いたのはピエール=シモン・ラプラス(ベイズの定理の一般的な場合を証明した)で、それを「土星質量を確率的に見積もる」というような問題に応用した。しかし彼以後は長らくこの考え方は顧みられなかった。土星の質量は推測値だからと言っても確率的に分布するわけではなく、観測誤差の方が確率的に分布するのであると頻度主義では考える。特に19世紀末以降に発展した数理統計学は専ら頻度主義に基づいて厳密な理論を構築した。

確率の主観的解釈(のちにベイズ主義と呼ばれる)は1931年に哲学者・数学者のフランク・ラムゼイによって提唱され、彼は別の主観確率(論理確率)の支持者だったケインズと論争をしているが、彼自身はこれを頻度主義的解釈の単なる補助としか考えなかった。これをさらに厳密に取り上げたのは1937年、統計学者ブルーノ・デ・フィネッティである。さらに初めて詳細な分析を加えたのは1954年、レオナード・ジミー・サヴェッジEnglish版であって、彼の考え方にはベイズ確率・ベイズ主義という呼び名が適用された。そのほか初期の研究者にはバーナード・クープマンEnglish版エイブラハム・ウォールドらがいる。これらの研究は現在広く受け入れられるようになってきたが、頻度主義者とベイズ主義者の亀裂は現在でも尾を引いており、両主義の支持者の一部は互いに議論せず共通の学会に参加しないといった状況が続いている。

ベイズ確率と頻度確率

ベイズ主義の考え方は、観測された頻度分布あるいは想定された母集団の割合から導かれるのが確率であるとする頻度確率の概念とは対照的である。また統計学的方法が大きく異なる場合も多い。

ただしベイズ主義と頻度主義とで同じ結論が得られる問題も多い。

統計学的仮説検定について、ベイズ主義と頻度主義との差が現れやすい。頻度主義では推定したいパラメータは一つの真の値をとると考えるが、ベイズ主義においてはパラメータは確率変数であると考える。

ベイズ推定

ベイズの定理を用いて、新しい証拠に照らして命題[math]\theta_i[/math]の尤もらしさ(確率)の値[math]p_i[/math]を改訂していく方法がベイズ推定である。改訂前の値を事前確率、改訂後を事後確率と呼ぶ。事後確率は最良な推定結果そのものとなる。

例えばラプラスはこの方法で土星の質量を見積もった(土星の質量の推定値の事後確率分布[math]p(m_\text{sat})[/math]の期待値[math]\bar{m}_\text{sat}[/math]を計算した)。

しかし頻度主義による確率の定義では、このような適用はできない。土星質量の推定値は確率変数ではないからである。「土星の質量とはどんな母集団から抽出されたものか?」という問いに答えられなければ、これは頻度主義者の議論の対象にはならない。

ベイズ確率の応用

ベイズ確率は現在いろいろな方面で応用されている。一方で頻度主義に基づく統計学の理論体系に対しては、かえって実用性を犠牲にしているとのベイジアンからの批判がある。むしろベイズ主義のほうが人間の思考様式になじむというわけである。ベイズ推定は、まず複数の仮説について尤もらしさ(信念の度合)を考え、実験や観測により新しい情報(データ)を収集し、それらを組み合わせてベイズの定理によってその確率を改訂するという点で、科学的方法のモデルとしても提案されている。またベイズ因子(従来の統計学における尤度を用いる方法に似ている)を利用する方法はオッカムの剃刀に対応するものとされている。

ベイズ推定を用いた方法は近年、スパムを見つける方法(ベイジアンフィルタ)として利用され成果を上げている。すでに分かっているスパムの選別法をフィルターに示し、次いで単語の頻度を用いてスパムと必要な電子メールとを識別するのである。

関連項目

脚注

  1. 例えば降水確率なども確率として認めるかどうかの考え方の違いが生じる。
  2. 統計学の基礎となる確率論は客観確率を基礎として発展したが、ベイズ確率を扱ったとしても、理論の変更は不要である。