コーシー分布
母数 |
[math]x_0\![/math] 位置(実数) [math]\gamma \gt 0\![/math] 尺度(実数) |
---|---|
台 | [math]x \in (-\infty; +\infty)[/math] |
テンプレート:確率分布/リンク 密度 | [math]\frac{1}{\pi} \frac{\gamma}{(x-x_0)^2 + \gamma^2}[/math] |
累積分布関数 | [math]\frac{1}{\pi} \arctan\left(\frac{x-x_0}{\gamma}\right)+\frac{1}{2}[/math] |
期待値 | (not defined) |
中央値 | [math]x_0[/math] |
最頻値 | [math]x_0[/math] |
分散 | (not defined) |
歪度 | (not defined) |
尖度 | (not defined) |
エントロピー | [math]\ln(4 \pi \gamma)[/math] |
モーメント母関数 | (not defined) |
特性関数 | [math]\exp(x_0 i t-\gamma|t|)[/math] |
コーシー分布(コーシーぶんぷ、英語: Cauchy distribution)は、連続型確率分布の一種である。分布の名称は、フランスの数学者オーギュスタン=ルイ・コーシーにちなむ。確率密度関数は以下の式で与えられる。
- [math]f(x; x_0,\gamma) = \frac{1}{\pi\gamma \left[1 + \left(\dfrac{x-x_0}{\gamma}\right)^2\right]} = \frac{1}{\pi} { \gamma \over (x - x_0)^2 + \gamma^2 }[/math]
ここでx0は分布の最頻値を与える位置母数、γは半値半幅を与える尺度母数である。
この分布は、ヘンドリック・ローレンツの名を取ってローレンツ分布と呼ばれることもあり、またこれら2人の名前を合わせてコーシー-ローレンツ分布とも呼ばれる。また物理学の分野では、ブライト・ウィグナー分布という名前で知られている。この分布は強制共鳴を記述する微分方程式の解となることから、物理学では重要な存在となっている。また分光学では共鳴広がりを含む多くのメカニズムによって広げられたスペクトル線の形状を記述するために用いられる。以下では、統計学における名称であるコーシー分布を用いて説明する。
x0 = 0、γ = 1である場合、この分布は標準コーシー分布と呼ばれ、以下の確率密度関数で与えられる。
- [math] f(x; 0,1) = \frac{1}{\pi (1 + x^2)}[/math]
性質
累積分布関数は以下のようになる。
- [math]F(x; x_0,\gamma)=\frac{1}{\pi} \arctan\left(\frac{x-x_0}{\gamma}\right)+\frac{1}{2}[/math]
また、逆累積分布関数は次の通りである。
- [math]F^{-1}(p; x_0,\gamma) = x_0 + \gamma \tan(\pi(p-1/2)).[/math]
コーシー分布は、期待値や分散(あるいはより高次のモーメント)が定義されない分布の例として知られる。最頻値と中央値は常に定義され、それらはいずれもx0で与えられる。
Xをコーシー分布に従う確率変数とする。コーシー分布の特性関数は以下のように与えられる。
- [math]\phi_x(t; x_0,\gamma) = \mathrm{E}(e^{iXt}) = \exp(ix_0t-\gamma|t|).[/math]
U と V を標準正規分布(期待値0、分散1の正規分布)に従う互いに独立な確率変数であるとすると、それらの比 U/V は標準コーシー分布に従う。
[math]X_1,X_2,\dotsc,X_n[/math]をあるコーシー分布に従う独立な確率変数列とすると、それらの算術平均[math]\overline{X}=(X_1+\dotsb+X_n)/n[/math]は再び同じ位置母数、尺度母数を持つコーシー分布に従う(再生性)。この証明は、算術平均の特性関数が
- [math]\begin{align} \phi_{\overline{X}}(t) &= \mathrm{E} \left(e^{i\overline{X},t}\right) = \mathrm{E} \left(e^{iX_1t/n} \dotsb e^{iX_nt/n} \right) \\ &= \mathrm{E} \left(e^{iX_1t/n}\right) \dotsb \mathrm{E} \left( e^{iX_nt/n} \right) = \mathrm{E} \left(e^{iXt/n}\right)^n \\ &= \exp(ix_0t/n - \gamma |t/n|)^n = \phi_X(t) \end{align}[/math]
となることから言える。このように、コーシー分布の算術平均の分布は正規分布に近づかないことが言えるため、中心極限定理における有限分散の仮定は必須であることがわかる。また、これは安定分布族(コーシー分布は安定分布族に含まれる)における一般化中心極限定理の例でもある。
コーシー分布は無限分解可能な分布である。
自由度1のT分布は、標準コーシー分布と一致する。
コーシー分布が属している位置尺度母数分布族は、実係数メビウス変換に関して閉じている。
特性関数の求め方
コーシー分布の特性関数の求め方は、標準コーシー分布の確率密度関数
- [math]\frac{1}{\pi(1+x^2)}[/math]
が複素平面上で[math]x=\pm i[/math] のみに1位の極を持つことを利用し、留数定理を用いて算出する。
期待値が定義されない理由
コーシー分布の期待値は、[math]z=\frac{1}{\gamma}(x-x_0)[/math]とすると
- [math]\begin{align} \mathrm{E}[x] &= \int_{-\infty}^{\infty} x f(x)\,dx = \int_{-\infty}^{\infty} (x-x_0) f(x)\,dx + \int_{-\infty}^{\infty} x_0 f(x)\,dx \\ &= \lim_{R_1, R_2 \to \infty} \frac{\gamma}{\pi}\int_{-R_1}^{R_2}\frac{z}{1+z^2}\,dz +x_0= \lim_{R_1, R_2 \to \infty} \frac{\gamma}{2\pi}\left[\log(1+z^2)\right]^{R_2}_{-R_1} +x_0\\ &= \lim_{R_1, R_2 \to \infty} \frac{\gamma}{2\pi} \log \left(\frac{1+R_2^2}{1+R_1^2}\right)+ x_0 \end{align}[/math]
となるが、この広義積分の値は存在せず(十分大きな[math]R_1[/math]、[math]R_2[/math]について、[math]\log \left(\frac{1+R_2^2}{1+R_1^2}\right)[/math]は[math](-\infty,\infty)[/math]のどの様な値でも取りうるので、二重極限としての収束値は存在しない)、このため期待値は存在しない。なお、コーシーの主値[math]\lim_{R \to \infty}\int_{-R}^R x f(x)\,dx[/math]は[math]x_0[/math]である。
大数の強法則など、期待値に関する確率論のさまざまな結果は、このようなケースでは成立しない。
また、コーシー分布に従う母集団から無作為抽出された標本に関する算術平均は、ただ1つの抽出による結果からは一切改善されない。これは、標本に極端に大きな(あるいは小さな)値が含まれる可能性がかなり高いからである。しかし、標本中央値(これは極端な値には影響を受けない)は中心(最頻値)を知るためのひとつの尺度となりうる。
2次モーメントが無限大になる理由
期待値が定義されない限り、分散や標準偏差を考えることは不可能である。しかし、原点を中心とした2次モーメントを考えることは可能である。しかし、これもまた無限大となる。
[math]\mathrm{E}(X^2) \propto \int_{-\infty}^{\infty} {x^2 \over 1+x^2}\,dx =\int_{-\infty}^{\infty} dx - \int_{-\infty}^{\infty} {1 \over 1+x^2}\,dx = \infty -\pi = \infty. \![/math]
相対論的ブライト・ウィグナー分布
原子核物理学および素粒子物理学において、共鳴のエネルギー特性は相対論的ブライト・ウィグナー分布によって記述される。