有意
有意(ゆうい、独: Signifikanz、英: significance)は、確率論・統計学の用語で、「確率的に偶然とは考えにくく、意味があると考えられる」ことを指す。
p値
帰無仮説の下で実際にデータから計算された統計量よりも極端な(仮説に反する)統計量が観測される確率を、p値という。P値の利用に伴う諸問題を考慮した社会心理学系のジャーナル、Basic and Applied Social Psychology(BASP)は、帰無仮説有意性検定およびそれに類する統計学的処理を禁止すると発表した[1]。
有意水準
有意水準α (0<α<1) は、どの程度の正確さをもって帰無仮説[math]H_0[/math]を棄却するかを表す定数である。有意水準αの仮説検定は、[math]p\lt \alpha[/math]の時に[math]H_0[/math]を棄却する。このとき、「統計量はα水準で有意である」という。有意水準αは仮説[math]H_0[/math]が正しいにも関わらず仮説検定で棄却してしまう確率(第一種の誤りを犯す確率)に等しい。日本工業規格では、「第1種の誤りの確率の上限値。」と定義している[2] 。
有意水準[math]\alpha[/math]の値としては、0.05 (= 5%) を用いるのが一般的であるが、そのとり方は学問・調査・研究対象によっても違いがあり、社会科学などでは0.1(10%)を用いる場合もあり、厳密さが求められる自然科学では0.01(1%)などを用いる場合もある。また、データ表示に当たっては有意性に段階をつけて複数の有意水準を同時に用いることもあり、たとえば0.05水準で有意ならば * 、0.01水準と0.001水準に対してはそれぞれ ** 、 *** と表示する。
有意であるからといって「偶然ではない」と断定できるわけではなく、「偶然とは考えにくい」という意味に過ぎない。したがって、たとえば有意水準5%で有意という場合には、「実際には偶然に過ぎないのに、誤って『意味がある』と判断している」可能性が多くて5%ある。逆に、有意でないという場合には、あくまで「偶然かもしれない」という意味であって、「偶然である」とまでは断定できない。
2010年代初頭に入ると科学は「再現性の危機」に苦しんでいて、研究者も助成機関も出版社も、学術文献は信頼できない結果にまみれているのではないかと不安を募らせている。2017年に72人の著名な研究者が、新たな発見をしたと主張する際の証拠の統計的基準の低さが再現性の危機の一因になっているとする論文を発表した。新発見の統計的有意性を評価するために、科学者が好んで用いる有意水準[math]\alpha[/math]の値は0.05から0.005に引き下げるべきであると、統計学の大家たちは主張する。
その一方、イリノイ工科大学の計算機科学者Shlomo Argamonは「実験する方法が多数ある限り、どんなに小さい有意水準[math]\alpha[/math]の値を用いてもその中に一つの実験方法が偶然に有意になる可能性が極めて高い」と新しい方法論的な基準を求める。実際小さい有意水準[math]\alpha[/math]の値を用いたらお蔵入り問題がより著しくなり、多数の論文が出版できなくなる[3]。
多重比較
同種の検定を繰り返して全体での有意性の有無を判断する場合(多重比較)、1回の検定に対する有意水準をαとすると、k回の同様の試行に対して一度でも有意な結果を得る確率 [math]\alpha_k[/math] はk回の試行の独立性に依存する。たとえば、k回の試行が独立であるときは、[math]\alpha_k = 1-(1-\alpha)^k[/math] となる。しかしながら、[math]\alpha_k[/math] の上限はkαであることから、1回の検定に対する有意水準をα/kと定めれば、k回の同様の試行に対して有意水準が高々αの検定を行うことができる。これをボンフェローニの方法という。ただし、この方法ではkの値が大きくなるにつれて有意水準が下がり、実用性に乏しくなる。そのため、より検定力の高い手法が提案されている。古くはLSD法が、ボンフェローニ法と共に計算が容易であるため好まれた。今日では、HSD法やRyan法が最も一般的である。また、シェッフェの方法やWSD法も見かけるようになっている。これらは、分散分析で3水準以上の要因の主効果が有意であった場合の下位検定にも用いられる。
有意差
帰無仮説を「2つの母数に差がない」という形にした場合には、帰無仮説が棄却されることで「2つの母数の間には有意差がある」という結論が導かれる。
信頼区間と仮説検定
統計量Xが、ある母数θの推定量である場合を考える。このとき、有意水準αで帰無仮説が棄却されないようなXのとりうる範囲は、信頼水準[math]1-\alpha[/math]に対するθの信頼区間と等しい。
たとえば、標本平均Xを母平均θの推定量とみなすと、帰無仮説:[math]\theta = \theta_0 [/math]が有意水準5%で棄却されないXの範囲は、[math]\theta_0[/math]の95%信頼区間と一致する。
脚注
- ↑ 2015 T&F社のBASP誌がP値の使用禁止を発表 http://www.editage.jp/insights/a-taylor-francis-journal-announces-ban-on-p-values
- ↑ JIS Z 8101-1 : 1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語 2.53 有意水準, 日本規格協会, http://kikakurui.com/z8/Z8101-1-1999-01.html
- ↑ 2017 統計学の大物学者がP値の刷新を提案, Nature ダイジェスト, https://www.natureasia.com/ja-jp/ndigest/v14/n11/%E7%B5%B1%E8%A8%88%E5%AD%A6%E3%81%AE%E5%A4%A7%E7%89%A9%E5%AD%A6%E8%80%85%E3%81%8CP%E5%80%A4%E3%81%AE%E5%88%B7%E6%96%B0%E3%82%92%E6%8F%90%E6%A1%88/89721
参考文献
- 西岡康夫 『数学チュートリアル やさしく語る 確率統計』 オーム社、2013年。ISBN 9784274214073。
- 伏見康治 『確率論及統計論』 河出書房、1942年。ISBN 9784874720127。
- 日本数学会 『数学辞典』 岩波書店、2007年。ISBN 9784000803090。
- JIS Z 8101-1:1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語, 日本規格協会, http://kikakurui.com/z8/Z8101-1-1999-01.html