尺度水準

提供: miniwiki
2018/8/19/ (日) 17:45時点におけるAdmin (トーク | 投稿記録)による版 (1版 をインポートしました)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
移動先:案内検索


尺度水準(しゃくどすいじゅん)とは、調査対象に割り振った変数、その測定、あるいはそれにより得られたデータを、それらが表現する情報の性質に基づき数学統計学的に分類する基準である。スタンレー・スティーヴンズStanley Smith Stevens)が1946年に論文「測定尺度の理論について」"On the Theory of Scales of Measurement" [1] で提案した分類がよく用いられる。

変数に対して可能な数学的操作は、変数を測定する尺度水準に依存し、その結果特に統計学で用いるべき要約統計量および検定法も変数の尺度水準に依存する。

スティーヴンズは低い方から順に以下の4つの尺度水準を提案しており、高い水準はより低い水準の性質を含む形になっている。また高い水準でのデータを低い水準に変換して扱うことができる。

名義尺度

類別尺度ともいう{{#invoke:Footnotes | harvard_citation }}。この水準では数字を単なる名前として対象に割り振る。2つの対象に同じ数字がついていればそれらは同じカテゴリに属する。変数値間の比較は等しいか異なるかでしか行えない。順序もないし加減などの演算もできない。例えば、ISO 5218は、ヒトの性別に数値を割り当てているが、「女性は男性の2倍である」「法人は女性の4.5倍である」という意味にならない。

例としては電話番号、背番号、バスの系統番号など。代表値の指標として使えるのは最頻値のみである。統計的バラツキは変動比や情報エントロピーで評価できるが、標準偏差などの概念はありえない。名義尺度でのみ測定されるデータはカテゴリデータとも呼ばれる。

  • なおカテゴリデータを、ある性質が「あるかないか」という表現に直し、さらにこれを「1か0か」で表現したものをダミー変数という。ダミー変数またはそれから算出されるスコア(点数)を、順序尺度以上の水準に準じて扱う方法もよく用いられる。

順序尺度

この水準では対象に割り振られた数字は測定する性質の順序を表す。数字は等しいかどうかに加え、順序(大きいか小さいか)による比較ができる。しかし加減などの演算には意味がない。 例えば、国際原子力事象評価尺度がこれにあたる。チェルノブイリ原子力発電所事故はレベル7に評価されているが、これは「レベル6よりも上である」という意味ではあるが「レベル4の2倍に及ばない」という意味にはならない。 その他にも物理学的な例としてモース硬度がある。その他の例にはレースの着順などがあるが、これでは到着時間の差は記録できない。心理学社会科学の測定のほとんどは順序尺度で行われる。例えば社会的態度(保守的か進歩的かなど)や階級は順序水準で測定されるものである。また客の嗜好(アイスクリームのバニラ味とチョコレート味とどちらが好きか)のデータもこれで表現できる。順序尺度の代表値は最頻値や中央値で表されるが、中央値の方が多くの情報を与える。順序尺度で測定されるデータは順序(または順位)データと呼ぶ。

順序尺度を統計で用いる場合に、順序尺度を数値に置き換えて計算することがある。ただし、計算結果が元の順序尺度を保存していることが条件となる。

  • 各カテゴリに属す対象の個数という形のデータにまとめると数量データと呼ばれ、これは分割表で表示できる。これらに対して用いられる統計検定法はノンパラメトリックなものに限る。

間隔尺度

対象に割り振る数字は順序水準の性質を全て満たし、差が等しいことを間隔が等しいことを意味する。 測定値の対(pair)の差の比較は意味がある。 加減の演算にも意味がある。 尺度上のゼロ点は任意で負の値も使える。

例はカレンダーの日付がある。 値の比に意味がない。直接の乗除の演算全般も同様に意味がない。 とはいえ差の比には意味がある。 代表値は最頻値、中央値あるいは算術平均で表す。算術平均が最も多くの情報を与えるかどうかは対象による。 間隔尺度で測定したデータを間隔データと呼ぶ。 摂氏または華氏で測る温度も間隔尺度である。

比率尺度または比例尺度

対象に割り振られた数字は間隔尺度の性質を全て満たし、さらにその中のペアの比にも、乗除の演算にも意味がある。比率水準のゼロ点は絶対的である。

ほとんどの物理学的量、つまり質量長さエネルギーは比率水準である。また温度も絶対温度で測れば比率尺度である。比率尺度で測定される変数の代表値は最頻値、中央値、算術平均あるいは幾何平均で表されるが、間隔尺度と同じく算術平均が最も多くの情報を与える。比率尺度で測定されるデータは比率データと呼ばれる。比率尺度で表される社会的変数には年齢、ある場所での居住期間、収入などといったものがある。

スティーヴンズは「名義尺度」、「順序尺度」、「間隔尺度」、及び「比率尺度」と呼び、両方を定量的なもの(順序、間隔、比率)と、定性的なもの(名義)にまとめた[1]

脚注

参考文献

石井 進 『生物統計学入門. 具体例による解説と演習』 (初版) 培風館、1975年ISBN 4563037346 

関連項目