Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における尺度の水準【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における尺度の水準【統計解析講義基礎】

統計学における尺度の水準【統計解析講義基礎】


統計学における尺度の水準【統計解析講義基礎】

数値データのもつ情報

 

私たちのまわりには、身長・体重やテスト成績など、数値で表されるものが非常に多いです。

 

それらの数値は、見かけ上は同じでも、その数値がもっている情報には大きな違いがあります。

 

そうした情報の違いは、その数値データに適用される統計的方法の選択にも影響してきます。

 

名義尺度:野球の背番号

 

野球選手の背番号は、数値が名前の代わりに用いられているだけで、背番号8が背番号5より大きな数値であるといった数値の大小は直接的には何の意味も持っていません。

 

このような名前代わりに用いられる数値は「名義尺度」(nominal scale)を構成しているといいます。

 

順序尺度:鉱物の硬さ

 

鉱物の硬さの比較を考えてみましょう。

 

いま5種類の鉱物があるとします。それらを互いにこすりつけると、どちらがより硬いかがわかります。

 

そこで、硬い順にたとえば5、4、3、2、1という数値を割り当てるとしたら、この数値の大小は、例えば5の鉱物は3の鉱物より硬い、ということを意味します。

 

しかし、5の鉱物と3の鉱物の差は2であるという情報は、同じ2の差でも4と2の硬さの差や3と1の硬さの差と同じだけの硬さの差を表しているわけではないから、特別の意味をもちません。

 

このように順序情報のみが意味をもつ数値は「順序尺度」(ordinal scale)を構成しているといいます。

 

間隔尺度:摂氏温度

 

摂氏で表現される温度を考えてみましょう。

 

温度の大小(高低)に意味があることは明らかですが、温度の場合はそれに加え、数値の差にも意味があります。

 

たとえば、20度と25度の間の5度の差と、25度と30度の間の5度の差は、同じだけの熱膨張をもたらすとか、温度上昇に同じだけの熱量が必要であるという点で同等の差であるということができます。

 

このように値の差(間隔)に意味がある数値は「間隔尺度」(interval scale)を構成しているといいます。

 

比尺度:長さ

 

最後に、ものさしで測られる長さの例を考えてみます。

 

長さについては、数値の大小や差に意味があるだけでなく、「10mは2mの5倍である」という情報にも意味があります。

 

実際、2mの棒を5個つなげると10mの棒と同じ長さいなるからです。このことは温度の場合と比べるとわかりやすいです。

 

10度は2度の5倍の数値ですが、この5倍という値には何の意味もありません。

 

長さのように値の比にも意味がある数値は「比尺度」(ratio scale)を構成しているといいます。

 

以上まとめて、どの尺度にはどのような情報に意味あるかを示したのが以下の表です。

 

尺度の水準 比尺度 間隔尺度 順序尺度 名義尺度

 

数値の間の比    ○ × × ×

 

数値の間の差    ○ ○ × ×

 

数値の間の大小 ○ ○ ○ ×

 

数値の間の異同 ○ ○ ○ ○

 

これら4種類の尺度の性質の違いは、尺度の水準または測定の水準とよばれています。

 

許容される変換

 

順序尺度をなす鉱物の硬さは、5種類の鉱物に5、4、3、2、1という数値を割り当てても、10、4、3、2、1という数値を割り当てても、大小関係に関する情報を正しく保持しています。

 

順序尺度の場合は、このように、もとの数値にどのような単調変換を施しても順序尺度としての機能は損なわれません。

 

このことを「順序尺度の場合、任意に単調変換が許容される」といいます。

 

このように、それぞれの水準の尺度は、どのような変換に対してその機能を保持できるかという観点から特徴づけることができます。

 

下の表は4水準の尺度について、それぞれどの変数のもとで尺度の機能が保持されるか、すなわち各尺度水準における許容される変換を一覧表にしたものです。

 

変換    比尺度 間隔尺度 順序尺度 名義尺度

 

定数倍をする変換 ○ ○ ○ ○

 

定数を加算する変換 × ○ ○ ○

 

非線形の単調変換 × × ○ ○

 

任意の一対一変換 × × × ○

 

統計的方法の選択

 

5種類の鉱物に5、4、3、2、1という割り当てをする場合、5の鉱物と1の鉱物の硬さの平均(3)は、4の鉱物と3の鉱物の硬さの平均(3.5)より小さいが、10、4、3、2、1という割り当てにすると、上記の同じ2つずつの鉱物の平均が、5.5と3.5になって大小が逆転します。

 

つまり、順序尺度の機能がそのまま保持される変換(単調変換)を行ったら、平均値の比較結果は変わってしまうということです。

 

このことは、順序尺度のデータにおいて平均値を求めて比較することは適切でないということを意味しています。

 

平均や相関係数など多くの統計的指標や分析法は基本的に間隔尺度・比尺度のデータへの適用を想定しています。

 

一方、順序尺度・名義尺度のデータに対してはノンパラメトリック法とよばれる一連の方法が用意されています。

セミナー詳細こちら                    解析ご相談こちら


 

統計学における尺度の水準【統計解析講義基礎】

統計学における尺度の水準【統計解析講義基礎】

統計学における尺度の水準【統計解析講義基礎】