Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における間隔尺度の取り扱い上の注意【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における間隔尺度の取り扱い上の注意【統計解析講義基礎】

統計学における間隔尺度の取り扱い上の注意【統計解析講義基礎】


統計学における間隔尺度の取り扱い上の注意【統計解析講義基礎】

 

以下に、100人に商品デザインを評価してもらった結果があります。

 

カテゴリー   非常によい  まあよい  ふつう  あまりよくない  全然よくない
点数     5点  4点  3点  2点  1点
A商品    40人  40人  20人  0人  0人
B商品    20人  30人  30人  20人  0人

 

各カテゴリーに5点から1点までのスコアを与えたときの平均スコアは、

 

A商品は、(5×40+4×40+3×20)÷100=4.2点

 

B商品は、(5×20+4×30+3×30+2×20)÷100=3.5点

 

となります。

 

そこで、この2つの平均スコア同士で割り算して、4.2÷3.5=1.2

 

したがって、A商品のデザインはB商品より1.2倍良い、と報告したとします。

 

この報告は正しい報告といえるでしょうか。

 

ちなみに、各カテゴリーに、+2点から−2点までえのスコアを与えたらどうなるでしょうか。

 

計算しなおすと、A商品1.2、B商品0.5となります。

 

割り算すると、なんとA商品はB商品よりも2.4倍デザインが良い、という話になってしまいます。

 

要するに、間隔尺度で割り算したことに問題があるのです。

 

このようなミスはしないようにしましょう。

 

尺度のまとめ

 

@名義尺度: カテゴリー型 数値計算ができない 性別・職業など

 

A順序尺度: カテゴリー型 順序付けができる 学歴・生活水準など

 

B間隔尺度: 数量型 割り算ができない 温度・評価など

 

C比尺度: 数量型 何でもできる 年齢・収入など

 

数値計算が正しいから答えも正しいとは限らない

 

アリスの鏡の世界では不思議なことが不思議でないように、数字の世界はそこ独自の抽象論理で動いています。

 

そこの世界で数字を足したり掛けたり、いろいろ計算するのは勝手ですが、その結果は決して現実世界と1対1の対応はしていません。

 

では、以下の式をどう解釈すればよいでしょうか。

 

20歳+20歳+20歳+20歳=80歳

 

@経験豊かなお年寄りの知恵は若者数人が出し合った知恵に相当します。

 

A人生設計は20年単位に目標を設定するのがよいでしょう。最初の20年はまず学校、ついで仕事・結婚、ついで社会的安定、残りは悠々自適というところ、夢は大きく足元は着実に、20年はその中間の区切りというほどの話でしょうか。

 

このように、足し算一つとっても複数の解釈があります。

 

もともと数字は一人歩きできないものと思ったほうがよいでしょう。

 

ただし、数字の足し算でひとつ確かなことは、数量データの足し算は平均値計算のステップに他ならないということです。

 

足し算したら、あとは合計をデータ個数で割って算術平均値が求められます。

 

尺度についての解釈

 

夏期におけるビールの出荷高と平均気温について以下の関係があります。

 

今年  出荷高60万ケースで平均気温は摂氏30度
昨年  出荷高50万ケースで平均気温は摂氏25度

 

この関係から以下のことが言えるでしょうか。おかしい記述があればその理由を指摘しましょう。

 

@昨年に比べて今年の夏期出荷高は20%伸びた。

 

A今年の夏の平均気温は30度で、昨年の25度に比べて、20%も多く暑かった。

 

B今年の夏はビール60万ケース売れたが、平均気温が30度だったので、気温1度あたり2万ケースの出荷高といえる。

 

C昨年よりビールの出荷高が10万ケース増加しているが、気温も5度上昇している。気温1度の上昇で平均2万ケースの増加といえる。

 

解説

 

@は正しいです。

 

A気温は間隔尺度なので分母にもってきて割り算できません。ここでは30度÷25度としています。

 

B上と同じで、60万ケース÷30度としているのが誤りです。

 

C正しいです。気温の差は間隔尺度ではなく比尺度です。なぜなら気温差「0」を基準とした尺度とみることができるからです。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学における間隔尺度の取り扱い上の注意【統計解析講義基礎】

統計学における間隔尺度の取り扱い上の注意【統計解析講義基礎】

統計学における間隔尺度の取り扱い上の注意【統計解析講義基礎】