間隔尺度の落とし穴!割り算で失敗しないコツ【ChatGPT統計解析】
間隔尺度の取り扱いでは割り算が適切でないことに注意が必要である。正確な数値計算が必ずしも現実世界と一致するわけではなく、間違った解釈を招く可能性がある。例えば、商品のデザイン評価で平均点の比較を行う際、単純な割り算による比較は誤解を招く。これは、数字が現実世界と一対一で対応していないためである。同様に、気温とビールの出荷量の関係を分析する際も、間隔尺度の性質を誤解すると間違った結論を導くことがある。したがって、尺度の性質を正しく理解し、適切な解釈を行うことが重要である。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
間隔尺度の取り扱い上の注意
以下に、100人に商品デザインを評価してもらった結果があります。
カテゴリー 非常によい まあよい ふつう あまりよくない 全然よくない
点数 5点 4点 3点 2点 1点
A商品 40人 40人 20人 0人 0人
B商品 20人 30人 30人 20人 0人
各カテゴリーに5点から1点までのスコアを与えたときの平均スコアは、
A商品は、(5×40+4×40+3×20)÷100=4.2点
B商品は、(5×20+4×30+3×30+2×20)÷100=3.5点
となります。
そこで、この2つの平均スコア同士で割り算して、4.2÷3.5=1.2
したがって、A商品のデザインはB商品より1.2倍良い、と報告したとします。
この報告は正しい報告といえるでしょうか。
ちなみに、各カテゴリーに、+2点から−2点までえのスコアを与えたらどうなるでしょうか。
計算しなおすと、A商品1.2、B商品0.5となります。
割り算すると、なんとA商品はB商品よりも2.4倍デザインが良い、という話になってしまいます。
要するに、間隔尺度で割り算したことに問題があるのです。
このようなミスはしないようにしましょう。
尺度のまとめ
@名義尺度: カテゴリー型 数値計算ができない 性別・職業など
A順序尺度: カテゴリー型 順序付けができる 学歴・生活水準など
B間隔尺度: 数量型 割り算ができない 温度・評価など
C比尺度: 数量型 何でもできる 年齢・収入など
数値計算が正しいから答えも正しいとは限らない
アリスの鏡の世界では不思議なことが不思議でないように、数字の世界はそこ独自の抽象論理で動いています。
そこの世界で数字を足したり掛けたり、いろいろ計算するのは勝手ですが、その結果は決して現実世界と1対1の対応はしていません。
では、以下の式をどう解釈すればよいでしょうか。
20歳+20歳+20歳+20歳=80歳
@経験豊かなお年寄りの知恵は若者数人が出し合った知恵に相当します。
A人生設計は20年単位に目標を設定するのがよいでしょう。最初の20年はまず学校、ついで仕事・結婚、ついで社会的安定、残りは悠々自適というところ、夢は大きく足元は着実に、20年はその中間の区切りというほどの話でしょうか。
このように、足し算一つとっても複数の解釈があります。
もともと数字は一人歩きできないものと思ったほうがよいでしょう。
ただし、数字の足し算でひとつ確かなことは、数量データの足し算は平均値計算のステップに他ならないということです。
足し算したら、あとは合計をデータ個数で割って算術平均値が求められます。
尺度についての解釈
夏期におけるビールの出荷高と平均気温について以下の関係があります。
今年 出荷高60万ケースで平均気温は摂氏30度
昨年 出荷高50万ケースで平均気温は摂氏25度
この関係から以下のことが言えるでしょうか。おかしい記述があればその理由を指摘しましょう。
@昨年に比べて今年の夏期出荷高は20%伸びた。
A今年の夏の平均気温は30度で、昨年の25度に比べて、20%も多く暑かった。
B今年の夏はビール60万ケース売れたが、平均気温が30度だったので、気温1度あたり2万ケースの出荷高といえる。
C昨年よりビールの出荷高が10万ケース増加しているが、気温も5度上昇している。気温1度の上昇で平均2万ケースの増加といえる。
以下解説です。
@は正しいです。
A気温は間隔尺度なので分母にもってきて割り算できません。ここでは30度÷25度としています。
B上と同じで、60万ケース÷30度としているのが誤りです。
C正しいです。気温の差は間隔尺度ではなく比尺度です。なぜなら気温差「0」を基準とした尺度とみることができるからです。
関連リンク