Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における複数の変数の扱い【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における複数の変数の扱い【統計解析講義基礎】

統計学における複数の変数の扱い【統計解析講義基礎】


統計学における複数の変数の扱い【統計解析講義基礎】

数値で表すしあわせ度

 

以前に招かれた結婚披露宴で、こんな祝辞がありました。

 

「夫婦というのは数値であらわすと、夫が1で、奥さんが0です。したがって、奥さんが夫の先に出ようとすると、01ですからこれはやはり1にしかなりません。それとは反対に、奥さんが夫の後にしたがえば、全体として10にもなり、そして100にも1000にもなるのであります・・・・」

 

ずいぶん女性を差別した話だと、世の女性からはしかられそうです。

 

しかし、どちらに1を与え、どちらに0を与えるかは保留にしておいて、その夫婦を見てから決めることにすれば、案外、真実をついているかもしれません。

 

グズグズして大事なところで決断しかねる男性は、賢明な奥さんを先に立てるほうがよいし、そのほうが楽です。

 

もっとも、賢明な女性はそういう男とは結婚したがるかどうか。

 

ここで、夫と妻の性格をX、Yとして、それにあるスコアを与えるとします。

 

さらにそれをある算式で総合します。

 

すると、その夫婦の「しあわせ度」みたいな値が得られます。

 

それにはどんな算式がよいでしょうか。

 

似たもの夫婦というから、性格スコアが近いときに、しあわせ度が高くなるような算式はどうでしょうか。

 

いやどちらも勝気ならケンカばかりするから、お互いの性格スコアはプラスマイナス反対のほうがしあわせ度が高くなるようにしたほうがいいかもしれません。

 

複数の変数を扱う

 

これまで、ある個数のデータがあるというとき、それがすべて1種類だけのデータ、たとえば何人かの身長のデータである、あるいはすべて体重のデータであるとしてきました。

 

その1種類のデータを相手にして、度数分布なり平均値なりバラツキなりを扱ってきました。

 

ところが、先の例では、夫と妻に別々のスコアを与えようとし、その組み合わせを問題としました。

 

2つの異なるデータ種類の関係を論じようとしているのです。

 

データ種類を「変数」という数学用語で言い換えると、変数X,Yといったとき、たとえば変数Xは身長であり、変数Yは体重を表しているということになります。

 

変数は文字通り「変わる数」であり、わざわざ数学用語などと断らなくてもよいかもしれません。ちなみに変わらない数は定数と呼びます。

 

身長を表す変数Xは、対象者によってX=160cmになったり、X=170cmになったりします。

 

変数Yは、対象者の体重によってy=60kgになったりy=65kgになったりします。

 

なお、このように変数名は大文字で、その実測値(あるいは観測値、実現値)は小文字で表すのが、数学では習慣になっています。

セミナー詳細こちら                    解析ご相談こちら


 

統計学における複数の変数の扱い【統計解析講義基礎】

統計学における複数の変数の扱い【統計解析講義基礎】

統計学における複数の変数の扱い【統計解析講義基礎】