手の形で解き明かす多変量解析の本質【ChatGPT統計解析】
ある医薬品開発会議で多変量解析を説明する際、手の形状を例に3次元情報を2次元に縮約するイメージを示しました。多変量解析は多くの次元データを少数の次元に減らし、元の情報を保ちながら理解を容易にする技術です。世の中の多くの事象は複数の変数で表され、人間の体形や味覚、性格、ブランドイメージなども多変量的に捉えられます。この解析の目的は、変数の数を減らしつつ、本質を捉えることにあります。建築設計図が専門家に3次元的に浮かび上がるように、データを効果的に視覚化し、多次元情報を分かりやすく伝える努力が重要です。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
手の内をみせる
ある医薬品の開発で医師の集まりに出席しました。
調査および分析結果を説明した後の質疑で、
「多変量解析をわかりやすく説明してほしい」
と言われました。そこで、相手が医師だから人体を例にしたほうがよいだろうと短絡的に考えてこんな話をしました。
「ここに手があります(片手を示して)。これが手であるということは目で見て、手が持っている立体的な像を知覚して判断します(手をひらひらさせる)。
つまり手からの情報を視覚的に3次元画像として受け取るのです。もし、これを2次元情報で間に合わせよといわれたらどうでしょう。
手の影をどこかにうつせばこれは2次元の映像です(会議室の壁にうつしてみせる)。問題は、影を眺めて手であると判断できるかどうかです。
これは簡単、5本の指がよくうつるようにすればよいのです(手をパッとひらいてうつしてみせる)。
もし向きが悪くてこうなったらどうでしょう(指が重なるようい横向きに影をうつしてみせる)。手であることがちょっとわからないでしょう。
つまり3次元情報を2次元情報に縮小して、なおかつもとの情報を失わないようにするには、手の向きをうまく加減すればよいのです。
手のたとえはこれでやめます(手を引っ込める)。」
この方法が「多変量解析」であると考えられたら如何でしょう。
ここでは、より多くの次元の情報を多変量データというわけですが、それを解析することによって、少数の次元に減少させ縮約するのがまさに多変量解析です。
われわれの住んでいる世界
トリやサカナは3次元世界を移動します。前後、左右、自由自在に思うがままに移動できるのです。
人間はどうでしょう。しばらく前までは地面にへばりついて生きてきました。
今は高層ビルにのぼったり、ジェット機に乗ったり、あるいは人工衛星からの写真で3次元を体験または意識できます。
ヘリコプター、ハングライダー、アクララングのたぐいを自分で使いこなせば、トリ、サカナになりきることだって可能です。
しかし、大部分の人たちは、せいぜいビルの中や地下鉄の迷路くらい、2次元と3次元の中間くらいのところ、つまりセミ3次元空間内に住んでいるものとみてよいでしょう。
変数X,Yは2次元のグラフに点で表すことができます。
それが変数X,Y,Zの3つに増えれば、3次元空間に点で表せます。せいぜいそこまでです。変数が4つや5つになったらお手上げです。
変数がたくさんになったら、それをできれば3つまで、欲を言えば2つまで減らしたいのです。
2つになったら即座に手元の紙にグラフが描けます。いまは3次元でもバーチャルという方法もあります。
変数の数を減らすこと、つまり「次元をいかに減少させるか」ということが、多変量解析のテーマです。
ここで変量とは、変数と同じ意味です。
多変量で表されるもの
ところで、多変量でなければ表せないものが、そんなにたくさんあるのでしょうか。
世の中の物事は1つの変数で説明がつくものは少ないのです。
たとえば人の体形も、身長、バスト、ウエスト、ヒップと4つの変数を必要とします。
ミルクコーヒーの味というと、香り、甘み、苦み、ミルクの味、コーヒーの味、液の濃さなどがあります。それらが一緒になって、ミルクコーヒーの味が成り立っています。
あるブランドに対するイメージを考えると、「親しみーとっつきにくい」「信頼できるー不安」「ユニークー月並み」「高級なー庶民的な」「CMが楽しいーくだらない」などいろいろな形容詞であらわされます。
会議はある問題をいろいろな角度から検討することが目的のひとつで、多くの人の意見でそれが可能となります。
生徒の学習能力をとっても理解力、記憶力、推理力など多彩な見方があります。それを偏差値のような1つの変数で代表させようとするから、いろいろと問題になります。
人間の性格となるとそれこそ複雑きわまりなく、一口で「あいつはそういう男だ」と言い切るのは難しいでしょう。人は一面で決めつけてはいけません。
ところで人間の能力というのは大したもので、私たちはまわりの友人の性格をわきまえて、大過なく付き合っています。
つまり相手の性格を多変量的に認知し理解し、それなりに対応しているのです。性格が似ている友人、性格が反対の友人、さらに新しい出会い、それらの人々が、私自身の意識空間のなかでそれぞれの位置を占めているのでしょう。
その意識空間というのはいったい何次元なんでしょう。おそらく1次元2次元ではないでしょう。
建築の設計図は3次元情報です。建築技師が見れば建物が目の前に、その細部とともに浮かび上がっているでしょう。
素人にはわからないから、設計図をもとにして「完成予定図」を描いて見せるのです。
近代的でスマートでかつ豪華なマンション、その回りには点々と緑の樹木やおしゃれな人々があしらわれています。
チラシに載っていたり、建築中の囲いのボードに掲げてある、あの絵です。そして「完成時には多少異なることがあります」と注意書きがあります。
多変量解析は、このような表現方法を工夫したり苦労したりすることは、変数の数そのものを減少させることを目的としています。
ある医薬品の開発で医師たちが集まる会議に参加した際、調査および分析結果の説明後に質疑応答が行われ、その中で「多変量解析をわかりやすく説明してほしい」という要望を受けました。相手は医師であるため、人体を例に説明する方が適切だろうと考え、次のように話を進めました。「ここに手があります(片手を示して)。これが手であるということは、私たちは目で見て、その形状や立体的な構造を知覚し、手であると判断します(手をひらひらさせる)。つまり、手からの情報を視覚的に3次元画像として受け取り、それを基に手であると認識するわけです。しかし、もしこの情報を2次元に縮約せざるを得ない場合、どうでしょうか。例えば、手の影をどこかに映せば、これが2次元の情報となります(会議室の壁に影を映してみせる)。問題は、この影を見ただけで手であると判断できるかどうかです。影の形状が明瞭で、5本の指がはっきり見える状態であれば、手であると容易にわかるでしょう(手をパッと開いて影を映してみせる)。しかし、もし影の向きが悪く、指が重なってしまったらどうでしょう(指を重ねて影を映す)。この場合、手であることが直感的にはわからなくなります。つまり、3次元情報を2次元情報に縮約する際、情報をできる限り失わないようにするには、手の向きを適切に調整する必要があるのです。これが、多変量解析における次元削減のプロセスに相当します。」このようにして多変量解析の本質を説明し、話を続けました。「われわれが住む世界は基本的に3次元空間です。鳥や魚はこの3次元空間を自由自在に移動し、前後、左右、上下と好きな方向へ進むことができます。一方、人間は地上で生活してきた歴史が長く、しばらく前まではほとんど地面に縛られて生活していました。しかし、現在では高層ビルに登ったり、ジェット機に乗ったり、さらには人工衛星から撮影された地球の画像を見ることで、3次元空間を意識的に体験できるようになっています。ヘリコプターやハンググライダー、さらにはスキューバダイビング用の器具を使いこなせば、鳥や魚のような視点で空や海を楽しむことも可能です。しかし、ほとんどの人々は、ビルの中や地下鉄の迷路といった2次元的な空間に限られた範囲で生活していると言えます。これは、完全な2次元でもなく3次元でもない中間的な領域、いわゆるセミ3次元空間です。変数XとYは2次元のグラフに点として表現することができます。これに変数Zが加われば、3次元空間における点として表現できます。しかし、もし変数の数が4つや5つに増えた場合、私たちはそれを視覚的に把握することが難しくなります。多くの次元を扱う際には、それらを可能であれば3次元、理想的には2次元に縮約したいというのが自然な欲求です。変数の数が少なくなれば、手元の紙に簡単にグラフを描いて理解を深めることができます。現在では3次元でのバーチャル技術も普及しており、次元削減の効果を直感的に示すことも可能です。多変量解析の目的は、変数の数を減らすことで情報の整理を行い、複雑な現象の本質を明らかにすることにあります。ここで重要なのは、変量という言葉が変数と同じ意味で使われる点です。さて、多変量解析が必要とされる場面はどれほど多いのでしょうか。実際、世の中のほとんどの事象は、1つの変数だけでは説明がつきません。例えば、人間の体形を説明するには、身長、バスト、ウエスト、ヒップといった4つの変数が必要です。ミルクコーヒーの味を考えると、香り、甘み、苦み、ミルクの味、コーヒーの味、液の濃さといった複数の要素が絡み合っています。それらが一体となって、私たちが認識するミルクコーヒーの味が成り立っています。また、あるブランドのイメージを分析する場合も同様です。「親しみやすいかどうか」「信頼できるか」「ユニークか」「高級感があるか」など、さまざまな形容詞でブランドイメージを表現する必要があります。会議の場では、1つの問題について多角的に検討し、多くの人々の意見を集約することが目的となるため、複数の視点が求められます。同様に、学生の学習能力を評価する際にも、理解力、記憶力、推理力といった多彩な要素を考慮しなければなりません。それを偏差値のような単一の指標でまとめようとすると、評価の偏りが生じる可能性があります。人間の性格について考えると、その複雑さは一層顕著です。「あの人はこういう人だ」と一言で断定するのは難しく、むしろ多くの側面を多変量的に捉える必要があります。私たちは、友人や知人の性格をそれぞれの特徴として認識し、適切に対応しています。これこそが、多変量的な情報処理の実例と言えます。そして、その性格や特徴は、私たちの意識空間の中で、それぞれ固有の位置を占めているのです。意識空間がどれほどの次元を持つかはわかりませんが、少なくとも1次元や2次元では収まりきらないでしょう。また、建築の設計図も多変量的な情報を含んでいます。建築技師が設計図を見ると、その建物が目の前に立体的に浮かび上がるかのように細部まで把握できます。一方で、素人には設計図だけでは理解が難しいため、完成予想図が用意されます。これは、設計図の情報をわかりやすく視覚化したもので、多変量解析における情報表現の工夫と共通しています。このように、多変量解析は情報を縮約しつつ本質を失わないようにする技術であり、現代社会の複雑なデータ解析において欠かせないものとなっています
関連記事