Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学とは何か【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学とは何か【統計解析講義基礎】

統計学とは何か【統計解析講義基礎】


統計学とは何か【統計解析講義基礎】

 

私の友人で有名なDJが、2万人も集めたミラン公演について話してくれていると、私たちの隣人がタクシーで到着しました。

 

ジャーナリストの彼は野生のキノコの調査からちょうど戻ったところで、熱心にその様子を語ってくれました。

 

しばらく3人でおしゃべりしていると、私は膀胱がんについて講演するためにクリーブランドへ行くことを話すことにしました。

 

私は、彼らが感動していると思いました。

 

DJの妙に協力的な奥さんに一度、丸一日かけてやったことは何かと尋ねられたことがあります。

 

私は、「大変な仕事で、DJの熱弁ほど興奮は少ないかもしれないが、あなたが思っている以上に面白く、満足している」と答え、「一番よいのは多くの統計家に会えること(実際は口にしていませんでしたが)」と続けました。

 

これはちゃんとした答えになっていませんが、私がこれから説明する推定と推論の参照になります。

 

すなわち、これは統計解析のすべてといって過言ではありません。

 

推定とは何かがどのくらい大きいか、小さいかを答えられるようにすることです。

 

その「何か」とは一般的に直接測れず、また測るのに多くの時間と労力を必要とするものです。

 

DJの妻への答えの中には2つの推定があります。「統計学は難しい仕事である」と「統計家であることに満足している」です。

 

ただし、これは正確ではないので、心理学者が仕事に対する精神的努力や満足度、楽しみを測る質問票を開発したとしましょう。

 

この「統計家であるにはどのくらい仕事をしなければならないか」という質問に答えるために、理想的なのは世界中の統計家一人一人に質問票を送付することです。

 

しかし、それは面倒です。

 

そこで、例えば、500人の統計家に質問票を送付し、その500人の答えが一般の統計家の意見を代表するものだと期待します。

 

この抽出した500人の統計家の「仕事に対する精神的努力」が平均で88%であったとしましょう。

 

そうすると、すべての統計家の平均の推定が88%であるということになります。

 

推論とは普通、仮説のもと統計的検定を実施して結論を導き出すことです。

 

DJの奥さんに対する私の答えの中に2つの仮説が含まれています。

 

「解析を行うことはDJをすることほど興奮することではない」と「統計学はあなたが思っているより楽しい」ということです。

 

最初の仮説を検定するために、仕事中の面白いことの質問を500人のDJに聞き、500人の統計家のそれと比較します(これを行うことはたぶん価値がないと思いますが)。

 

2つ目の仮説を検定するためにはデータをとる前に考えた予想と統計家の回答とを比較します(例えば、およそ0.3%の統計家は面白いと思っていたそうだ)。

 

これは対象となる統計家をどのようにして選ぶか、どんな質問をするか、返信封筒に切手を貼るか、または「着払い」を用いるか、どのくらいの頻度で返信がないものを追いかけるか、500の回答からのデータをどのようにコンピュータに入力するか、半分の質問しか答えなかった人をどう取り扱うか、などさまざまな問題を残します。

 

試験をデザインすることはかなり複雑で、統計家は試験デザインについて多くのことを知っています。

 

偉大な統計家の一人であるR.A.フィッシャーは「ラットが汚いと、データも汚くなる」と考え、自分自身でラットのケージを掃除していました。

 

確かにアンケート調査のデザインについても含めて、すべての質問は統計家によって作成されるものです(返信用封筒に切手を貼るかどうかについても)。

 

与えられた選択の中で、私を含むほとんどの人は複雑な解析を実施するよりも野生のキノコを食べたり、パーティーでディスクを回転させたりする方が楽しいと思います。

 

しかし、愛する人が膀胱がんにかかり、それにどう対応すべきか知りたいと思うこともあります。

 

統計学というととても冷たい感じがしますが、私にとって数字は生きて呼吸している父であり、しかも非常に人間的な目的があります。

 

すなわち、私たちは自分の人生をよりよく生きたい。そのためには、よい決定をしなくてはならないし、数字であるデータが私たちを助けるように、正しい方法でみる必要があるのです。

 

@統計学には推定、推論、および試験デザインがあります。

 

A推定とは何かの大きさや小ささを答えられるようにすることです。

 

B推論とは普通、仮説のもと統計的検定を実施して結論を導き出すことです。

 

C仮説とは、真か偽か知るために検定する事象についての記述です。

 

D多くの試験では数字を作り出します。数字の専門家として、統計家は試験が正確にデザインされているかについて多くのことを示します。

 

Eクリーブランドのラップミュージックは最悪でしたが、私が食べたディナーはとても美味しかったです。

セミナー詳細こちら                    解析ご相談こちら


 

統計学とは何か【統計解析講義基礎】

統計学とは何か【統計解析講義基礎】

統計学とは何か【統計解析講義基礎】