Python・R・エクセルによるデータサイエンス | 統計解析講義

エクセルは統計学学習の最強ツール【Python・R・エクセル統計解析】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

エクセルは統計学学習の最強ツール【Python・R・エクセル統計解析】

エクセルは統計学学習の最強ツール【Python・R・エクセル統計解析】


エクセルは統計学学習の最強ツール【Python・R・エクセル統計解析】

 

エクセルつまりMicrosoft Excelは統計学学習の最強ツールです。

 

エクセルは、私たちが(おそらく)常に慣れ親しんでいるツールです。

 

集計表の作成、ちょっとしたお金の計算などにエクセルを使われている方も多いのではないかと思います。

 

入り口としての敷居が低い、入りやすいというメリットがありますが、実はそれだけではありません。

 

エクセルは、セル(マス目一つ)単位で処理をしてくれます。

 

一つ一つのセルで、どういう計算をしているかがわかるので、処理の流れを簡単に理解することができます。

 

例えば、回帰分析で残差平方和を計算する過程は、統計ソフトでは値は出してくれますがその計算方法までは教えてくれません。

 

しかし、エクセルの場合、残差平方和を計算する計算式がセルに組み込まれています。

 

この場合、SUMSQ(範囲)という式が入っており、範囲に残差が指定されているので、残差の2乗の和を計算しているのだな、ということがわかります。

 

また、範囲指定した残差のセルを確認すると、観測値−予測値 という式が組み込まれていることがわかります。

 

このように、処理の流れを簡単に追跡し理解することができます。

 

また、Excelには数多くの統計関数が収載されています。これをうまく活用すれば、ちょっと複雑な統計量も簡単に計算することができます。

 

偏差の平方和は、平均を引いたものの2乗の和ですので、手計算すると結構面倒です。

 

しかし、DEVSQ(範囲)とすれば、その範囲の値すべてについて平均を引いたものの2乗の和、つまり偏差平方和を一発で計算してくれるので便利です。

 

難しい確率のp値を計算するときにも、NORMSDIST、TDIST、CHIDIST、FDISTなどの関数を使えば、簡単に計算することができます。

 

古い統計の教科書では、確率分布表が教科書の巻末に記載されていますが、今ではそのようなものも必要ありません。Excelで簡単に計算できます。

 

このように、エクセルは統計ツールとしてとても便利なのですが、一点注意しなければいけないことがあります。それは、

 

エクセルでのみ統計処理した結果を論文投稿しない

 

ということです。

 

論文の方法のパラグラフで、使用した統計ツールを記載しますが、そこに「統計解析にはMicrosoft Excelを使用した」とすると論文は通りません。

 

正規の統計解析ソフトで解析してください、と査読者からコメントをもらうでしょう。

 

確かにエクセルは便利なのですが、使用者の主観により自由自在に操れる反面、計算式の入力ミスなどのヒューマンエラーもおこりやすいため、結果をそのまま使用するのはある意味危険ともいえます。

 

一番良いのは、統計ソフトで出力した結果の確認ツールとしてエクセルを使用することです。

 

なお、図表の作成に関しては別の話で、こちらについてはエクセルは素晴らしいツールです。私は論文投稿用の図表はエクセルで作成しています。

 

なぜかというと、計算結果を直接図表化することができますし、背景や文字の大きさ、フォントなどを自由自在に変えることができます。

 

是非エクセルを日頃の業務だけでなく統計学の学習にご活用ください。

 

私もエクセルに育てられてここまできました。

 

なお、エクセルで表計算を行うときには必ずマウスを使うようにしてください。

 

マウスなしで表計算するのは、少なくとも私の場合は少しきついです。

 

やれなくもないですが指に負担をかけます。

セミナー詳細こちら                    解析ご相談こちら


 

エクセルは統計学学習の最強ツール【Python・R・エクセル統計解析】

エクセルは統計学学習の最強ツール【Python・R・エクセル統計解析】

エクセルは統計学学習の最強ツール【Python・R・エクセル統計解析】