統計ソフトはブラックボックス|IT革命【統計学・統計解析講義基礎】
IT革命により統計学は身近になったものの、統計ソフトは依然としてブラックボックス
統計学・統計解析は昔は大変だった
昔は統計解析というと、専門家でないと理解できないような学問領域と考えられていました。
特に多変量解析などの複雑な統計解析は、1980年代までは専門家が大型計算機でないと計算できないような時代でした。
また、今日のように統計解析をわかりやすく解説する本はほとんどなく、多くは複雑な数式を散りばめた難解な数理統計学の教科書でした。
時代はかわり、IT革命により高性能のコンピューターが卓上で使えるようになりました。
30年前に大型計算機で半日かかっていた計算が、IT革命に伴い、インテルの高性能CPUで、ものの数秒で計算してしまうのです。
IT革命はまた、インターネットの普及により、統計学・統計解析の難しい用語が、Googleをはじめとする検索エンジンにより簡単に調べられるようになりました。
IT革命により、これまで専門家しか触れられなかった統計学・統計解析がより身近なものになってきました。
さらにユーザーフレンドリーな統計ソフトも登場してきました。SPSS、JMPなど、マウスを使ってサクサクと誰でも統計解析が出来るようになりました。
簡単なものだけでなく、複雑な多変量解析など簡単に解析できるようになりました。
また、誰でも無料で使えるソフトとしてR、Pythonの登場の大きなインパクトがありました。
Rのすごいところは、無料であるというだけでなく、膨大な数の解析パッケージがあり、かなり高度な解析もうまくパッケージを選べば簡単に出来てしまうのです。
統計解析のインフラストラクチャーは今日ではかなり整備され、データを解析し、学会発表や論文発表をしたりすることは昔に比べ比較にならないくらい容易になりました。
さらに、統計解析のわかりやすい教科書も書店の書棚に並ぶようになり、自己学習も昔に比べ簡単に出来るようになりました。
インターネットの進歩により、ちょっとした検索で、即時に統計解析の知識を入手することができるようになりました。
インフラが整備されたこと自体は良いことなのですが、これにより論文の付加価値も上がりました。
昔は稚拙な統計解析でも堂々と公表されていたのが、今日ではトップクラスの論文にはトップクラスの統計学者がレビューに加わり、稚拙な解析をしたら不採用とされるようになったのです。
統計解析ソフトは肝心の解析過程がブラックボックス
そこでより洗練された解析を専用の統計解析ソフトを使って実行するのですが、肝心の解析の過程がブラックボックスなのです。
このブラックボックスの部分を統計解析ソフトは教えてくれません。
統計解析ソフトはしゃべれないのです。解説してくれないのです。
いくらIT革命といっても、統計解析ソフトがしゃべってくれるようになるには、さらに何十年もかかるでしょう。
仕方なく、得られた解析結果を十分に理解しないまま公表することになります。
表面上は論文のレベルは上がっているように見えても、書いた本人が十分理解出来ていないという不可解な現象が起こっています。
書いた本人がわからない論文を、読む立場の人が理解できるはずがありません。
ブラックボックスの中身を解説する、統計解析の教育が今後ますます必要となるでしょう。
関連リンク