パス解析におけるモデルのトリミング|【多変量解析・統計学・統計解析】
パス解析におけるモデルのトリミング
時々,モデルのパラメータが推定された後で,研究者がモデルを単純化するために,影響が小さかったり有意ではなかったりするパスを除外することがある。
これはモデルのトリミングとよばれる。
モデルをトリミングするときに,忘れてはいけないことが2つある。
1つ目は,トリミングした後でもう一度新しいパラメータを推定する必要があるということだ。
もし取り除いた影響が小さいものでも,新しい推定値は古い推定値とそれほど大きく変わらないだろうが,それでも報告されるパラメータ推定値はそこにあるモデルの推定値である必要があるので,再推定する必要がある。
2 つ目に,トリミングされたモデルは,ある程度,観測されたデータに依存したものになる。
つまり,トリミングはデータにおける関係の偶然性を利用したことになるかもしれない。
新しいモデルにおいてパラメータが統計的に有意であるというのは,コンピュータが新しい結果を報告した,といえるほどの重要性はないかもしれない。
これに関連して,最終的なモデルの妥当性に対するより重大な危険性があるのは,モデルをレイアウトする前にデータの周辺を詮索することである。
トリミングなどで事前に詮索してしまうと,偶然生じた関係を取り上げてしまう危険性があり,それで最終的なモデルが正しいと確信してしまうことは,パス解析のもつモデル主導的な考えに逆行する。
偶然生じた関係を取り上げてしまう落とし穴から,研究を守る古典的な方法が1つある。
それは,ホールドアウトされたサンプルを使うことだ。
つまり,可能であれば,十分な観測度数をもつサンプルの一部分(1 /3程度)をランダムに選び出したセットで十分な練習をして,そこでモデルを発展させるのだ。
最終的なモデルは,ホールドアウトサンプルで検証される。
この手続きは交差妥当化として知られている。
関連記事