外れ値の判定方法|【ビジネス統計学・統計解析】
外れ値の判定方法
品質管理の分野で利用されている統計学では、平均値から2シグマや3シグマ以上離れているデータを外れ値として判定します。
正規分布に従っているデータであれば、この方法は妥当です。
しかし、実際のビジネスの現場では、記録されているデータに正規分布に従うものはほとんどないのが現状です。
ビジネス統計で外れ値を判定するためには、ビジネス業務の知識を活用する必要があります。
ビジネスの観点でデータの意味を考えて、分析目的に合わないデータを外れ値とします。
例えば、ひと口に年収のデータを分析すると言っても、低所得者の年収を分析するのと、富裕層の年収を分析するのとでは、必要なデータは全く違います。
前者の場合は年収数千万円のデータは外れ値になりますし、後者の場合は年収数十万円のデータが外れ値になります。
ビジネス統計で外れ値を判定するためには、統計学の知識よりもビジネス業務の知識の方が大事といえます。
関連記事