
データの中に、一つだけ他のデータとかけ離れている値がある場合、それを外れ値として棄却するべきかどうか、検定する方法。
スミルノフ・グラブス棄却検定
- 帰無仮説:この値は外れ値ではない
- 対立仮説:この値は外れ値である
1. 検定統計量Tを求める
エクセルの場合、
eg. A1:A10の中にあるデータ中、A5の値が外れ値かどうか検証したい場合
作業セル:= (A5-(average(A1:A10))/SQRT(STDEV(A1:A10)))
2. 有意水準αを決め、棄却検定表のデータ数nのときの値kを得る
3. T > kで帰無仮説を棄却し、対立仮説を採用。つまり、有意水準αで、かけ離れた値は外れ値として棄却される。
…私は外れ値を外すのはあまり好きじゃないので、ほとんど使う事はないですが、
先日、
「この値は外れ値じゃないの?」
と指摘されたので、数年ぶりに使いました。
上記法で確認すると、確かに外れ値なんですが、
データ自体はホントっぽいし、結構ばらつきが多い事が特徴的な群だったので、
理由を説明して解析に加えました。
次に使う日は…いつかくるかな?