データの中に、一つだけ他のデータとかけ離れている値がある場合、それを外れ値として棄却するべきかどうか、検定する方法。
スミルノフ・グラブス棄却検定
- 帰無仮説:この値は外れ値ではない
- 対立仮説:この値は外れ値である
1. 検定統計量Tを求める
エクセルの場合、
eg. A1:A10の中にあるデータ中、A5の値が外れ値かどうか検証したい場合
作業セル:= (A5-(average(A1:A10))/SQRT(STDEV(A1:A10)))
2. 有意水準αを決め、棄却検定表のデータ数nのときの値kを得る
3. T > kで帰無仮説を棄却し、対立仮説を採用。つまり、有意水準αで、かけ離れた値は外れ値として棄却される。
R で外れ値を検定する場合
Rで検定する場合も載せておく。
car パッケージを使う。
car パッケージを読み込んで、
library(car)
OutlaierTest ▼
car::outlierTest (データ名)
データの中のどこが外れ値か、すぐに出してくれる。