あるデータのリバイスで、患者さんが最後に認知機能検査を受けた時期から亡くなるまでの期間が解析グループで差があるんじゃないか、とレビューアーから指摘された。
なので、その期間が各群で差がないことを示す検定結果をつける事に。
対応のない2群比較の場合は、
- 正規分布で等分散 → Student t-test(スチューデントのt検定、パラメトリック)
- 正規分布で等分散/不等分散両方OK → Welchi's test(ウェルチのt検定)
- 正規分布でも等分散でもない → Wilcoxon rank sum test(= Mann-Whitnes&s U test、ノンパラメトリック)
という感じで検定する。
認知機能検査って、だいたい正規分布じゃないんだよね……と思いながら、念の為ヒストグラムで確認。
ヒストグラム:hist()
コードは
hist(データ$列名)
でOK。
当たり前だけど、variables は numeric じゃないとダメ。
hist(Data_C_LBD$MMEtoDeath)
これに、X軸ラベル、Y軸ラベルをつけたり、ヒストグラムの色を変えたり……
hist(Data_C_LBD$MMSEtoDeath, xlab = "Interval from last MMSE to death (years)", ylab = "Number of Patients", main = "Histogram of Distribution", col = "cornflowerblue", border = "#000000")
と、ちょっと遊んだところで、予想通り正規分布じゃなかったので、ウィルコクソンの順位和検定をして結果をSupplに追加した。