Rにはベクトル専用の関数が多く用意されている。
例えば、
-
:合計を求めるsum()
-
:平均値を求めるmean()
-
:中央値を求めるmedian()
etc.
この時注意したいのが、データフレーム内に「NA」があると、計算結果が全て「NA」になってしまう。
この現象を回避するため、
「ベクトルに含まれている NA を無視する」
という指示を記載しておくと良い。
na.rm = TRUE
コードは、
na.rm = TRUE
例えば下記のようなsum関数で、最後に
ra.rm = TRUE
を指定すると、
sum(Data_LBD$amy >= 1 & Data_LBD&LATESgate2 == 1, na.rm = TRUE)
ちゃんと計算された。
ベクトル要素を処理する関数色々
関数(na.rmのデフォルトはFALSE) | 説明 |
---|---|
sum(ベクトル, na.rm = TRUE) | ベクトル要素の総和を求める |
mean(ベクトル, na.rm = TRUE) | ベクトル要素の平均を求める |
median(ベクトル, na.rm = TRUE) | ベクトル要素の中央値を求める |
max(ベクトル, na.rm = TRUE) | ベクトル要素の最大値を求める |
min(ベクトル, na.rm = TRUE) | ベクトル要素の最小値を求める |
range(ベクトル, na.rm = TRUE) | ベクトル要素の最大値と最小値を返す |
prod(ベクトル, na.rm = TRUE) | ベクトル要素の総積(全ての積)を返す |
cumsum(ベクトル) | 先頭の要素からの和を順に求める |
cumprod(ベクトル) | 先頭の要素からの積を順に求める |
sort(ベクトル) | ベクトル要素を昇順で並べ替える |
rev(ベクトル) | ベクトル要素を降順で並べ替える |
rank() | 各要素の要素全体における順位を求める |
order() | 並べ替え後の各要素の元の位置を求める |
cor(ベクトル) | 相関係数を求める |
var(ベクトル, na.rm = TRUE) | 不偏分散を求める |
cov(ベクトル, [,ベクトル]) | 共分散を求める |
sd(ベクトル, na.rm = TRUE) | 標準偏差を求める |
リンク
リンク
リンク
リンク