ママ研究者の雑記帳

3人の子持ち研究職の日々あれこれ

「Rデータ整理」の記事一覧

R logo

【Rデータ整理】行の並び替え

下記のようなデータフレーム(df)があり、行を昇順or降順で並べ替えたい時。 私が使いやすいと思う順で arrange() , order , sort() の使い方を書き留めておく。 dplyr::arrange() […]
R logo

【Rデータ整理】重複する列を削除

下記のようなデータがあって、 "Deceased" が "True" と "False" と入力されている症例がそれぞれどれくらいずつあるか count(group_by()) で求めると、 Dat1 <- rea […]
R logo

【Rデータ整理】クロス集計表

カテゴリデータの集計表⇔データフレームの切り替え。 クロス集計表 例えば、 運動あり 運動なし 認知症あり 10 15 認知症なし 20 5 のようなデータの集計表を作る時。 基本は行列で作る。 行列(matrix)で作 […]
R logo

【Rデータ整理】tidy data に変換する

↑ これは見やすいけど、Rで計算する場合は tidy data じゃないのでちょっと困る。 これを、Rに取り込んで、tidy data に変換する方法。 tidy data と messy data については、多くのサ […]
R logo

【Rデータ整理】行方向の平均値を出して任意の列に適応

列A、列B、列C...の各行毎に平均値を出して、それぞれ新しい列に結果を追加する方法3つ。 個人の練習も兼ねて前後の工程も記載しているので、あしからず。 事前準備 データの取り込み 人からもらった、とあるデータを取り込む […]
R logo

【Rデータ整理】欠損値(NA)の取り扱い方①:欠損値/欠損値以外のデータの抽出方法

データ整理をしていると、データが抜けていて欠損値になっている事がある。 この時の対処方法いろいろ。 データのインポートと欠損値(NA)の抽出、欠損値行を避けて抽出する方法 例えば、下記のようなデータがあって、いくつか空欄 […]
R logo

【Rデータ整理】列の順番を並び替える

データフレームの列の順番を並び替える時は、列選択で使用する dplyr::select を使う。 例えば、下記の様なデータフレーム(データ名: Dat1)があって、 これを左から 「Sex -> Genotype […]
R logo

【Rデータ整理】文字列や論理値列を追加

Rで列を追加する時は、 dplyr::mutate() を使っている。 mutate(列A+列B) のように計算式の結果を入れられるので便利だけど、文字列を入れる時はこんな感じ ▼ 例:Data というデータフレーム内で […]
R logo

【Rデータ整理】列名とデータ型の変換

R にデータを取り込んで、そこから最初に行う作業の備忘録。 データのインポート 私は、データベースからエクセル (.xlsx) でデータを取得し、それを R に取り込む場合が多い。 エクセルの取り込みは、 readxl: […]
R logo

【Rデータ整理】文字列の置換

とある csv データを取り込み…… Data1 <- read.csv("Dataset.csv") 「str()」で確認すると、 数値になっていてほしいところが、文字列で認識されている。 これはなんでかというと […]
R logo

【Rデータ整理】factor と numeric の変換

これからデータ整理の色々と書き留めていく予定。 まず、とあるcsv データを取り込み。 取り込みの方法は下記 ▼ Data1 <- read.csv("Dataset.csv") 「str()」で確認すると、 fa […]