【Rデータ整理】文字列や論理値列を追加 更新日:2021年11月28日 公開日:2021年11月26日 R Rで列を追加する時は、 dplyr::mutate() を使っている。 mutate(列A+列B) のように計算式の結果を入れられるので便利だけど、文字列を入れる時はこんな感じ ▼ 例:Data というデータフレーム内で […] 続きを読む
【RStudio】任意の単語etc.を全選択(VSCodeの Ctrl+L, Ctrl+D の代わりになるショートカットキーは?) 更新日:2023年4月24日 公開日:2021年11月22日 R R Studio を使っていてちょっと不便だなと思ったのが、VS Code で多用している Ctrl + Shift + L (カーソル上と同じ単語etc. を全選択) Ctrl + Shift + D (カーソル上と同 […] 続きを読む
【Rで作図】facet毎に色を変える 公開日:2021年11月18日 R 認知機能の変化を、LBD, AD, LBD+AD グループ毎に、LATE(+)とLATE(-)で分けて示したいと思い、下記のようにグラフを作製。 ```{r fig.width=6} filter(Data, compl […] 続きを読む
【Rで統計】回帰分析で参照グループを指定する 公開日:2021年11月14日 R あるデータで線形混合モデルを使っていたときの話。 R の場合、参照グループは一番最初に分類されているグループと決められています。 例えば、 Group = factor(NA, levels = c("LBD-LATE( […] 続きを読む
【Rトラブルシュート】invalid factor level, NA generated 更新日:2021年11月14日 公開日:2021年11月10日 R あるデータフレームに論理型(factor)の列を追加しようとして、下記のように作成した。 Data <- %>% mutate(Group = factor(NA, levels = c("LBD-L […] 続きを読む
【Rトラブルシュート】number of items to replace is not a multiple of replacement length 更新日:2021年11月14日 公開日:2021年11月6日 R ある病理のスコアで、Brainstem (BS) が NA の項目があったので、 "Midbrain(MB) と Pons(Pons) と Medulla (Med) のどこかで 1 以上のスコアがあったら、BS = 1 […] 続きを読む
【Rデータ整理】データフレームに文字列を追加する 更新日:2022年5月13日 公開日:2021年10月29日 R データフレームに列を追加する時の方法2つ。 dplyr::mutate() 普段は dplyr パッケージの dplyr::mutate() を使っている。 文字列は " " で括って追加する。 mutate(列名 = […] 続きを読む
【Rトラブルシュート】longer object length is not a multiple of shorter object length 更新日:2021年11月14日 公開日:2021年10月21日 R "longer object length is not a multiple of shorter object length" のエラーメッセージが出たら、 それは、指示したベクター同士の長さがあっていないという事。 […] 続きを読む
【Rデータ整理】文字列の中に数式を入れたい場合 更新日:2023年4月2日 公開日:2021年10月17日 R 例えば作表の際、列名に「(N = 数字)」という情報をいれたくて、数値は計算式で出したい場合、 stringr::str_c() 文字列操作は Hadley氏作製の stringr パッケージで完結できる。 string […] 続きを読む
【Rデータ整理】NAを無視して計算する:na.rm = TRUE 更新日:2022年5月13日 公開日:2021年10月13日 R Rにはベクトル専用の関数が多く用意されている。 例えば、 sum() :合計を求める mean() :平均値を求める median() :中央値を求める etc. この時注意したいのが、データフレーム内に「 […] 続きを読む
【Rトラブルシュート】Run All Chunks Above が使えなくなった件 更新日:2021年11月14日 公開日:2021年10月9日 R ある日、今までサクサク動いていた "Run All Chunks Above" ボタンが、全く反応しなくなりました。 Ctrl+Alt+Shift+P を押してもダメだし、 右上の、"Run" タブから "Run All […] 続きを読む
【Rデータ整理】2つの要素をまとめて、新しい列に追加する 更新日:2021年11月14日 公開日:2021年10月5日 R 例えば、あるデータ(Data)内に Alzheimer's disease neuropathologi change (ADNC) の項目があり、 そのデータフレームに ADNC="Not" と ADNC="Low" […] 続きを読む
【Rデータ整理】小数点以下を0.00とかに揃えたい場合 更新日:2021年11月14日 公開日:2021年10月3日 R R で小数点第○○位まで出したい、というときは、Excel でもおなじみの Round 関数が使える。 round(データ, 桁数) round(0.12345, 3) output 0.123 ただこれだと、小数点以下 […] 続きを読む
【Rトラブルシュート】Error in match.names(clabs, names(xi)) : names do not match previous names 更新日:2021年11月14日 公開日:2021年9月29日 R R Markdown で Knit しようとしたら、下記 warning が出て止まった。 Error in match.names(clabs, names(xi)) : names do not match prev […] 続きを読む
【Rデータ整理】スコア “1+, 2+…” を数値 “1, 2…” に変換し、データ型を数値型に変更 更新日:2022年5月12日 公開日:2021年9月25日 R 相変わらず R でデータ整理中。 今回は、データベースに記載されている 1+, 2+ などのスコアを数値 1, 2... に変換し、データ型を数値型に変更する方法。 データベースから落としてきたときは、下記のようになって […] 続きを読む
【Rベーシック】パイプ演算子 更新日:2024年9月21日 公開日:2021年9月21日 R 便利なパイプ演算子……の覚書。 パイプ演算子とは パイプ演算子は、dplyrで提供されている演算子で、%>%の左にあるデータを右の関数の第一引数に渡す役割を担う。 事前準備 pipe演算子%>%は、「dply […] 続きを読む
【Rで作図】EPSファイルやsvgファイルで出力 更新日:2022年8月31日 公開日:2021年9月21日 R R は色々なグラフィックスが作れて嬉しくなる。 作成した図表をそのまま R Markdown で出力できるのも魅力の一つだが、場合によっては、別のソフトで編集したいときも。 私の場合、Figures 等を作 […] 続きを読む
【Rで作表】tableoneで全てのカテゴリを表示する方法 更新日:2021年11月14日 公開日:2021年9月17日 R 医学臨床系論文の Table 1. は、たいてい "Patient Demographics"… その "Table 1" を作るために非常に便利な R パッケージ: tableone。 基本的な使い方は、 […] 続きを読む
【Rデータ整理】列名とデータ型の変換 更新日:2023年3月30日 公開日:2021年9月13日 R R にデータを取り込んで、そこから最初に行う作業の備忘録。 データのインポート 私は、データベースからエクセル (.xlsx) でデータを取得し、それを R に取り込む場合が多い。 エクセルの取り込みは、 readxl: […] 続きを読む
【Rデータ整理】データフレームの結合 : JOIN 関数 更新日:2023年4月2日 公開日:2021年9月9日 R 最近リバイスが返ってきて、データ整理に追われ中…… n数を増やす目的等で他から持ってきたデータを結合させた時の備忘録。 dplyr::join dplyr パッケージの join 関数を使う。 join 関数は4種類。 […] 続きを読む
【Rトラブルシュート】”R code execution error” 更新日:2021年11月14日 公開日:2021年9月5日 R ある時、R でコードを打つ度に、"R code execution error" という warning sign に遭遇するようになりました。 普通に仕事は進められるけど、警告の度に作業がストップされるので、ちょっと […] 続きを読む
【Rデータ整理】データフレームの行名と列名を変更 更新日:2022年4月26日 公開日:2021年9月1日 R 下記のようなデータフレームがあり、この表の行名(左側の列)と列名(一番上のヘッダー行)とを変更したい場合。 Estimate Std. Error Pr(>|z|) OR CI_low CI_high (Inter […] 続きを読む
【Rトラブルシュート】unused argument 更新日:2021年11月14日 公開日:2021年8月28日 R この間まで普通に動いていた下記コードが、突然エラー表示に。 Data_D <- readxl::read_xlsx("sample", guess_max=40000, range="A1:AK755") %> […] 続きを読む
【Rで統計】Rank 関数を使って非正規分布のデータを解析する 更新日:2022年9月8日 公開日:2021年8月5日 R 先日、共著者から送られたデータの中に、下記のようなコードがありました。 model <- lm(rank(Data$MMSETotal, ties.method = "average", na.last = "ke […] 続きを読む
【Rデータ整理】Factor 内の順序を入れ替える 更新日:2021年11月14日 公開日:2021年8月1日 R 例えば下記のように、 症例の年齢 Alzheimer's Disease Neuropathologic Change (ADNC) で10症例のデータフレームを作った場合。 Age <- c(65, 72, 82 […] 続きを読む
【Rトラブルシュート】glm 関数でのエラー:Error in glm.fit(x = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, : NA/NaN/Inf in ‘y’ 更新日:2021年11月14日 公開日:2021年7月28日 R 先日、多重ロジスティック回帰分析を行っていて、下記の様に入力していたら、 model <- glm(LATE ~ Age + Sex + DLBType + ADNC, data = Data_L) 下記のエラーが […] 続きを読む
【Rベーシック】NA とは何か? 更新日:2022年5月13日 公開日:2021年7月24日 R 「NA」とは、「Not Available」の略。 欠損値の場合もあるし、「認識できない」ときにも表示される。 TRUE #1 で表される FALSE #0 で表される NA という感じで、TRUE でも FAL […] 続きを読む
【Rで統計】共分散分析:ANCOVA 更新日:2022年5月21日 公開日:2021年7月20日 R 共分散分析 (analysis of covariance, ANCOVA) は、 従属変数が「連続型」の場合、1つ以上の独立変数がその連続型の共変量に影響を及ぼしているかどうか調べる時に使う。 「共変量を用いる」という […] 続きを読む
【Rで統計】順序ロジスティック回帰分析 更新日:2021年11月14日 公開日:2021年7月16日 R 回帰分析をする際、 目的変数が Yes or No などの2つだと、通常のロジスティック回帰を行うが、 これが、例えば Not, Low, Intermediate, or High のように、 3つ以上の場合は、順序ロ […] 続きを読む
【Rデータ整理】文字列の置換 更新日:2022年5月12日 公開日:2021年7月12日 R とある csv データを取り込み…… Data1 <- read.csv("Dataset.csv") 「str()」で確認すると、 数値になっていてほしいところが、文字列で認識されている。 これはなんでかというと […] 続きを読む
【Rデータ整理】factor と numeric の変換 更新日:2022年4月16日 公開日:2021年7月8日 R これからデータ整理の色々と書き留めていく予定。 まず、とあるcsv データを取り込み。 取り込みの方法は下記 ▼ Data1 <- read.csv("Dataset.csv") 「str()」で確認すると、 fa […] 続きを読む
【Rベーシック】データの取り込み 更新日:2024年9月21日 公開日:2021年6月30日 R エクセルのデータ etc. を R にインポートする方法。 csv ファイル etc. の取り込み エクセルデータは基本 csv ファイルで保存し、R に取り込む。 CSV ファイル CSV ファイルは、「comma S […] 続きを読む
Visual Studio Code で R の実行環境を整える 更新日:2023年4月24日 公開日:2021年6月26日 Visual Studio CodeR RStudio は、R の IDE として大変使いやすいけれど、マルチカーソルがちょっと使いづらい…… とゆーことで、VSCode で R を動かせるように設定した時の備忘録。 必要なインストール類は下記。 <必須> R […] 続きを読む
【R Markdown】レンダリングできないとき(openBinaryFile: invalid argument) 更新日:2022年4月23日 公開日:2021年6月22日 R 先日、R Markdown を knit しようとしたら、下記メッセージがでてレンダリングできなかった。 pandoc.exe openbinaryfile invalid argument (invalid argum […] 続きを読む
【Rで統計】正規分布の検定(シャピロ・ウィルク検定) 更新日:2023年3月31日 公開日:2021年6月18日 R Demographics を Table で出す時、 正規分布していたら 平均値と標準偏差(standard devision, SD) 正規分布していなかったら 中央値と四分位範囲(inter quartile ran […] 続きを読む
【RStudio】パッケージを読み込めないとき 更新日:2022年5月13日 公開日:2021年6月14日 R 先日、今まで普通につかえていた R Markdown ドキュメントを開いて Knit しようとしたら、途中でエラー表示がでました。 内容は、「tidyverseがインストールされていない」というもの。 Error in […] 続きを読む