【Rデータ整理】ちょっとした集計:dplyr::summarise 更新日:2022年5月22日 公開日:2022年1月11日 R データフレーム内の合計や平均値などを求める時、Rでは「aggregate関数」が用意されているけど、比較的作業時間がかかるため、「dplyr::summarise」の方が良さげ。 ちょっとした集計:dplyr::summ […] 続きを読む
【Rデータ整理】文字を切り出して新しい列に追加する:mutate/substr/str_sub 更新日:2024年10月19日 公開日:2022年1月7日 R 文字列から一部だけ切り出して、新しい列を作りたい時。 列の追加は dplyrパッケージ: mutate 文字の切り出しは R標準パッケージ: substr or substring stringrパッケージ: st […] 続きを読む
【RStudio】environment 内のオブジェクトを一掃する 更新日:2024年10月20日 公開日:2021年12月20日 R RStudioでは、実行したオブジェクト(ベクトル、リスト、データフレームなど)はそのまま "environment" の中に残り、再利用することができる。 Emvironment に残っているオブジェクトの確認方法 こ […] 続きを読む
【Rで統計】Kruskal.Wallis検定 公開日:2021年12月12日 R 前回、ノンパラメトリックの2群検定の方法を書き留めておいたけど、 「よく考えたら、2群じゃなくて、2群x3群の6群でみなきゃじゃん。」 とゆーことに気づき、 多重比較のデータを追加した。 各グループが正規分布じゃないこと […] 続きを読む
【Rで統計】Wilcoxonの順位和検定 更新日:2021年12月9日 公開日:2021年12月8日 R あるデータのリバイスで、患者さんが最後に認知機能検査を受けた時期から亡くなるまでの期間が解析グループで差があるんじゃないか、とレビューアーから指摘された。 なので、その期間が各群で差がないことを示す検定結果をつける事に。 […] 続きを読む
【Rで作図】ヒストグラム 公開日:2021年12月4日 R あるデータのリバイスで、患者さんが最後に認知機能検査を受けた時期から亡くなるまでの期間が解析グループで差があるんじゃないか、とレビューアーから指摘された。 なので、その期間が各群で差がないことを示す検定結果をつける事に。 […] 続きを読む
【Rデータ整理】列の追加:mutate 更新日:2024年10月19日 公開日:2021年11月26日 R Rで列を追加する時は、 dplyr::mutate() を使っている。 mutate(列A+列B) のように計算式の結果を入れられるので便利だけど、文字列を入れる時はこんな感じ ▼ 例:Data というデータフレーム内で […] 続きを読む
【RStudio】任意の単語etc.を全選択(VSCodeの Ctrl+L, Ctrl+D の代わりになるショートカットキーは?) 更新日:2023年4月24日 公開日:2021年11月22日 R R Studio を使っていてちょっと不便だなと思ったのが、VS Code で多用している Ctrl + Shift + L (カーソル上と同じ単語etc. を全選択) Ctrl + Shift + D (カーソル上と同 […] 続きを読む
【Rで作図】facet毎に色を変える 公開日:2021年11月18日 R 認知機能の変化を、LBD, AD, LBD+AD グループ毎に、LATE(+)とLATE(-)で分けて示したいと思い、下記のようにグラフを作製。 ```{r fig.width=6} filter(Data, compl […] 続きを読む
【Rで統計】回帰分析で参照グループを指定する 公開日:2021年11月14日 R あるデータで線形混合モデルを使っていたときの話。 R の場合、参照グループは一番最初に分類されているグループと決められています。 例えば、 Group = factor(NA, levels = c("LBD-LATE( […] 続きを読む
【Rトラブルシュート】invalid factor level, NA generated 更新日:2021年11月14日 公開日:2021年11月10日 R あるデータフレームに論理型(factor)の列を追加しようとして、下記のように作成した。 Data <- %>% mutate(Group = factor(NA, levels = c("LBD-L […] 続きを読む
【Rトラブルシュート】number of items to replace is not a multiple of replacement length 更新日:2021年11月14日 公開日:2021年11月6日 R ある病理のスコアで、Brainstem (BS) が NA の項目があったので、 "Midbrain(MB) と Pons(Pons) と Medulla (Med) のどこかで 1 以上のスコアがあったら、BS = 1 […] 続きを読む
【Rデータ整理】文字列の追加:mutate/transform 更新日:2024年10月19日 公開日:2021年10月29日 R データフレームに列を追加する時の方法2つ。 dplyr::mutate() 普段は dplyr パッケージの dplyr::mutate() を使っている。 文字列は " " で括って追加する。 mutate(列名 = […] 続きを読む
【Rデータ整理】文字列の結合:str_c/paste/paste0 更新日:2024年12月15日 公開日:2021年10月27日 R 文字列を繋げるときには、paste(), paste0(), str_c()などを使う。 paste()とpaste0()は、Rの標準パッケージ(base)。 str_c()は、stringrパッケージの関数。 str_ […] 続きを読む
【Rトラブルシュート】longer object length is not a multiple of shorter object length 更新日:2021年11月14日 公開日:2021年10月21日 R "longer object length is not a multiple of shorter object length" のエラーメッセージが出たら、 それは、指示したベクター同士の長さがあっていないという事。 […] 続きを読む
【Rデータ整理】文字列の中に数式を入れたい場合:str_c/paste 更新日:2024年12月15日 公開日:2021年10月17日 R 例えば作表の際、列名に「(N = 数字)」という情報をいれたくて、数値は計算式で出したい場合、 stringr::str_c() 文字列操作は Hadley氏作製の stringr パッケージで完結できる。 string […] 続きを読む
【Rデータ整理】NAを無視して計算する:na.rm = TRUE 更新日:2022年5月13日 公開日:2021年10月13日 R Rにはベクトル専用の関数が多く用意されている。 例えば、 sum() :合計を求める mean() :平均値を求める median() :中央値を求める etc. この時注意したいのが、データフレーム内に「 […] 続きを読む
【R Markdownトラブルシュート】Run All Chunks Above が使えなくなった件 更新日:2024年12月13日 公開日:2021年10月9日 R ある日、今までサクサク動いていた "Run All Chunks Above" ボタンが、全く反応しなくなりました。 Ctrl+Alt+Shift+P を押してもダメだし、 右上の、"Run" タブから "Run All […] 続きを読む
【Rデータ整理】2つの要素をまとめて、新しい列に追加する:fct_collapse 更新日:2024年10月19日 公開日:2021年10月5日 R 例えば、あるデータ(Data)内に Alzheimer's disease neuropathologi change (ADNC) の項目があり、 そのデータフレームに ADNC="Not" と ADNC="Low" […] 続きを読む
【Rデータ整理】小数点以下を0.00とかに揃えたい場合 更新日:2021年11月14日 公開日:2021年10月3日 R R で小数点第○○位まで出したい、というときは、Excel でもおなじみの Round 関数が使える。 round(データ, 桁数) round(0.12345, 3) output 0.123 ただこれだと、小数点以下 […] 続きを読む
【RMarkdownトラブルシュート】Error in match.names(clabs, names(xi)) : names do not match previous names 更新日:2024年12月13日 公開日:2021年9月29日 R R Markdown で Knit しようとしたら、下記 warning が出て止まった。 Error in match.names(clabs, names(xi)) : names do not match prev […] 続きを読む
【Rデータ整理】スコア “1+, 2+…” を数値 “1, 2…” に変換し、データ型を数値型に変更 更新日:2022年5月12日 公開日:2021年9月25日 R 相変わらず R でデータ整理中。 今回は、データベースに記載されている 1+, 2+ などのスコアを数値 1, 2... に変換し、データ型を数値型に変更する方法。 データベースから落としてきたときは、下記のようになって […] 続きを読む
【Rベーシック】パイプ演算子:%>% 更新日:2024年10月26日 公開日:2021年9月21日 R 便利なパイプ演算子 %>% ……の覚書。 パイプ演算子とは パイプ演算子は、左辺のオブジェクトを右辺の関数に入れる機能を持つ演算子。 %>% %>%はtidyverseに含まれているパイプ演算子。%&g […] 続きを読む
【Rで作図】EPSファイルやsvgファイルで出力 更新日:2022年8月31日 公開日:2021年9月21日 R R は色々なグラフィックスが作れて嬉しくなる。 作成した図表をそのまま R Markdown で出力できるのも魅力の一つだが、場合によっては、別のソフトで編集したいときも。 私の場合、Figures 等を作 […] 続きを読む
【Rで作表】tableoneで全てのカテゴリを表示する方法 更新日:2021年11月14日 公開日:2021年9月17日 R 医学臨床系論文の Table 1. は、たいてい "Patient Demographics"… その "Table 1" を作るために非常に便利な R パッケージ: tableone。 基本的な使い方は、 […] 続きを読む
【Rデータ整理】列名とデータ型の変換 更新日:2023年3月30日 公開日:2021年9月13日 R R にデータを取り込んで、そこから最初に行う作業の備忘録。 データのインポート 私は、データベースからエクセル (.xlsx) でデータを取得し、それを R に取り込む場合が多い。 エクセルの取り込みは、 readxl: […] 続きを読む
【Rデータ整理】データフレームの結合 : join 更新日:2024年10月19日 公開日:2021年9月9日 R 最近リバイスが返ってきて、データ整理に追われ中…… n数を増やす目的等で他から持ってきたデータを結合させた時の備忘録。 dplyr::join dplyr パッケージの join 関数を使う。 join 関数は4種類。 […] 続きを読む
【Rトラブルシュート】”R code execution error” 更新日:2021年11月14日 公開日:2021年9月5日 R ある時、R でコードを打つ度に、"R code execution error" という warning sign に遭遇するようになりました。 普通に仕事は進められるけど、警告の度に作業がストップされるので、ちょっと […] 続きを読む
【Rデータ整理】データフレームの行名と列名を変更:rownames/rename/colnames 更新日:2024年10月19日 公開日:2021年9月1日 R 下記のようなデータフレームがあり、この表の行名(左側の列)と列名(一番上のヘッダー行)とを変更したい場合。 Estimate Std. Error Pr(>|z|) OR CI_low CI_high (Inter […] 続きを読む
【Rトラブルシュート】unused argument 更新日:2021年11月14日 公開日:2021年8月28日 R この間まで普通に動いていた下記コードが、突然エラー表示に。 Data_D <- readxl::read_xlsx("sample", guess_max=40000, range="A1:AK755") %> […] 続きを読む
【Rで統計】Rank 関数を使って非正規分布のデータを解析する 更新日:2022年9月8日 公開日:2021年8月5日 R 先日、共著者から送られたデータの中に、下記のようなコードがありました。 model <- lm(rank(Data$MMSETotal, ties.method = "average", na.last = "ke […] 続きを読む
【Rデータ整理】Factor 内の順序を入れ替える 更新日:2021年11月14日 公開日:2021年8月1日 R 例えば下記のように、 症例の年齢 Alzheimer's Disease Neuropathologic Change (ADNC) で10症例のデータフレームを作った場合。 Age <- c(65, 72, 82 […] 続きを読む
【Rトラブルシュート】glm 関数でのエラー:Error in glm.fit(x = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, : NA/NaN/Inf in ‘y’ 更新日:2021年11月14日 公開日:2021年7月28日 R 先日、多重ロジスティック回帰分析を行っていて、下記の様に入力していたら、 model <- glm(LATE ~ Age + Sex + DLBType + ADNC, data = Data_L) 下記のエラーが […] 続きを読む
【Rベーシック】NA とは何か? 更新日:2022年5月13日 公開日:2021年7月24日 R 「NA」とは、「Not Available」の略。 欠損値の場合もあるし、「認識できない」ときにも表示される。 TRUE #1 で表される FALSE #0 で表される NA という感じで、TRUE でも FAL […] 続きを読む
【Rで統計】共分散分析:ANCOVA 更新日:2022年5月21日 公開日:2021年7月20日 R 共分散分析 (analysis of covariance, ANCOVA) は、 従属変数が「連続型」の場合、1つ以上の独立変数がその連続型の共変量に影響を及ぼしているかどうか調べる時に使う。 「共変量を用いる」という […] 続きを読む
【Rで統計】順序ロジスティック回帰分析 更新日:2021年11月14日 公開日:2021年7月16日 R 回帰分析をする際、 目的変数が Yes or No などの2つだと、通常のロジスティック回帰を行うが、 これが、例えば Not, Low, Intermediate, or High のように、 3つ以上の場合は、順序ロ […] 続きを読む