【Rデータ整理】列の抽出/削除/並び替え:select 更新日:2024年10月20日 公開日:2022年10月20日 R 例えば下記データ(Data_c)がある。 X ID Cohort Sex Age ADNC 1 1 232493 LBD Male 83 Low 2 2 326342 AD Male 78 High 3 3 326322 […] 続きを読む
【Rデータ整理】データの中身(構造)を確認する:str 更新日:2024年10月20日 公開日:2022年10月20日 R データをインポートしたらまず始めにする作業。 今回は、同じ階層にある"my_Data"というエクセルファイルをインポート library(readxl) Data_C <- readxl::read_xlsx(". […] 続きを読む
【Rデータ整理】1行目を列名に指定する:colnames 更新日:2024年10月19日 公開日:2022年10月12日 R 下記のようなデータが得られて、 1行目の値を列名に宛てがいたい場合。 colnames() で列名を1行目に指定した後、1行目を削除する。 colnames(df7) <- df7[1,] df7 <- df […] 続きを読む
【Rデータ整理】行の並び替え:arrange/order/sort 更新日:2024年11月20日 公開日:2022年10月7日 R 下記のようなデータフレーム(df)があり、行を昇順or降順で並べ替えたい時。 私が使いやすいと思う順で arrange() , order , sort() の使い方を書き留めておく。 dplyr::arrange() […] 続きを読む
【Rデータ整理】データフレームの行と列を入れ替える:t/as.data.frame 更新日:2024年10月19日 公開日:2022年10月4日 R 下記のようなデータがあって、行と列を入れ替えたい場合。 t(データ) でOK。 df6 <- t(df5) ただこれだと行列で返ってくるので、 > class(df6) [1] "matrix" "array […] 続きを読む
【Rデータ整理】重複する列を削除:distinct 更新日:2024年10月19日 公開日:2022年9月30日 R 下記のようなデータがあって、 "Deceased" が "True" と "False" と入力されている症例がそれぞれどれくらいずつあるか count(group_by()) で求めると、 Dat1 <- rea […] 続きを読む
【Rデータ整理】特定の条件を満たす行数をカウント 更新日:2023年5月11日 公開日:2022年9月26日 R 例えば、下記のようなデータがあって、 "Deceased" が "True" と "False" と入力されている症例がそれぞれどれくらいずつあるか知りたい時。 count(group_by()) で求める。 Dat1 […] 続きを読む
【Rで作図】グラフの背景を変更する 更新日:2024年9月22日 公開日:2022年9月22日 R 下のようなグラフがあって、この背景を変更したいとき。 themeで変更する。 グラフの背景の変更 白 theme_classic() グレー+格子(白) theme_gray() 白+格子(グレー) theme_bw() […] 続きを読む
【Rで作図】レジェンドのタイトルを消す 更新日:2024年9月21日 公開日:2022年9月21日 R ggplot2でグラフを作っていて、「レジェンドは要るけど、レジェンドタイトルは消したいな」と思って消した時の備忘録。 使う関数は「theme」のlegend.title = element_blank。 theme(l […] 続きを読む
【Rで作図】facet のタイトルのフォントサイズを変更 更新日:2023年5月11日 公開日:2022年9月10日 R グラフを作っていて、「Facetのタイトルのフォントサイズを変更したい」と思って消した時の備忘録。 themeに"strip.text = element_text(size = ○○)"でサイズを指定すればOK。 th […] 続きを読む
【Rで作図】レジェンドを消す 更新日:2023年5月11日 公開日:2022年9月2日 R グラフを作っていて、「レジェンド要らないな」と思って消した時の備忘録。 方法はいくつかあるけど、使い勝手が良かったのは、themeに "legend.position = "none"を追加する方法。 theme(leg […] 続きを読む
【Rトラブルシュート】csvで書き出すとき遭遇したトラブル 更新日:2023年5月11日 公開日:2022年7月28日 R あるコードをcsvで書き出し、 # CSV で書き出し write.csv(Data, "file_name.csv", row.names = FALSE) それを別アプリで開こうとすると、下記エラーメッセージが出現し […] 続きを読む
【Rトラブルシュート】the condition has length > 1 and only the first element will be used 更新日:2023年5月11日 公開日:2022年7月24日 R R で if 構文を使うときに時々遭遇する下記エラーメッセージ。 the condition has length > 1 and only the first element will be used 例えば、下 […] 続きを読む
【Rで統計】カイ二乗検定 更新日:2023年5月11日 公開日:2022年7月16日 R カイ二乗検定とは カイχ二乗検定というと、一般にピアソンのカイ二乗検定を指す事が多い。 仮説によって、適合度検定や独立性の検定などがある。 基本はt検定と似ているけれど、t検定が「2つの群の連続変数(numerical […] 続きを読む
【Rトラブルシュート】openBinaryFile: permission denied (Permission denied) 更新日:2023年5月11日 公開日:2022年7月12日 R 前回、"openBinaryFile: invalid argument" の問題は絶対パスを指定することで解消したけど、 次に出てきたエラーメッセージは、 openBinaryFile: permission deni […] 続きを読む
【RStudio】基本言語を変更 更新日:2024年11月17日 公開日:2022年7月8日 R この間、R と RStudio でバグが起こって全インストールし直したら、エラーメッセージが日本語に変わっていた。 どうやら、再インストールする時に疲れていて言語選択をスキップしてたみたい……。 別に日本語 […] 続きを読む
【トラブルシュート】package or namespace load failed for ‘tidyverse’ in loadNamespace と Error in app$vspace(new_style$`margin-top` %||% 0) : attempt to apply non-function 更新日:2023年5月11日 公開日:2022年7月6日 R ある日、Rを使っていて、突然 "tidyverse" が使えなくなった。 Error: package or namespace load failed for ‘tidyverse’ in loadNamespace […] 続きを読む
【Rデータ整理】クロス集計表 更新日:2023年5月11日 公開日:2022年7月4日 R カテゴリデータの集計表⇔データフレームの切り替え。 クロス集計表 例えば、 運動あり 運動なし 認知症あり 10 15 認知症なし 20 5 のようなデータの集計表を作る時。 基本は行列で作る。 行列(matrix)で作 […] 続きを読む
【Rトラブルシュート】 attempt to set ‘colnames’ on an object with less than two dimensions 更新日:2023年5月11日 公開日:2022年6月30日 R 列名を変更しようとして colnames() を使った時に下記エラーメッセージ。 attempt to set 'colnames' on an object with less than two dimensions […] 続きを読む
【RStudio】RStudio Cloud を使う 更新日:2023年5月13日 公開日:2022年6月26日 R 私は、自宅PCと職場PCの2箇所でRStudioを利用していますが、時々データをクラウドに上げ忘れたりして困る事があります。 リモート接続で自宅PC⇔職場PCに入り、リモートでデータをクラウドに上げる、という方法で対処し […] 続きを読む
【Rトラブルシュート】Error in seq_len(n) : argument must be coercible to non-negative integer 更新日:2023年5月11日 公開日:2022年6月22日 R 今までサクサク動いていたコードで、カラーコードだけ変更したつもりでRUNしたら、最後にグラフを ggsave で保存する時に下記メッセージ↓。 Error in seq_len(n) : argument must be […] 続きを読む
【Rデータ整理】tidy data に変換する 更新日:2023年5月11日 公開日:2022年6月18日 R ↑ これは見やすいけど、Rで計算する場合は tidy data じゃないのでちょっと困る。 これを、Rに取り込んで、tidy data に変換する方法。 tidy data と messy data については、多くのサ […] 続きを読む
【R Markdown】エラーが起こっても中止しない方法 更新日:2023年5月11日 公開日:2022年6月14日 R 通常、エラーが起こったらRは処理を停止するけれど、人へのチュートリアルなどの時は、エラーを見せたい時もある。 そんな時は、 error = TRUE をチャンクオプションに加える。(通常は FALSE になっている。) […] 続きを読む
【Rトラブルシュート】’list’ object cannot be coerced to type ‘double’ 更新日:2023年5月11日 公開日:2022年6月10日 R 3行目をcolnamesにする前に "for" を使って名前を順に変更していくことにした。 # 3行目のIDを変更 for(i in 3:6){ Dat1[3,i] <- paste("M_NFT_",c(i-2) […] 続きを読む
【Rで統計】二元配置分散分析:One-way factorial ANOVA 更新日:2023年5月11日 公開日:2022年6月6日 R 二元配置分散分析の求め方。 "二元" の "2" は、「目的変数に影響を与えるかもしれない因子型の説明変数が2つある」とゆーこと。 例えば下記の例。 基本事項は一元配置分散分析と同じだけれど、二元配置分散分 […] 続きを読む
【Rトラブルシュート】openBinaryFile: invalid argument (Invalid argument) 更新日:2023年5月11日 公開日:2022年6月2日 R RMarkdown を word で出力しようとした時に出たエラー。 openBinaryFile: invalid argument (Invalid argument) で、word styleの reference […] 続きを読む
【R Markdown】外部スクリプト等をチャンク内で読み込む 更新日:2023年5月11日 公開日:2022年5月29日 R RMarkdownは多機能だけど、内容が増えたら、コードを外部の.rmdファイルや、他の.rファイルなどに配置し、チャンクで読み込むようにした方がなにかと便利。 見た目が簡潔になるし、Rコードのデバック等も、Rスクリプト […] 続きを読む
【Rデータ整理】行方向の平均値を出して任意の列に適応 更新日:2023年5月11日 公開日:2022年5月25日 R 列A、列B、列C...の各行毎に平均値を出して、それぞれ新しい列に結果を追加する方法3つ。 個人の練習も兼ねて前後の工程も記載しているので、あしからず。 事前準備 データの取り込み 人からもらった、とあるデータを取り込む […] 続きを読む
【R Markdown】ビジュアルモードで記述 更新日:2023年5月11日 公開日:2022年5月21日 R RMarkdownで記述→knit→記述→knit...という作業を行っていくけれど、 ちょっとした所をプレビューで確認したいだけなら、毎回 knit しなくても、ビジュアルモードに切り替えるだけで事足りる場合も多い。 […] 続きを読む
【Rで統計】一元配置分散分析:One-way factorial ANOVA 更新日:2023年5月11日 公開日:2022年5月17日 R 統計について何もわからないまま研究を始めた頃、最初に覚えた合言葉:パラメトリックで2群比較はt検定、3群以上の比較は分散分析(Analysis of variance, ANOVA)。 ・ ・ ・ &nbs […] 続きを読む
【RMarkdown】word文書をMarkdown形式に変えてRに取り込む 更新日:2023年5月11日 公開日:2022年5月13日 R RMarkdown → Wordだったら、アウトプット形式をwordに変えてknitすれば良いけど、 今回は、 一度wordで出力して、色々編集した後にもう一度RMarkdownに取り込みたい 誰かが作ったword文書を […] 続きを読む
【RMarkdown】wordアウトプットのスタイルを変更 更新日:2023年5月11日 公開日:2022年5月9日 R 先日、htmlアウトプットのスタイル変更について書いたので、 今回はwordアウトプットのスタイル変更について。 htmlの場合はスタイルのcssファイルを作ってそれを参照するようにしたけど、 wordの場 […] 続きを読む
【RMarkdown】htmlアウトプットにカスタマイズのCSSスタイルを適応 更新日:2023年5月11日 公開日:2022年5月5日 R RMarkdownを英語だけで使っていた時は規定のスタイルで気にならなかったのだけれど、 先日、日本語を使ってみたら、英語と日本語のフォントで明らかな差があったり、大きさのバランスが悪くて気になったので、CSSをカスタマ […] 続きを読む
【Rデータ整理】欠損値(NA)の取り扱い⑤:他のデータ値から計算で求める 更新日:2023年5月11日 公開日:2022年5月3日 R 前回の続き。 下記データフレーム(Dat)で、"Expenses" の値を補完しようと思うけど、 17行目の "Expenses" は、両隣の "Revenue" と "Profit" から計算できる。 この場合は、 " […] 続きを読む
【Rデータ整理】欠損値(NA)の取り扱い④:群の中央値で補完する 更新日:2023年5月11日 公開日:2022年5月2日 R NAの取り扱いシリーズ第4段。 今回は、他のデータから推測して補完する方法。 よく使われるのは、中央値(median)で補完する方法。 場合によっては平均値(mean)でもいいけど、中央値の方が外れ値の影響 […] 続きを読む
【Rデータ整理】欠損値(NA)の取り扱い③:他のデータから予測し補完する 更新日:2023年5月11日 公開日:2022年5月1日 R NAの取り扱いシリーズ第3段。 今回は、他のデータから予測できる場合にその情報を使って補完する方法。 他のデータを使って補完 例えば下記のようなデータフレームがあった場合、 "State" が<NA& […] 続きを読む