データをグラフにするとき、
「これのデータは バイオリン プロット で表すのが最適。」
と思う時があります。
今回は、それを R で作るときの備忘録。
ggplot2 のインストール
ggplot2 は、“The Grammer of Graphics” という体系に基づいて設計されたパッケージ。
Hadley Wickham氏が作成。
グラフ = 座標 (ggplot) + グラフの種類 (geom_**) + グラフの修飾
インストールは、コンソールに下記をタイプすればOK。
> install.packages("ggplot2")
インストールがうまくいかないときは、下記が参考になるかも。
Rの環境を変えて、パッケージを再インストールしようとしたら、下記エラーが表示された。 「代わりに新しいライブラリを構築しますか?」 的な事を効かれたので、「YES」としたのに、また下記メッセージ。 「結局ダメってことじゃ …
インストール後、ggplot2のライブラリを読み込む。
> library(ggplot2)
グラフ用のデータを作成
1. エクセルでデータを作成。
今回のエレメントは、"FN", "Dx", "Region" の3要素)。
2. 保存形式を .csv にして、R の directoryがある場所に保存する(私の場合は、Dドライブ > R > directory)。
3. 作業ディレクトリの場所は、
> getwd()
で確認できる。
データを取り込む
1. コンソールに下記入力してデータを取り込む。
> data=read.csv("ファイル名.csv", header=TRUE)
1行目はヘッダー。
※ エクセル上のある部分だけコピーして取り込む方法も便利。
方法:
1. エクセル上の解析したい部分を選択してコピー。
2. Rのコンソールに下記入力で取り込み。
> data=read.table("clipboard", header=TRUE)
2. ちゃんと取り込めているか、最初の6行を確認する。
> head(data)
3. dimension と structureも確認(ちゃんと3要素になっているかとか)。
> dim(data)
> str(data)
バイオリンプロット作成
2.基本コードを入力
> p<-ggplot(data,aes(x=Region,y=FN))+geom_violin()
x軸の順番を変更
上記だと、x軸の順番が昇順になっているので、これを任意の順番に変更。
> p<-p+scale_x_discrete(limit=c('LBD-LATE','AD-LATE'))
> p
平均化の度合いを大きく
4. 凹凸をもうちょっと滑らかにしたい場合。
> p+geom_violin(adjust=2)
各バーの横幅を調節
> p+geom_violin(width=1.5)
横幅と滑らかさを同時に調節する場合は "," でつなぐ。
> p+geom_violin(width=5, adjust=5)
背景を変更
背景をなしにしたい場合は、
> p<-p + theme_classic()
ドットプロットの重ね合わせ
それぞれの値をドットで重ねたいときは、
> p<-p + geom_jitter(shape=16, position=position_jitter(0.02))
jitter(0.02)の部分に任意の数字を入れて、ばらつきの度合いを変更する。
Shapeは16種類。
ggpubr::show_point_shapes()
で確認できる。
各バーの色を変更
それぞれ指定したい場合
p+scale_fill_manual(values=c("#999999", "#E69F00"))
カラーコードは下記参照
パステルカラーのカラーコードが一目でわかるWEB色見本
パッケージを利用する場合
カラーパッケージのインストール
install.packages("RColorBrewer")
ディスプレイで見てみる
library("RColorBrewer")
display.brewer.all()
References
Statistical tools for data analysis and visualization
Statistical tools for data analysis and visualization
Statistical tools for data analysis and visualization