R logo

データフレーム (data frame) の作り方色々。

データフレーム (Data Frame) とは

data frame は list の2次元バージョン。

データサイエンスで最も多く使用される。

data frame にはここのベクトルをまとめて2次元の表にする。

ここの vector は表の中の "列" になる。

それぞれの列は異なる型のデータを格納できるが、同じ列内は vector の性質を受け継ぐので、全てのセルが同じデータ型となる。

Data Frame

Data Frame を作る

data frameにはいくつかの作り方がある。

Vector をつなげて作る

data frame は

data.frame()

で作る。

まずいくつか vector を作っておいて、それをつなげる方法。

Apple <- c(1,2,3)
Banana <- c(4,5,6)

df <- data.frame(Apple,Banana)
df

dataframe-1

行名は

rownames()

で追加する。

Apple <- c(1,2,3)
Banana <- c(4,5,6)
df <- data.frame(Apple,Banana)
rownames(df) <- c("alpha","beta","gamma")
df
blacket-dataframe-2

直接作る

vector を作らなくても、直接

data.frame()

で作れる。

df <- data.frame(
  Apple=c(1,2,3),
  Banana=c(4,5,6)
  )
df

dataframe-1

行名は同じく

rownames()

で追加する。

df <- data.frame(
  Apple=c(1,2,3),
  Banana=c(4,5,6)
  )
df <- data.frame(Apple,Banana)
df
blacket-dataframe-2

Matrix から変換する

まず matrix を作る。

m <- matrix(1:6, ncol=2)
m
output
        [,1] [,2]
[1,]        1   4
[2,]        2   5
[3,]        3   6

作成した matrix に行名と列名をつける。

m <- matrix(1:6, ncol=2)
colnames(m) <- c("Apple", "Banana")
rownames(m) <- c("alpha", "beta", "gamma")
m
output
        Apple Banana
alpha        1    4
beta         2    5
gamma        3    6

で、このmatrix(m)をDataFrame(df)に変換。

df <- as.data.frame(m)
df

blacket-dataframe-1

 

本当にDataFrameになったかどうかは、

is.data.frame()

で確認できる。

is.data.frame(df)
output
[1] TRUE
is.matrix(df)
output
[1] FALSE

テーブル (.csv, .xslx etc.) から取り込む

上記、色々説明したけど、実際には、大量のデータを扱う事になるので、エクセルシートなどのデータを取り込む方法が一般的。

方法は下記参照。

Data Frame の各要素にアクセスする方法

下記参照。

References

にほんブログ村 子育てブログ ワーキングマザー育児へ