読み込むCSVファイルは2007年度のセリーグの打撃成績の順位です。
参考:2007年度 セントラル・リーグ 個人打撃成績(規定打席以上)
batting2007.csv
順位,打率,安打 1,0.346,193 2,0.343,204 3,0.318,172 4,0.313,177 5,0.31,175 6,0.308,155 7,0.302,122 8,0.302,118 9,0.3,120 10,0.3,139
プロンプト
> read.csv("batting2007.csv") 順位 打率 安打 1 1 0.346 193 2 2 0.343 204 3 3 0.318 172 4 4 0.313 177 5 5 0.310 175 6 6 0.308 155 7 7 0.302 122 8 8 0.302 118 9 9 0.300 120 10 10 0.300 139 > batting$安打 [1] 193 204 172 177 175 155 122 118 120 139
read.csv()メソッドでCSVファイルを読み込み、そのデータフレームをbatting変数に格納しています。
実行結果を見ると、ファイル1行目のフィールド(列)名が変数名を表し、2行目以降がテーブル本体を表していることが分かります。これによって、例えば安打の列を抽出したい場合は、batting$安打と指定すればOKです。
ただ、毎回々々「batting$安打」と指定するのは億劫ですので、以下のコマンドで簡略化します。
> attach(batting) > 安打 [1] 193 204 172 177 175 155 122 118 120 139 >
attach()関数によってワークスペースにオブジェクトが保存され、データフレーム内の変数名のみでのアクセスが可能になります。
read.csv()メソッドのheader引数にFALSEを指定した場合
read.csv()メソッドはデフォルトでheader引数にTRUEが指定されていますが、以下のようにFALSE(必ず大文字)を指定することも出来ます。その場合の動作は以下のようになります。
> batting <- read.csv("batting2007.csv", header=FALSE) > batting V1 V2 V3 1 順位 打率 安打 2 1 0.346 193 3 2 0.343 204 4 3 0.318 172 5 4 0.313 177 6 5 0.31 175 7 6 0.308 155 8 7 0.302 122 9 8 0.302 118 10 9 0.3 120 11 10 0.3 139 > batting$V3 [1] 安打 193 204 172 177 175 155 122 118 120 139 Levels: 118 120 122 139 155 172 175 177 193 204 安打 >
ファイル1行目の列名がテーブル本体のデータセットに組み込まれていることが分かります。この場合の列へのアクセスは上の実行結果から、batting$V3と分かります。フィールド(列)名(一行目)を省略したCSVファイルを読み込みたい場合にはこのオプション引数を指定します。
コメント
Rで統計: CSVファイルの読み込み – read.csv()メソッド http://www.yukun.info/blog/2008/09/r-read-csv-file.html
@oziiio Rはcsv読み込めるよ. http://bit.ly/edqKFT