20131012Fuji2

Rによる気象データ解析 2


読み込んだデーターを調べる

 前回は、エクセルに取りこんだデーターを「スペース区切り」で保存し、それをRに読み込んだ。今回はその続きを行う。Rで扱うデータは、データフレームという行と列を持つ形式のものであり、Rではこれをオブジェクトとして扱う。前回は、東京の8月の気温のデータをdataという名称のデータフレームに読み込んだが、今回はデータフレームにTokyo.Tempと名前を付けた。すなわち、次のようにread.tableコマンドを打ち込む。なお、データーパスは参考までに記述しているだけだが、Rではファイルのパスはダブルコーテーションで囲み、ディレクトリを\\で区切る。ファイルのパス名では、アルファベットの大文字と小文字は区別しなくてもエラーとならない。一方、データフレーム名は大文字小文字が区別されるため、以後
Tokyo.Tempと指定しなければならない。tokyo.tempTokyo.tempと指定すると「オブジェクトがありません」というエラーとなる。

Tokyo.Temp<-read.table("t:\\R\\Book1.prn", header=T)

 データが読み込まれたことを確認するには、データフレーム名を打ち込めばよい。今回の場合、

Tokyo.Temp

と打ち込むと8月1日から8月31日までのデータが変数名が頭について表示される。

 読み込みの際header=Tとしたので、変数名として「平均気温」、「最高気温」、「最低気温」が設定される。その変数名を確認するにはnamesというコマンドを用いる。すなわち

names(Tokyo.Temp)

と打ち込むと、
[1] "平均" "最高" "最低"

と打ち返される。

 一部のデータだけ表示したい場合は、行と列を指定すればよい。たとえば、8月15日の平均気温、最高気温と最低気温を確認したければ、

Tokyo.Temp[15,1:3]

と打ち込む。すると

  平均  最高 最低
15  30  34.9 26.5

と打ち返される。8月5日から10日までの最高気温を確認したいときは、< br>
Tokyo.Temp[5:10,2]

[1] 32.2 32.0 34.5 34.1 34.5 37.4

と打ち返される。[1]は、1番目の変数であることを示している。今回は最高気温だけを調べたので、[1]のみである。8月25日と26日の最高気温と最低気温を調べたければ、

Tokyo.Temp[25:26,2:3]

すると、以下のように打ち返される。

  最高 最低
25 28.5 23.1
26 29.6 23.5

 表示する行と列の指定法はエクセルと共通したところがあるからわかりやすいだろう。

 データの最小値、1/4値、平均値、中央値、3/4値、最大値を表示するにはsummaryというコマンドを用いる。すなわち、

summary(Tokyo.Temp)

と打ち込むと、

  平均        最高        最低
Min.  :25.40   Min.  :28.50   Min.  :20.30
1st Qu.:28.00  1st Qu. :32.05  1st Qu. :24.80
Median :29.60  Median :33.30  Median :26.20
Mean  :29.18  Mean  :33.24  Mean  :25.98
3rd Qu.:30.30  3rd Qu. :34.50  3rd Qu. :27.55
Max.  :33.20   Max.  :38.30   Max.  :30.40

と打ち返される。気温の統計では、小数点以下一桁だけ表示することになっているが、ここでは小数点以下二桁まで表示されている。東京の2013年8月の日々の平均気温の平均値は29.18℃ときわめて高かったことがわかる。日々の最低気温の平均値も25.98℃と25度を上回っていたことがわかる。最高気温の最大値は38.3℃ときわめて高いが、最高気温の最低値は28.50℃と、真夏日ではなかった日があることがわかる。

 今回は、エクセルのスペース区切り形式で保存したデーターをread.tableで読み込んで、データフレームを作成し、データフレーム全体の表示にはデータフレーム名を入力すること、変数名の表示にはnamesコマンドを用いること、データフレームの一部を、行と列を指定して表示する方法、データの概要を表示するsummaryコマンドについて学んだ。

(2013.10.30)
 



ホームに戻る << 1 2 3 4 5 6 7 8 9 10 11 12 13 14 >>