Windowsへインストールしてみます。
Rのアーカイブサイトからダウンロードします。
特にダウンロードに関しては問題ないですが、
64bit版Windowsでは以下のように選択しておきます。
後は、ダウンロードを続行して終了後、インストール。
GIS教材ではiris(アヤメ)のデータはデフォルトで用意されていますが、ここでは外部ファイルとしてハンドリングします。
データはUC Irvine Machine Learning Repository から取得します。
取得したデータには列名がついていないので、ExcelやLibreOffice(Calc)などで読み込んで、カラム名を付けておきます。
Sepal.Length,Sepal.Width,Petal.Length,Petal.Width,Species
CSV形式で保存。
例:C:¥R¥iris.csv
Rを起動
CSVファイルをフルパスで指定して、読み込みます。
Rで計算
#irisのヘッダーを確認する。
>head(iris)
#irisのがくの長さの平均値
>mean(iris$Sepal.Length)
#全ての最小値、第一四分位数、中央値、平均値、第三四分位数、最大値
四分位数:データの値を大きさの順に並べたとき、4等分する位置の値
小さい方から順に第一(Q1)、第二(中央値と同じ値、Q2)、第三(Q3)、第四(Q4)となる
>summary(iris)
Rでグラフ作成
#ヒストグラムを作成
>hist(iris$Sepal.Length)
#一変数の散布図
>plot(iris$Sepal.Length)
#二変数の散布図
>plot(iris$Sepal.Length,iris$Sepal.Width)
GIS教材でやってること
こういうデータを使っています。
データは14人の学生の英語と数学のテストの採点表です。
やってみます。
データを読み込んでみます。
データセットに読み込んでみます。
x軸とy軸を指定して、plotを実行
散布図を作成
相関関係があるようには見えないんだけど…….。
サマリーです。
各人の採点の分布をプロット
どっちの出来もいいのが4人
どっちかの成績のいいのが5人
どっちの出来も悪いのが5人
といったところ
点数の合計を計算
minやmaxで、英語の最低点数や最高点数を求めることができます。
Leave a Reply