URLでデータを取り込んでRで集計する

PASTEBINにというデータを保存する場所に私が保存したCSV形式のデータ(架空(かくう)の試験結果です)をRに読み込んで集計します。これを集計するRの命令文(スクリプト)もPASTEBINに保存しました。

文字が下がっているところは説明です。「まず、やってみたい」という場合は、下がっているとことは飛ばしてください。

ネット上のデータは形式により取り込み方が違いますが、今回は、CSVファイルをそのままの形式(raw)で取り込む場合です。詳しくはHow To Use R To Access Data On The Webに情報があります。

Rで実行する場合

まず、全員の平均点を出してみましょう。

下の埋め込まれた命令文(スクリプト)の1行目から8行目までをコピーします:

「#ネット上にあるデータを …#dplyrと …mean(marks))」をコピー

Rにのコンソールに貼り付け、Enter(Return)で実行します。全員の平均点50.944が得られます。

一番先に上を実行しないと、他の集計ができません。それはRにdplyrとmagrittrという補足プログラム(Package)を呼び出して使っているからです。これらのプログラムがインストールされていない場合は、install.packages(“”)を用いてインストールしてから、library()で呼び出す必要があります。

ちなみに、大学のコンピュータのRにはすべてのPackageがインストールしてあります。

他の集計をする場合は、集計したい#の項目(次の#の前の行まで)をコピーしてRに貼り付けて実行すると集計結果が表示されます。

ネット上のデータを読み込んで集計するスクリプト一覧

Rをインストールせずに、オンラインで集計する場合

Rをインストールしていない場合でも、R-Fiddleを利用するとオンラインで上の集計を実行できます。

下にスクリプトをいれたR-Fiddleを埋め込みました。「Edit」をクリックして、開いた画面で、右下の「Run Code」をクリックし、すべてのスクリプトを実行します。

次に、集計したい項目(#から次の#の前の行まで)をコピーし、下側のコンソール部分に貼り付け、Enter(Return)で実行すると、集計が表示されます。

小さなウィンドは説明です。邪魔な場合は、「End tour」をクリックして消してください。

R-Fiddleを利用した集計


柴田 啓文

紹介 柴田 啓文

経済学部教員です。このサイトの管理者の一人です。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です