Rでdplyr、magrittrを使うとこんなことができます

Rを使って、複数条件でデータを抽出します。

Rそのまま(ベース)ではなく、”dplyr”と”magrittr”というパッケージをプラスしておきます。

そうすると次のように非常にわかりやすいスクリプトで抽出ができます。

もとのデータは、次に示したように、第一列にname(氏名の代わりの番号)、Stu1からStu4までの列が質問に対する回答です。

yearはが学年です。

 

 

 

 

 

さて、このデータから、3年生でStu1の質問にAと回答した人、つまり、3年生で日本語能力試験N1の資格を持っている人のデータを抽出します。

下の図の青字部分がこの抽出を命令するスクリプトです。スクリプトの意味は:

“data0″という名前のデータセットについて、3年生でStu1の質問にAと回答をした学生の回答一覧を抽出せよ。

ところで、”%>%”はこの記号の左側を右側のfilter関数の()の中の一つ目にいれることを命令する記号です。

また、改行してもしなくてもよいので、次のように1行に書いても結果は同じです。

> filter(data0, year==3, Stu1==”A”)

でも、%>%を用いて下の青字のように書くと、どのデータセットについて、どのような条件で抽出しているかはっきりわかりますよね。

もちろん、Excelでも同じことができますが、ずっと直感的にわかりやすいスクリプトです。

 

 

 

 

 

 

どうでしょう。関心をもっていただけましたか?

Rは大学のWindowsのコンピュータにインストールされています。また、みなさんのコンピュータがWindowsでもMacでもLinuxでも無料でインストールすることができます。

以上


柴田 啓文

紹介 柴田 啓文

経済学部教員です。このサイトの管理者の一人です。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です