R-FiddleでWikipediaの表をコピーして簡単なグラフを作成

Webページの表を取り込んでグラフを作成するのは、慣れないと表計算のアプリケーションでも結構手間がかかります。

先日、社会福祉学と私のゼミの授業で日本社会の状況を各国と比較しました。参考とした文書は下記です。

国際比較からみた日本社会の特徴

ExcelあるいはNumbersで簡単なグラフを作りましたが、同じグラフをR-Fiddleで作成しましたので、作成上の注意点と、R-Fiddleをここにアップします。

作成の注意点

1.不要なスペースの削除

Wikipediaのページ上のデータをコピーしてExcelに貼り付けたのですが、そのままでは、国名の前に半角の空白が入ります。これを除いてからRに貼り付けないとエラーになります。

空白を取り除くのには、空白部分をコピーして、置換の変換される文字列にペーストします。変換する側には何もいれず、すべてを置換します。

ちなみに、空白分をコピーせずにスペースを入れて置換するとうまくいきません。空白部分はスペースではなく、特殊な 不可視文字のようです。

2.カンマ区切りで貼り付ける

エクセル上のデータをそのままR-Fiddleに貼り付けるとエラーがでましたので、カンマ区切りに変換してから貼り付けます。一般に、空白でわけられたものよりもカンマ区切りのデータのほうがエラーが少ないです。

Excelのデータを「名前をつけて保存」で形式をCSV UTF-8として保存します。

このファイルを選択し、右クリックで「プログラムから開く」を選び、メモ帳を選び開きます。ワードでもよいかもしれませんが、メモ帳や他のエディタで開いたほうがトラブルが少ないです。

メモ帳の画面上のデータをコピーし、R-Fiddleに貼り付けます。

カンマ区切りですので、read.csv(text=”)で読み込みます。read.table(header=T,  text=”)でもOKです。

下のR-Fiddleで確認してください。

3.グラフの順序

数値順ではなく、国名のタイトル順になります。これは、x軸の目盛りを国名にしたために、国名のアルファベット順に自動的になるからです。

アルファベット順になるのは、アルファベットに順序がしてされているからです。各文字にlevelが指定されていて、その順に並べています。

この順序を変えるには、levelの数値を変えればよいと思います。あるいは、名前のリストを作成して、軸目盛を国名に変えずにグラフにして、目盛りを非表示にして、そこに名前のリストを表示するとか、、、

もっと簡単な方法があるかもしれませんが、手数がかかりそうなのでやっていません。ExcelやNumbersで棒グラフの順序は、デフォルトでデータと順序と同じになります。

なお、データは下記のページのIMFのものを用いています。

List of countris by GDP nominal

List  of  countries by GDP  (ppp)  per capita

ついでに、一人当たりGDPのトップは最近ニュースで取り上げらるQatarです。

QatarについてのBBC NEWSの記事もリンクしておきます。

http://www.bbc.com/news/world-middle-east-40164552

 


柴田 啓文

紹介 柴田 啓文

経済学部教員です。このサイトの管理者の一人です。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です