正規分布について考える

正規分布は次のような特性があります。試験結果のデータや身長のデータは一般に正規分布(normal distribution)に従うとして、相関やそのほかの統計的手法が利用できるとされています。

正規分布の説明のためのグラフをRで作成

しかし、実際には試験結果が正規分布に従うのはまれです。それは、いろいろなレベルの学生が入学していたり、多国籍の留学生が入学していたりしているため、データが偏っているからです。

今回下に示したデータは、実際のプレースメント試験の英語と日本語の試験結果ですが、45問均等配点にした場合(original)と平均点を50点に近づけるために恣意的に調整したデータ(weighted)をそれぞれグラフ化し、正規分布であるかどうかのテストをしました。

そうすると、恣意的に調整した日本語の試験結果のみ、shapiro-wiilk test で正規分布とされました。

で、まだアイデアの段階ですが、項目反応理論 (item response theory)に基づき問題を取捨選択し、適切な問題の配点を正規分布するように調整するプログラムを作成すると、適切な実力判定ができるのではないかと思うのですが、どうでしょう?
下記にRpubsに公開しました。RpubsはRStudioよりプログラムやグラフを含む文書をHTMLやPDFに書き出すものです。
http://rpubs.com/shibatau/274204

また、同じプログラムをR-fiddleでヒストグラムや正規分布判定テスト結果などを示しました。

なお、大学のRで実行する場合、データの読み込みに失敗すると思いますので、面倒ですが、保存して呼び出すか、ExcelにコピーしてRに読み込んでくささい。


柴田 啓文

紹介 柴田 啓文

経済学部教員です。このサイトの管理者の一人です。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です