こんにちは。
今回はTOEICのスコア分布の考え方についてお話します。
この記事を読むことで、以下の手助けができればと考えています。
- TOEIC学習者の中で自分がどのくらいの位置にいるのか客観的に見つめること
- 統計的な用語を理解するとともに、データを正しく解釈し判断すること
平均スコア・スコア分布 詳細の紹介
IIBC(一般財団法人 国際ビジネスコミュニケーション協会)のホームページにて、公開テストの平均スコア・スコア分布が公表されています。
このページに出てくる用語を解説しつつ、データの解釈について話していきたいと思います。
(公開テスト 平均スコア・スコア分布 一覧 より引用)
受験者数
上のテーブルは現時点で確認できる最新の情報になります。
受験者数が34,382人で、最近1年の受験者平均が36,771人です。参考にですが、最近1年での最高受験者数は2021年3月21日午後の回の53,539人、最少受験者数は2021年10月24日午前の回の21,274人です。
ちなみに下の図は2006年以降の受験者数の推移です。2006年以降では年間150万人から250万人で推移しています。
2020年はコロナの影響で公開テストが中止となっており、その影響で受験者が大幅に減っています。
平均
平均については改めて説明する必要もなく、皆さんイメージができていると思います。
公式資料にはTotalスコア÷受験者数と記載があります。
リスニングとリーディングそれぞれ平均が算出されていますが、分母の受験者数が同じため、リスニングの平均とリーディングの平均の合計は全体の平均と一致します。
標準偏差
標準偏差については意味を理解できていない人、ざっくりとしたイメージしか理解できていない人が多いことと思います。
標準偏差はデータの平均値からの散らばり具合を表した指標です。ホームページに以下の説明があります。
※標準偏差とは全受験者のスコアが平均点からどの位の幅の中にばらついているかを示す数値です。
平均スコア・スコア分布 詳細 (第285回)|TOEIC Listening & Reading Test 公式データ・資料|【公式】TOEIC Program|IIBC (iibc-global.org)
この標準偏差の数値が大きければ、受験者のテスト結果は平均点から広範囲に分布していることになり、逆に数値が小さければ、平均点から狭い範囲内に分布していることになります。
各データの値と平均値の差を取り、2乗したものの合計をデータの数で割った値を分散といい、分散の非負の平方根を標準偏差と呼びます。
分散の単位はデータの2乗となるため数値が大きくなりがちですが、平方根を取ることでデータと同じ単位に戻すことができます。TOEICの場合、標準偏差の単位は点数となります。
なお、標準偏差についてはリスニングの標準偏差とリーディングの標準偏差の合計は全体の標準偏差とは一致しません。
度数分布表・相対度数・累積相対度数
上記の用語は実際にホームページ上で使用されているわけではありませんが、データを正しく理解するために必要な知識となりますので説明します。
度数分布表とはデータを階級にわけて、その数の分布を表した表のことです。
ホームページ上の「スコア分布 詳細」がまさに度数分布表ということになります。
相対度数とは、階級に属するデータの数を全体の数で割ったものであり、累積相対度数は相対度数をその階級まで足しあげたものです。
「スコア分布 詳細」の%と表示されている箇所が累積相対度数ということです。
データの読み方ですが、例えば895~の95.7%は845~までの階級の度数を合計したものになりますので、自分が895~に属していたとしたら、「自分より下の階級に属する人が95.7%いる」あるいは「上位4.3%(100%-95.7%)に属している」ということがわかります。
累積相対度数の注意点ですが、その階級までのデータ数が含まれているかに留意してください。その階級が含まれている場合と含まれていない場合があります。
下の「スコア分布 詳細」の場合、右上の95.7%という数字には895~の人数は含まれていません。
見分けるポイントとしては、累積相対度数は合計すると1(100%)となりますので、最大の階級の累積相対度数が100%となっている場合にはその階級を含んだ累積相対度数の表記という判断が出来ます。
正規分布
正規分布について、以下の説明があります。
※例えば、第285回(2021年12月19日 午後)TOEIC L&R公開テストの場合、すべてのスコアが正規分布しているという仮説に従えば、776.9(平均スコア+標準偏差)から 438.5(平均スコア-標準偏差)の間に、全受験者の68%が含まれていることになります。
平均スコア・スコア分布 詳細 (第285回)|TOEIC Listening & Reading Test 公式データ・資料|【公式】TOEIC Program|IIBC (iibc-global.org)
正規分布は統計学における検定・推定や自然界の現象や私たちの生活の中でも幅広く利用される分布です。
正規分布は平均を中心とした左右対称の釣鐘型をした分布であり、平均と標準偏差が与えられれば形状が一意に定まります。形状が一意に定まることにより、データが含まれる割合を理論的に求めることができます。
統計学でよく使われる目安が以下の通りです。今回(第285回 午後)の点数との対応を載せておきます。
標準偏差 | 含まれる割合(信頼係数) | TOEICスコア〈信頼区間〉 |
±1σ | 68% | 607.7±169.2 |
±1.96σ | 95% | 607.7±331.6 |
±2.58σ | 99% | 607.7±436.5 |
TOEICスコアが従う分布について
上の説明で「信頼係数が99%の場合、スコアの範囲がTOEIC満点である990から飛びぬけている」という疑問を持たれる方もいるかもしれません。
ホームページの注意書きにもあるように、あくまで「すべてのスコアが正規分布しているという仮説に従えば」という前提での理論的な推定となりますので、留意が必要です。
観測されたデータの分布が正規分布に従っているかを判断するためには、QQプロット、コルモゴルフ-スミルノフ検定、シャピロ-ウィルク検定等の手法がありますが、ホームページ上の情報だけではこれらの手法は使えず、受験者すべての個別の点数が必要となります。
ざっくりとですが、第285回の実際のスコアの分布と平均スコア607.7、標準偏差169.2の正規分布(理論分布)を比較した結果を見てみるとそれなりに乖離があるということが見てとれます。
正規分布であれば、平均=中央値=最頻値(最も度数が多い値)となりますが、実際のスコア分布は中央値や最頻値が平均より左側に位置しています。
これは平均の高い人たちの影響を受け平均を押しあげていることを意味します。
なお、中央値は上記で説明した累積相対度数の50%と同義であり、スコア分布詳細から545-595の間にあることがわかります。
まとめ
いかがだったでしょうか。
- スコアの中央値は545-595
- スコアの平均は600程度
のようにデータを見ることで試験の全体像や難易度を俯瞰することができます。
TOEICに限らず役立つことなので是非実践してみてください。
コメント