今回より、出る順100選の進化系としてテーマを広げてお話しします
初回は都立高入試英語の語彙ワールドについてです
まず、2026年度(2026年2月実施分)と10年前の2016年度を比較してその概要を把握しましょう
2026年度入試で出題された単語数は、
延べ3078語 (Tokensベース)
学習目的での読解速度は、一分当たり150語程度と言われていますので単純読解でも20分はかかる計算です。リーディング(3行作文を含む)の試験時間は40分。解答に費やす時間に余裕がないのが分かります
10年前の2016年度入試では延べ2184語でした。実にこの10年でボリュームは1.4倍に増加しています。これは、近年、より実践的な英語の運用能力を問う傾向の表れと考えられ、今後も3000語前後のボリュームが続くものと思われます
対して、2026年度入試の重なりを除いたベースの単語数は、
404語 (Typesベース)
10年前の2016年度入試では361語でした。この10年の増加率は12%。文章のボリュームは増えても必要とされる語彙はそれほど増えていないのが分かります。また、一語当たりの平均使用回数も6.0回から7.6回へと増加しています
年度 単語数 伸び率 延べ単語数 伸び率
2016 361 - 2184 -
2026 404 12% 3078 41%
実は、都立の英語は過去に出題された単語が何度も再登場し、さらに同一年度内でも利用回数が増えることで近年ボリュームがかさ上げされているのです。すなわち、都立の英語の語彙ワールドは狭い空間で適度に閉じていることを示しています
このように再現性の高い試験の場合には、過去問からいかに効率的に学ぶかがとても重要です
次回は、過去問活用法をもう少し踏み込んでお話しします
分析方法
0. 分析ツール:AntConc(version 4.3.1)
1. 分析対象:
リスニング問題の設問+リーディング問題
(注)リスニング問題の台本は本番でのソースが
音声のため語彙ワールドの分析対象には含め
ない
2. 以下の単語は除外
人名
日本の地名のローマ字表記
日本文化のローマ字表記
(注) 外国国名・地名は分析対象に含める
3. 変化形は原形に戻して1語してカウント
例:is, are, was, were, be, beingはbe動詞1語とする
注記
ブログVol.1〜10 では、2015〜2019 年はリスニング台本+リーディング、 2020〜2026 年はリスニング設問+リーディングを合わせた 混在コーパスをもとに語彙頻度を分析しました。Vol.11 以降は、より精密な分析のために コーパスを音声ソースと活字ソースに分離しています
用語解説
Tokens:
文章の中に現れる単語の総数(ボリューム)
Types:
単語の種類重複を除いた「辞書に載っている見出
し語」としての数(語彙の広さ)
コーパス:
文章中の言語を、コンピュータで分析できるよう
に大量に蓄積したデータソースのこと
*本ブログで掲載した数値は、筆者の独自の集計に基づくものであり、その正確性を保証するものではありません