Vol.19のブログで、2026年度入試における過去10年辞書の実質カバー率は98.6%とお話ししました。今回は、肝心の2027年度対策を解説します
結論は、「2026年度問題を含む過去11年辞書」をベースにすればよいです
都立の語彙ワールドはテーマと問題構成の安定性に裏打ちされています。この前提を踏まえれば、2027年度入試においても過去10年辞書の有効性は高いと予測されます。さらに、語彙寿命の揺れを吸収するために1年分のバッファを取りました
2027年度問題における11年辞書の実質カバー率は98%と予想しています
前提 ・総延べ単語数3000語程度
・初出語50語 (内、注釈あり15語、日本語化 15語)
・初出語の平均頻度3回
初出語50語のうち、注釈や日本語化(カタカナ英語)で対応できる30語を除くと真の未知語は20語。これらが平均3回登場すると仮定すると、カバーできない延べ語数は60語(20語×3回)です。これより、
実質カバー率 = (3000-60)/3000 = 98%
肝心の11年辞書とはどのようなものでしょうか。以下が概要です
さて、早いものでもう5月の後半、都立入試まで9か月です。そこで、現在、この11年辞書から学習用に適した単語帳CR95の作成を急ピッチで進めています
次回のブログからCR90の配信を開始します
筆者考案の格言
同じ頂(いただき)を目指すのでも、 高山には高山の戦略があり、 低山には低山の戦略があるように、都立には都立の魅力と戦略がある
分析方法
0. 分析ツール:AntConc(version 4.3.1)
1. 分析対象:
リスニング問題の設問+リーディング問題
(注)リスニング問題の台本は本番でのソースが
音声のため語彙ワールドの分析対象には含め
ない
2. 以下の単語は除外
人名
日本の地名のローマ字表記
日本文化のローマ字表記
(注) 外国国名・地名は分析対象に含める
3. 変化形は原形に戻して1語としてカウント
例:is, are, was, were, be, beingはbe動詞1語とする
注記
ブログVol.1〜10 では、2015〜2019 年はリスニング台本+リーディング、 2020〜2026 年はリスニング設問+リーディングを合わせた 混在コーパスをもとに語彙頻度を分析しました。Vol.11 以降は、より精密な分析のために コーパスを音声ソースと活字ソースに分離しています
用語解説
Tokens:
文章の中に現れる単語の総数(ボリューム)
Types:
単語の種類重複を除いた「辞書に載っている見出し語」
としての数(語彙の広さ)
コーパス:
文章中の言語を、コンピュータで分析できるよう
に大量に蓄積したデータソースのこと
CEFR-J:
CEFR-J Project(中心機関:東京外国語大学)が開発した
日本人英語学習者向けの到達度指標です。欧州CEFRを基に、
日本の学習実態に合わせて細分化されており、文部科学省の
英語教育改革などの参考指標としても活用されています。
*本ブログで掲載した数値は、筆者の独自の集計に基づくものであり、その正確性を保証するものではありません