この英語の最も一般的な単語のリストは、オックスフォード大学出版局によって作成されました。ここでいう「単語」とは、辞書の見出し語やリーマ(lemma:派生や活用をまとめた語形の代表形)を意味します。

リストは、10億語以上の語料を分析した結果に基づいています。調査はオックスフォード英語辞典に関連するオックスフォード・オンラインが行ったもので、書籍や新聞、雑誌、議会記録(Hansard)からチャットや電子メール、ブログまで、さまざまなジャンルのテキストが含まれています。

「単語(word)」と「レマ(lemma)」の違い

ここで使われるレマ(lemma)とは、異なる語形(活用や派生)をひとつにまとめた代表形のことです。例えば、レマの "be" は "am"、"is"、"are"、"was"、"were" など複数の形を含みます。同様に "run" のレマには "runs"、"ran"、"running" が含まれます。調査結果に挙がる項目は、こうしたレマ単位で集計されています。

データの特徴と範囲

この語料コーパスは、単一のジャンルや出典だけに偏らない点が特徴です。具体的には、文学小説や学術誌、日常的な新聞や雑誌、議会記録(Hansard)からオンラインのチャットや電子メール、ウェブログまで幅広いテキストが収集されています。そのため、日常会話から公的文書まで横断的な頻度分布を反映していますが、地域差(英米の違い)や時代差、口語と文語の違いなどの影響は残ります。

主な結果と学習への示唆

Reading Teachers Book of Listsによれば、英語で書かれた印刷物の約3分の1は最初の25語で、約半分は最初の100語で構成されているとされています。オックスフォード英語コーパスの分析でも、上位100語のレマが全コーパス語数の約50%を占めるという報告があり、語彙学習における高頻度語の重要性が示されています。

学習者への実用的アドバイス

  • まずは高頻度のレマ(機能語や基本動詞)を優先的に覚える。これだけで文章理解の割合が大きく改善します。
  • レマ単位で学ぶ:活用形や派生語も合わせて使えるように練習することで、実際の運用力が高まります。
  • コロケーション(単語の自然な組み合わせ)や句動詞(phrasal verbs)も頻出例から学ぶと効果的です。
  • ジャンルによる違いに注意する:学術文や日常会話で出やすい語は異なるため、目的に合わせて学習素材を選ぶ。

注意点(Caveats)

頻度リストは非常に有用ですが、いくつかの制約もあります。

  • 語料の構成:コーパスに含まれるテキストの種類や比率によって頻度順位は影響を受けます(たとえば新聞が多ければ報道語が上位に来やすい)。
  • 地域・時代差:英米や年代ごとの用法差があり、すべての状況にそのまま当てはまるわけではありません。
  • 意味の広がり:同じレマでも意味の異なる用法があり、頻度だけで習得を完了するのは不十分です。

まとめると、オックスフォード英語コーパスに基づく頻度リストは、語彙学習の優先順位を決めるうえで非常に有益です。高頻度のレマを中心に、活用形やコロケーションも同時に学ぶことで、効率よく英語の理解力と運用力を高められます。