レンマ(言語学)とは?語彙の基語・辞書見出し語の定義と例

レンマ(言語学)の定義と辞書見出し語・基語の違いをやさしく解説。run/runsの例で語彙とレンマの基本がすぐ分かる記事。

著者: Leandro Alegsa

レンマとは、辞書で定義の先頭に立つ単語のことである。辞書の見出し語はすべてレンマである。厳密には、「基語およびその転訛」である。要するに、ある語彙(lexeme)を代表する慣用的な代表形(辞書に載る形)がレンマである。

語彙(lexeme)とレンマの違い

語彙は意味の単位であり、一つの語彙は複数の語形(形態素的変化)を持つことがある。レンマはその語彙を代表する特定の形(見出し語)を指す。言い換えれば、語彙=意味のまとまり、レンマ=辞書に載る代表形、という区別がある。

具体例

例えば、英語では、run, runs, running, ranは同じ語彙(runという動詞)の異なる語形だが、辞書では通常runがレンマ(見出し語)として扱われる。
日本語では動詞・形容詞は一般に辞書形(いわゆる「書く」「行く」「食べる」「高い」)がレンマになる。例:書く(かく)というレンマは、書いた/書きます/書かれるなどの変化形を包含する。

レンマと語幹・語根(stem/root)の違い

  • 語根(root)は派生や屈折の元になる最小の意味的要素(例:happy → happ- は形態素的には変化する)。
  • 語幹(stem)は屈折語尾を付ける前の形(例:talked の語幹は talk)。
  • レンマ(lemma)は辞書に載る正式な見出し形で、語幹や語根とは必ずしも一致しない(例:"went" の語根は "go" であり、辞書上のレンマは "go")。

派生語とレンマの扱い

レンマは通常、屈折変化(時制・数・格・敬体など)をまとめるために用いられるが、派生(derivation)によって意味が変わる語は別のレンマとして扱われることが多い。例えば、英語の run(走る)と runner(走者)は異なる語彙(異なるレンマ)である。

辞書編纂と見出し語の選び方

辞書によって見出し語(レンマ)の選び方は異なる。語形のどれをレンマとするかは、言語の文法構造や慣習、辞書の対象読者によって決まる。例:

  • 英語では動詞の不定詞形(to run の run)が一般的にレンマ。
  • ドイツ語では名詞は大文字で始まるので、辞書のレンマも大文字表記が用いられる。検索やコーパス処理では小文字化の扱いに注意が必要。
  • 日本語では動詞・形容詞は辞書形(終止形)がレンマで、助詞・助動詞は見出しに含めないことが多いが、慣用句や連語(複合動詞、句動詞)は複合見出しとして扱われることがある。

自然言語処理(NLP)でのレンマ化(lemmatization)

コーパス処理や情報検索では、単語の異なる屈折形を共通のレンマに変換する処理(レンマ化)が重要になる。レンマ化は形態素解析や品詞情報を利用して行われ、検索の正規化、頻度計算、機械翻訳などに使われる。注意点:

  • 形態素解析器は品詞タグを正確に付与する必要がある(例:名詞と動詞で処理が異なる)。
  • 多義語や不規則変化(例:go → went)の扱いは辞書や規則ベース、学習ベースの手法によって異なる。
  • 言語ごとの習慣(大文字小文字、仮名遣い、活用の種類)を反映させる必要がある。

ポイントまとめ

  • レンマ(lemma)=辞書に載る見出し語/語彙を代表する形
  • 語彙(lexeme)は意味のまとまりで、複数の語形を含む。レンマはその代表形。
  • レンマは屈折変化をまとめるが、派生語は通常別のレンマとして扱われる。
  • NLPではレンマ化が検索・解析で重要。言語特有の処理が必要。

上記を踏まえると、レンマは辞書や言語処理で語を整理・正規化するための基本的な単位であり、辞書の見出し語は実務上のレンマの代表例である。

モルフォロジー

英語では、名詞のレンマは単数形である。例えば、mice ではなく mouse である性別がある言語では、通常の形容詞や名詞の見出し語は、通常、男性単数形です。その言語に格がある場合は、レンマは男性単数の主格となることが多い。

多くの言語では、動詞の引用形は不定詞である。フランス語のallerドイツ語のgehen、スペイン語のir。英語では通常、完全不定詞(to go)ですが、アルファベット表記では「to」(go)を除いたものになります

ステムとレンマの違い

計算言語学では、ステムは、異なる形の単語が使用されても決して変化しない部分である。レンマは動詞の基本形である。たとえば、「produced」から、レンマは「produce」であるが、ステムは「produc-」である。これはproductionなどの単語があるからである。音(音韻)を考慮した場合、変化しない部分の定義はあまり意味がない。例の単語の音に注目してください。"produced" /prədjuˈ vs "production" /prədˈkʃən/ ですね。

語彙の中には、複数のステムを持ちながら、1 つのレンマを持つものがあります。たとえば、"to go" (レンマ) には "go" と "went" の 2 つのステムがあります。ここでは、過去形は別の動詞である「to wend」に基づいています。接尾辞の「-t」は「-ed」に相当する。



百科事典を検索する
AlegsaOnline.com - 2020 / 2025 - License CC3