ジップの法則

Zipfの法則は経験則で、数学統計学を用いて定式化されたもので、最初に提案した言語学者ジョージ・キングスレー・ジップフにちなんで名付けられました。

Zipfの法則は、使用されている単語の大きなサンプルが与えられると、どの単語の頻度も頻度表のランクに反比例するというものです。したがって、単語番号nは1/nに比例した頻度を持っています。

このように、最も出現頻度の高い単語は、2番目に出現頻度の高い単語の約2倍、3番目に出現頻度の高い単語の約3倍の頻度で出現することになります。例えば、英語の単語のあるサンプルでは、最も頻繁に出現する単語である"the"が全単語の7%近くを占めています(100万語強のうち69,971語)。Zipfの法則に従い、2位の"of"は3.5%強の単語を占めており(36,411回)、"and"がそれに続いています(28,852回)。大規模サンプルの半分の単語を占めるには、わずか約135語しか必要ありません。

このような関係は、各国の都市の人口ランキング、企業規模、所得ランキングなど、言語とは関係のない多くのランキングにも見られる。人口別都市ランキングにおける分布の出現は、1913年にフェリックス・アウアーバッハによって初めて注目された。

なぜZipfの法則がほとんどの言語に当てはまるのかはわかっていません。

質問と回答

Q: Zipfの法則とは何ですか?


A: Zipfの法則とは経験則の一つで、大きな標本における単語の頻度は、頻度表におけるその単語の順位に反比例するというものです。

Q: ジプフの法則を提唱したのは誰ですか?


A: ジプフの法則は、言語学者のジョージ・キングスレー・ジプフが最初に提唱しました。

Q: ジプフの法則は英単語のサンプルにおける単語頻度をどのように説明しますか?


A: ジプフの法則によると、英単語のサンプルの中で最も頻度の高い単語は、2番目に頻度の高い単語の約2倍、3番目に頻度の高い単語の約3倍の頻度で出現します。この傾向は単語のランクが下がるにつれて続きます。

Q: ある英単語サンプルの中で、最も出現頻度の高い単語は全単語の何パーセントを占めていますか?


A: ある英単語のサンプルでは、最も出現頻度の高い単語("the")は全単語の7%近くを占めています。

Q: サンプルの半分を占めるのに必要な単語の数と、その単語の出現頻度の関係は?


A: ジプフの法則によると、大きなサンプルの半分の単語を占めるのに必要な単語数は約135個です。

Q: Zipfの法則を示す他のランキングは?


A: ジプフの法則が示す単語の頻度と同じ関係が、言語とは関係のない他のランキング、例えば各国の都市の人口ランキング、企業の規模ランキング、所得ランキングなどでも見られます。

Q: 都市の人口ランキングに分布が現れることに気づいたのは誰ですか?


A:人口による都市ランキングに分布が現れることに最初に気づいたのは、1913年にフェリックス・アウエルバッハ(Felix Auerbach)です。

AlegsaOnline.com - 2020 / 2023 - License CC3