ENCODE(エンコード)プロジェクト:ヒトゲノム機能要素の百科事典

ENCODEプロジェクトが解明するヒトゲノムの機能地図:プロモーター・エンハンサー・制御要素を網羅し、約8割が生化学的機能を持つという画期的知見と解析を詳述

著者: Leandro Alegsa

ENCODEは、DNA要素の百科事典です。ENCODEは、ヒトゲノムに含まれるすべての機能的要素(いわば“ワーキングビット”)を特定するために2003年に開始されました。この国際プロジェクトは、米国英国スペインシンガポール日本などの研究機関を含む32の研究室、400人以上の研究者が参加して行われました。彼らの成果は、NatureGenome BiologyGenome Researchなどの査読誌に掲載された30本を超えるオープンアクセス論文として発表され、ヒトゲノムに関するこれまでで最も詳細な機能解析の一つとなりました。

主な知見を要約すると、以下の点が挙げられます(ここで示す数値はENCODEの大規模解析で得られた概数です)。

  1. ゲノムのわずか約1%がタンパク質をコードしており、それが約21,000個のタンパク質コーディング遺伝子に相当する。
  2. 約7万個の配列が「プロモーター」領域として同定された。これらは遺伝子の上流に位置し、タンパク質や転写因子が結合して、遺伝子発現を制御する役割を持つ。
  3. 約40万個の「エンハンサー」領域が検出された。エンハンサーは遺伝子から離れた位置で働き、遺伝子の発現を高めたり細胞型特異的な発現を作り出したりする。
  4. 遺伝子の「スイッチ」に相当する配列が数百万に上る(ENCODEの解析では約400万箇所に相当する特徴を検出)。これらはスイッチがオン/オフになる際に機能するDNA配列で、多くは制御対象の遺伝子からゲノム上で離れた位置に存在する。
  5. ゲノムの約8割に生化学的な機能の痕跡が見られることが示された。この結果は「ヒトゲノムの大部分は単なるジャンクDNAである」という従来の見方に疑問を投げかけ、多くの非タンパク質コーディング領域が、タンパク質やRNA分子と相互作用して遺伝子発現の調節に関与している可能性を示唆している。
  6. 進化はタンパク質配列の変化だけでなく、遺伝子制御配列の変化を通じても生じるという理解が強化された。つまり、形質や種間の違いの一部は、制御配列の差異に由来する可能性が高い。

ENCODEが用いた主要な実験手法とデータの概要は次の通りです。

  • ゲノムから転写されたRNAの単離とシーケンス(転写産物の総体的な同定)。
  • 多数の転写因子やRNA結合タンパク質の結合部位の同定(ENCODEでは多数のタンパク質について結合部位を網羅的に測定)。
  • ヒストン修飾パターンの網羅的解析(クロマチン状態を反映し、活性化領域や抑制領域の識別に用いる)。
  • 多数の細胞型・条件についての繰り返し実験(報告では147種類の細胞について1,648回の実験を行ったとされる)。

進化生物学における大きな課題の一つは、間で観察されるDNA配列の違いがどのようにして外見や生理的特徴(表現型)の違いをもたらすのかを理解することです。ENCODEの結果は、進化的変化がタンパク質をコードする配列の変化だけでなく、遺伝子制御を変化させる配列の変化を通じても起こりうることを示しています。

ENCODE結果の重要な点とその意義:

  • 非コード領域(かつて「ジャンク」と呼ばれた領域)の多くが生物学的に意味のある機能を持ちうることを示し、ゲノム機能の理解を広げた。
  • 遺伝子発現の調節要素(プロモーター、エンハンサー、サイレンサー、インシュレーターなど)の全体像を把握する手がかりを提供し、疾患関連変異の機能的解釈に資する。
  • ゲノムワイドな実験データの公開により、他の研究者が再解析や機能検証を行えるようになり、後続の研究(機能的ゲノミクス、ゲノム医学、進化研究など)を大きく促進した。

注意点(限界と課題):

  • 「生化学的に活性がある」ことが直ちに「生物学的に不可欠である」ことを意味するわけではない。ENCODEが検出した多くのシグナルは、機能的な重要性の程度が異なる可能性がある。
  • 検出される要素の数や位置は、用いた細胞型や実験条件に依存するため、全ての細胞型で普遍的に機能する要素とは限らない。
  • 結果の解釈には慎重さが必要で、個々の配列要素の生物学的意義を確定するには追加の実験(遺伝子ノックアウト、クリスパーによる改変、機能的アッセイ等)が必要である。

データの利用とアクセス:

ENCODEプロジェクトのデータは原則として公開されており、ENCODEポータルや各種ゲノムブラウザ(例:UCSC Genome Browser)を通じて閲覧・ダウンロードできます。これらのデータは、疾患関連遺伝子の調査や転写制御の研究、比較ゲノミクスなど幅広い研究に利用可能です。

まとめとして、ENCODEはヒトゲノムにおける機能的要素の包括的マップ作成を目指した大規模プロジェクトであり、ゲノムの非コード領域の重要性を示すとともに、遺伝子発現制御と進化の理解に重要な貢献をしました。一方で、得られた「生化学的シグナル」の生物学的意味を個々に検証する作業は今後も続きます。

関連報道や解説記事については、各科学メディアや研究機関の発表をご確認ください。

質問と回答

Q:ENCODEとは何ですか?


A: ENCODEはEncyclopedia of DNA Elements(DNA要素の百科事典)の略です。ヒトゲノムに存在するすべての機能要素(ワーキングビット)を特定するために2003年に開始されました。

Q:ENCODEの研究は誰が行ったのですか?


A:アメリカ、イギリス、スペイン、シンガポール、日本の32の研究所で、400人以上の科学者が作業を行いました。

Q:ヒトゲノムについて、どのようなことがわかったのでしょうか?


A:タンパク質をコードしているのはゲノムのわずか1%、つまり約21,000個の遺伝子であることがわかりました。さらに、遺伝子の上流でタンパク質が結合して遺伝子の発現を制御する「プロモーター」領域が7万個、離れた遺伝子を制御する「エンハンサー」領域が40万個、遺伝子のオンオフを制御するDNA配列である「スイッチ」領域が400万個あることが判明しました。さらに、ゲノムの8割が明確な生化学的機能をもっていることが明らかになりました。

Q:どのように研究を進めたのですか?


A:ゲノムから転写されるRNAの単離と配列決定、転写産物の結合部位の特定、ヒストンの化学修飾パターンを調べ、遺伝子発現が増強または抑制される領域を見つけること、147種類の細胞で1648回の実験を行うなどの方法を用いました。

Q:この研究は、進化についてどのようなことを示唆していますか?


A: この研究は、進化が、タンパク質をコードする遺伝子の変化と、制御をコードするDNAの変化の両方によって引き起こされることを示唆しています。また、進化は、タンパク質をコードする配列の変化だけでなく、遺伝子の制御を変化させる配列の変化によっても起こる可能性があることを示唆しています。

Q:彼らの研究成果はどこで発表されたのですか?


A: 研究成果は、Nature、Genome Biology、Genome Researchの3誌にまたがる30のオープンアクセス論文で発表されました。


百科事典を検索する
AlegsaOnline.com - 2020 / 2025 - License CC3