タンパク質データバンク(PDB)とは:3次元生体分子構造の定義と活用
PDBとは何か、3次元生体分子構造の取得法や解析手法、データの利用法と応用例までをわかりやすく解説。
タンパク質データバンク(PDB)は、タンパク質や核酸などの大きな生体分子の3次元(立体)構造に関する情報を集めたものです。世界中の生物学者や生化学者がデータを送ってきます。ほとんどのデータは、X線結晶構造解析やNMR分光法によるものです。近年はクライオ電顕(cryo-EM)で決定された大規模複合体の構造も急増しています。誰でも無料でオンラインでPDBにアクセスできます。世界タンパク質データバンク(wwPDB)がPDBを管理しており、複数の地域拠点が連携してデータの収集・公開・保守を行っています。
データの内容と形式
PDBエントリには、原子座標(3次元位置)、実験条件、測定手法、構造決定に使った配列情報、結晶学的な対称性情報、リガンドや金属イオンなどのヘテロ原子情報、ならびに構造の注釈(生物学的アセンブリ、機能注記など)が含まれます。各エントリには4文字のPDB ID(例:1ABC)と呼ばれる一意の識別子が与えられます。公開されるデータ形式としては従来のPDB形式のほか、現在はより豊富なメタデータを扱えるPDBx/mmCIFが標準として広く使われています。
データの取得と利用方法
- Webブラウザや専門のビューア(例:PyMOL、UCSF Chimera、Mol*など)で構造を可視化できます。多くのサイトはオンラインでインタラクティブに構造を閲覧可能です。
- 全データのFTPミラーやAPI経由での一括ダウンロードが可能で、計算解析や機械学習のトレーニングデータとしても広く利用されています。
- エントリにはしばしば外部データベース(例:UniProt、ChemBLなど)へのクロスリファレンスが含まれ、配列情報や薬物情報と結びつけて使うことができます。
データの提出と検証
研究者が新しい構造を発見すると、構造座標や関連する実験データをPDBに提出(deposition)します。多くの学術雑誌や、米国の国立衛生研究所などの資金提供機関では、科学者にPDBにデータを送るようにとの規則を設けています。提出時には自動検証ツールが走り、立体配座の妥当性、ジオメトリ、フィットの品質(R値やマップとの整合性など)などがチェックされ、公開時には検証レポートが添付されます。これにより利用者は構造の信頼度を評価できます。
主な活用例
- 構造生物学の基盤資料:実験データの共有と再現性の確保。
- 創薬・薬剤設計:標的タンパク質の結合部位を解析してリード化合物設計に利用。
- 酵素メカニズムの解明:活性部位や基質結合様式の可視化。
- 分子動力学シミュレーション:初期構造としてシミュレーションを行う。
- 教育・可視化:大学教育や一般向けの立体分子モデルの教材として。
データ品質と注意点
すべてのPDBデータが同じ品質というわけではありません。構造決定法(X線、NMR、cryo-EM)や解析条件、解像度、モデルの完全性によって信頼度は異なります。利用前には必ず検証レポートやR値、解像度、リガンドのB因子、欠損領域などを確認してください。また、結晶中の非生理的な相互作用や人工的なタグ、プロテアーゼ処理による欠損など、実験系に由来するアーチファクトにも注意が必要です。
一次データと二次データベース
PDBは一次データベースとして原始的な構造データを提供します。他の何百もの二次データベースはPDBのデータを再利用して付加情報を付けたり、整理したりしています。たとえば、SCOPやCATHは構造を種類別にグループ化し、進化による関連性を考えています。遺伝子オントロジーは、データを遺伝子に基づいたグループに分類します。これらの二次データベースは、機能予測や系統解析、ドメイン分類などに役立ちます。
関連組織・リソース(概要)
- wwPDBの地域拠点(RCSB PDB、PDBe、PDBj、BMRBなど)はデータの収集・配布を共同で行っています(ここでは名称のみを示します)。
- 可視化ツール、解析パッケージ、教育用リソースが多数公開されており、研究・教育両面で利用が進んでいます。
まとめると、PDBは生体分子の立体構造に関する中心的な公開リポジトリであり、構造生物学、創薬、バイオインフォマティクス、教育など多岐にわたる分野で不可欠な資源です。利用時は公開されている検証情報やメタデータを確認し、元データと二次データベースの両方を活用することが推奨されます。
関連ページ
- 分子運動のデータベース
- The Worldwide Protein Data Bank (wwPDB) - 各地域のホストの親サイト(下記)
- RCSBタンパク質データバンク(米国)
- PDBe (ヨーロッパ)
- PDBj (日本)
- BMRB, Biological Magnetic Resonance Data Bank (米国)
- wwPDB Documentation - PDBとPDBMLのファイルフォーマットについてのドキュメント
- Looking at Structures - RCSBによる結晶学の紹介
- PDBsum Home Page - PDBの構造に関するデータを他のデータベースから抽出します。
- Nucleic Acid Database, NDB - 核酸の検索に特化したPDBミラーです。
- PDBが主催するPDBチュートリアルの紹介
質問と回答
Q: タンパク質データバンク(PDB)とは何ですか?
A: タンパク質データバンク(PDB)は、タンパク質や核酸などの生体高分子の3次元(3D)構造に関する情報を集めたものです。
Q: PDBに登録されているデータはどこから来ているのですか?
A: ほとんどのデータは、X線結晶構造解析やNMRスペクトロスコピーから得られたものです。
Q: PDBのデータは誰が送っているのですか?
A: 世界中の生物学者や生化学者がデータを送っています。
Q: 誰でもPDBにアクセスできるのですか?
A: はい、誰でも無料でPDBにアクセスすることができます。
Q: PDBは誰が管理しているのですか?
A: PDBはWorldwide Protein Data Bank (wwPDB)が管理しています。
Q: PDBはなぜ科学者に有用なのですか?
A: PDBは、構造生物学や構造ゲノミクスを研究する科学者にとって有用です。
Q: 誰がPDBに情報を送っているのですか?
A: 多くの科学者がPDBに情報を送る必要があります。主要な科学雑誌や、米国国立衛生研究所などの一部の資金提供機関では、科学者にPDBにデータを送るように指示する規則があります。
百科事典を検索する