インターネット・アーカイブ (IA) は、カリフォルニア州サンフランシスコに拠点を置く非営利団体で、ウェブやマルチメディアを中心とした大規模なオンライン・ライブラリおよびアーカイブを運営しています。1996年にブリュースター・カーレによって設立され、使命は「知識への普遍的なアクセス(universal access to all knowledge)」を支援することです。
主なコレクションとサービス
インターネット・アーカイブのコレクションは多岐にわたり、以下のような主要カテゴリを含みます:
- ウェブページのアーカイブ(いわゆる「スナップショット」や過去のページの保存)
- ソフトウェア(古いゲームやアプリケーションの保存とエミュレーション)
- 映画や動画アーカイブ
- 書籍(印刷物のデジタル化と電子書籍化)
- オーディオ録音(音楽、ラジオ、口述記録など)
ウェブアーカイブの代表的な機能としては「Wayback Machine(ウェイバック・マシン)」があり、特定のURLを入力すると過去に取得されたページのコピーを時系列で閲覧できます。IAはまた、研究や教育向けに大量データのダウンロードやAPIによるアクセスを提供しており、研究者や歴史家にとって重要な資源となっています。
デジタル化と保存の方法
印刷物のデジタル化には専門のスキャン機材が用いられ、図書館のボランティアや職員が本をスキャンマシンに配置して高解像度の画像を作成します。これらの画像はテキスト化(OCR)され、ウェブ上で検索・閲覧できるように公開されます。この一連の作業は「デジタル化」と呼ばれ、映画やオーディオ資料も同様にデジタル保存の対象となります。オリジナルの資料(書籍、フィルム、レコードなど)は、多くの場合カリフォルニア州内の大規模な倉庫で保管されます。
また、インターネット・アーカイブは新しい電子書籍を購入し、図書館と同様の貸出を行っています。貸出はウェブ経由で行われ、利用者は自分のコンピュータや電子書籍リーダーで閲覧できます。アーカイブ内にはタッチ式のテーブルや組み込みコンピュータを備えた特別な閲覧エリアも設けられ、そこで直接資料を閲覧することもできます(例:タッチスクリーン参照)。書籍の貸出については、図書館界で議論される「Controlled Digital Lending(管理されたデジタル貸出)」の考え方を採用している場面もあります。
プロジェクトと協力者
インターネット・アーカイブは、ウェイバック・マシンやOpen Library(オープンライブラリ)など複数のプロジェクトを運営しています。Open Libraryは「これまでに出版されたすべての本のための一つのウェブページを作る」ことを目指す試みであり、その立ち上げ・運営には創設者ブリュースター・カーレのほか、技術者や活動家も関わっています。特に、コンピュータプログラマーであり活動家でもあったアーロン・スワルツ氏もOpen Libraryやオープンアクセス運動に貢献した人物の一人として知られています。
保存の冗長化と公的連携
デジタルコレクションの安全性と長期保存を確保するため、インターネット・アーカイブは世界の他拠点と協力してミラーリング(複製保管)を行っています。特に、エジプトのBibliotheca Alexandrina(アレクサンドリア図書館)でのミラーは有名で、IAが国際的に冗長性を持つ数少ない図書館の一つとなっています。インターネット・アーカイブはまた、研究者や学者がコレクションを無料で利用できるようにすることを重視しており、アメリカ図書館協会のメンバーであり、カリフォルニア州の図書館として公式に認められています。
利用上の注意と法的側面
インターネット・アーカイブは保存とアクセスの両立を目指す一方で、著作権や利用条件に関する議論・訴訟に直面することもあります。利用者は各資料に付与された権利表示や貸出条件を確認し、適法な範囲で利用することが求められます。研究目的での利用やデータ解析を行う場合も、APIの利用規約やライセンス表示を確認してください。
研究・教育での活用
教育機関や研究者は、インターネット・アーカイブの大量データや履歴的資料を用いて、歴史研究、文化資産の分析、デジタル人文学のプロジェクト、ソフトウェアの保存・解析など幅広い用途に利用しています。ウェブアーカイブは、企業サイトやニュース記事の変遷、政府発表の履歴などを追跡するのに特に有用です。
関連ページ
- アレクサインターネット
- プロジェクトグーテンベルク
主な製品

カリフォルニア州サンフランシスコにあるインターネットアーカイブ本部。建物は元キリスト教科学教会。
主な製品

インターネットアーカイブ(アレキサンドリア書誌
主な製品

印刷された書籍をデジタル化するために使用されるスキャンマシンの一つ