トップ > 世界のウェブアーカイブ > Library of Congress Web Archives

Library of Congress Web Archives

米国議会図書館(Library of Congress、以下LC)は、2000年よりウェブアーカイブを行っています。

米国議会図書館におけるウェブアーカイブ

2000年、LCはウェブサイト収集のパイロットプロジェクト「MINERVA(Mapping the INternet Electronic Resources Virtual Archive)」を開始しました。2004年には、デジタルコンテンツの管理維持を担うウェブアーカイブチームを立ち上げ、国内外の機関と連携して制度問題や技術開発に取り組み始めました。

以前は、アーカイブされたウェブサイトを閲覧するには専用のインタフェースを利用する必要がありましたが、2013年にウェブアーカイブを他の図書館資料と統合的に検索・閲覧できるインタフェースが採用されています。

米国議会図書館のウェブアーカイブコレクション

LCは国政選挙など特定の主題に基づいた選択収集を行っており、その収集対象には国内外の政府機関や、政党、宗教団体、慰霊祭・記念式典といった様々なウェブサイトが含まれています。

ウェブアーカイブ開始当初は、国政選挙やイラク戦争、アメリカ同時多発テロといった特定の出来事に関わるコレクションの整備を進めました。2010年以降は、このような特定の出来事に捉われない新たなコレクションを立ち上げ、ウェブアーカイブの幅を広げています。 収集するウェブサイトの選定は、Recommending Officersと呼ばれる主題の専門知識を持つ職員が担っています。

なお、LCがバルク収集を行えない理由として、「.com」の中から米国のウェブサイトのみを特定するのが難しいことが指摘されています。

ウェブサイト収集とデータの公開

基本的に1つのウェブサイトに対して、週に1回ないし月に1回、四半期に1回の収集を行っていますが、ウェブサイトの更新頻度によっては、より収集頻度の高いものもあれば、年に1、2回の収集しか行わないものもあります。

収集されたウェブサイトは、収集日から1年が経過すると、権利者の許諾に応じてインターネットで公開されます。権利者がインターネット公開を許諾しなかった場合でも、LC館内では閲覧することができます。公開範囲は、収集された各ウェブサイトに付与されているメタデータの「Access Condition」で確認することができ、インターネット公開されているものは「None」、LC館内限定公開のものは「Access restricted to on-site users」と表示されます。

メタデータは目録規則に準じて作成されており、タイトル、主題、フォーマットや、収集日といった基本的な情報に加え、属するコレクション名やウェブサイトの概要などが載せられています。

米国議会図書館ウェブアーカイブの使い方

メタデータの検索にはLCウェブサイトのページ上方に設置されている検索窓を利用します。この検索窓は、ウェブアーカイブ以外の図書館資料と共通の検索窓であるため、デフォルトで「Everything」となっているプルダウンを「Archived Web Sites」にセットし、検索したい言葉を入力します。 ("Collections with Archived Web Sites"のページでは、プルダウンは最初から「Archived Web Sites」にセットされています。)

今回は「white house washington」と入力し、検索窓右のボタンをクリックします。

LCウェブサイトのページ上方に設置されている検索窓の画像 検索窓

検索結果が表示されるので、利用したいデータのサムネイル又はタイトルをクリックするとメタデータページへ行くことができます。画面左側のファセットから絞り込み検索も可能です。

メタデータページの例の画像 メタデータページの例("Welcome to the White House"

メタデータ上部にあるサムネイル領域または "View Captures" のリンクをクリックすると、下図のようなカレンダーが表示されます。このカレンダーから日付を選択すればその日のウェブページを閲覧することができます。

カレンダーナビゲーション カレンダーナビゲーション

URLを指定した検索も可能です。URL検索画面の検索窓にURLを入力して検索します。ヒットすると、カレンダー表示に移動します。

(最終更新日:2019/04/04)

ページの先頭へ