トップ > 世界のウェブアーカイブ(おすすめコンテンツ) > UK Web Archive

UK Web Archive

UK Web Archive英国図書館(British Library)が運営しているウェブアーカイブです。

英国図書館におけるウェブアーカイブ

英国図書館では2004年よりウェブサイト管理者の許諾に基づく選択収集を行っていましたが、法改正に伴い2013年4月6日から法律に基づくバルク収集も開始しました。この法改正では、英国における納本制度の対象にインターネットで公開されたウェブサイトが含まれるようになりました。".uk"ドメイン(あるいは".london"や".london.tv"といった英国内の場所に関するドメイン)を持つウェブサイトが収集の対象となります。

UK Web Archive では、両者のうち選択収集したウェブアーカイブをインターネット上で公開しています。一方、バルク収集したウェブアーカイブは図書館内での閲覧のみ可能です(2013年末までに提供が開始されるようです)。

UK Web Archiveの概要

UK Web ArchiveではWARPと同様にターゲット単位でウェブサイトをアーカイブしています。検索の際はターゲットのタイトル(ウェブサイトのタイトル)を検索することや(検索画面の下部)、アーカイブの全文検索を行うことができます(検索画面の上部)。

また、特定のテーマに関するウェブサイトをアーカイブした「特別コレクション(Special Collection)」があります。こちらからターゲットの一覧を表示させることができます。例えば、「2012年ロンドンオリンピック・パラリンピック」のようにイベントに関するサイトのアーカイブや、「英国の田舎」といった主題に関するアーカイブなどがあります。

ターゲットを選択すると、ターゲットの詳細画面になります。ここから、保存した日を選んでアーカイブを閲覧することや、表示中のターゲットに限定した全文検索を行うことができます。

2013年8月11日時点で、ターゲットの数は13,417個、保存回数は61,088回、保存容量は約20TBとなっています。

アーカイブの可視化

UK Web Archiveはここまで説明してきた標準的な検索サービスの他に、アーカイブを可視化して見せるサービスも提供しています。

N-gram Search

入力した語のアーカイブ中の出現頻度を時系列で表示します。下図は"japan"を入力した結果です。2004年及び2011年以降に、アーカイブ中に"japan"の語が含まれる割合が多くなっていることが分かります。

UK Web Archive N-gram Search

"japan"の検索結果(N-gram Search)

3D wall

特別コレクションのトップページ画像一覧を3D形式で見ることができます。

アーカイブの横断検索

ウェブアーカイブを公開している複数の機関において、同じウェブサイトを重複して収集している場合があります。それら複数のウェブアーカイブを一度に検索することができれば、あるアーカイブでは保存していない日時のものが他のアーカイブで見つかるかもしれません。複数に分散した検索システムを包括的に検索することを横断検索と呼びます。ウェブアーカイブの横断検索にはMementoと呼ばれる技術が提案されています(http://www.mementoweb.org/)。

UK Web Archive はMementoに対応しており、他の機関が提供しているウェブアーカイブも併せて検索することができます。この横断検索サービスはMementosと呼ばれています。

下図はMementosで国立国会図書館のトップページ(http://www.ndl.go.jp/)を検索した結果です。

図中の右上を見れば、どのアーカイブに何回保存されているのかが分かります。この例で分かるように、http://www.ndl.go.jp/ はUK Web Archive に一度も保存されていませんが、他のアーカイブには保存されていることが分かります。

(最終更新日:2013/9/25)

ページの先頭へ

Copyright © 2013- National Diet Library. All Rights Reserved.