トップ > 世界のウェブアーカイブ(おすすめコンテンツ) > Australia's Web Archive "PANDORA"

Australia's Web Archive "PANDORA"

オーストラリア国立図書館(National Library of Australia、以下NLA)はウェブアーカイブの草分け的存在です。1996年に選択収集のアーカイブ「PANDORA(Preserving and Accessing Networked Documentary Resources of Australia)」を、2011年には政府機関サイトのアーカイブ「AGWA(Australian Government Web Archive)」を開始しました。

NLAの二つのウェブアーカイブ “PANDORA”と”AGWA”

PANDORAは、1996年に始まった選択収集によるアーカイブです。PANDORAでは、「オーストラリアに関すること、またはオーストラリア人にとって重要なかかわりがある、またはオーストラリア人によって作成されている」サイトであることが収集対象の基準です。運営の中心はNLAですが、同時に国内の州立図書館や博物館など11の協力機関も非常に重要な役割を果たしています。

収集サイトの選定に当たっては、NLAや各協力機関はそれぞれ各自の選定基準を持ち、分担して選定に当たります。例えば、NLAは連邦政府の刊行物や国家的重要性のあるサイトを、オーストラリア戦争記念館は軍の歴史に関するサイトや、国軍の各種報告書等を、各州立図書館はそれぞれの地方の選挙関連情報や、州政府出版物等の選定を担当しています。

さらに、NLAや各協力機関はそれぞれが選定したサイトについて収集・保存・メタデータの整理を行います。こうした一連の作業を地理的に離れた各協力機関で行えるよう、NLAは共通システム「PANDA (PANDORA Digital Archiving System)」 を開発しました。

NLAにはもう一つのウェブアーカイブAGWAがあります。選択収集(PANDORA)で質の高いアーカイブを構築する一方、収集漏れのリスクに対応するためにはバルク収集が有効であるという考えに基づき、2011年から政府機関サイトのバルク収集が開始されました。このAGWAの実施に当たっては、2010年の通達(“A Whole –of-Government ICT Policy (AGIMO Circula 2010/001)”)により法的な枠組みが整備されました。

なお、アーカイブの利用にあたっては、PANDORAとAGWAの間でのデータ連携がなされておらず、それぞれ個別に検索する必要があることに注意が必要です(2015年3月現在)。

PANDORAの利用

PANDORAトップ画面に、主題別・アルファベット順リストが用意されており、特定のテーマに沿ったコレクションリスト(たとえば、歴代首相2002年バリ島爆破テロ事件等)やタイトルリストが用意されています。

全文/書誌検索は、NLAの共通検索システムTroveで検索します。PANDORAトップ画面の「search Trove」から検索実行すると、Troveの画面に遷移します。

Trove上のタブ「Archived websites」が選択され、ウェブアーカイブに限定した検索結果が表示されます。なお、URL検索には対応していません。

検索結果からデータをクリックすると、過去の収集日一覧からアーカイブされたサイトに遷移します。

AGWAの利用

トップ画面左上のサーチボタンから検索画面に遷移します。

検索画面からは、全文検索、URL検索が可能です。PDF, MS-Officeなどのファイルタイプでの絞込みや、ドメインを絞り込んでのテキスト検索も可能です。

検索結果画面

検索結果画面

検索すると、収集日の一覧が表示され、日付をクリックすると、保存されたデータの閲覧ができます。なお、州政府サイトや、2011年以前の政府機関サイトなどはAGWAには含まれず、PANDORAでしか閲覧できないことに注意が必要です。

(最終更新日:2015/05/15)

ページの先頭へ

Copyright © 2013- National Diet Library. All Rights Reserved.