International Internet Preservation Consortium (以下、IIPC) は、世界各国の国立図書館やアーカイブ機関等が連携してウェブアーカイブの構築や技術開発、課題解決にあたる国際コンソーシアムです。
1994年頃からインターネットが世界中で急速に普及し始めました。インターネットは情報が容易に発信できる一方で、更新や削除がされやすいことから、それらを後世に伝えるウェブアーカイブの重要性が徐々に認識され始めました。
そのような中、1996年にオーストラリア国立図書館、スウェーデン国立図書館、インターネットアーカイブがウェブアーカイブを開始しました。1998年までに、デンマーク、フィンランド、アイスランド、ノルウェーの北欧諸国の国立図書館が、2000年以降には世界中の機関がウェブアーカイブを行うようになりました。
このように世界中でウェブアーカイブが行われるようになりましたが、ウェブ技術の発展が加速度的であるため、単独でウェブアーカイブの技術開発をし続けるには限界があることを、多くのウェブアーカイブ先進国は感じていました。また、消失するウェブが急速に増加していたため、連携して速やかに技術開発を行うことが必要となっていました。こうした背景のもと、2003年7月に国際インターネット保存コンソーシアム(International Internet Preservation Consortium : IIPC)が結成されました。
IIPC設立初期(2003~2006年)は、フランス国立図書館(BnF)、米国議会図書館(LC)等の11の国立図書館とインターネットアーカイブの計12機関が、収集ロボット Heritrixの開発に注力しました。Heritrixが開発された後は、各国は独自の収集ロボットの開発をやめ、Heritrixを使用するようになりました。
当初は、この12機関以外の加盟は認められていませんでしたが、他機関の参加希望があったことや、ウェブアーカイブが抱える困難な問題の解決には他機関の経験や技術が必要であったことから、2007年以降は世界の図書館、文書館、博物館等の文化財保存機関や研究機関に加盟が認められています。現在は57機関で構成されています(参照: 2019年末現在のIIPC参加機関)。日本の国立国会図書館は、2008年4月に加盟し、全文検索エンジンNutchWAXの他言語対応などに貢献しています。
(参考)International Internet Preservation Consortium (IIPC)によるウェブアーカイブの紹介動画
Web Archiving and the IIPC - 日本語字幕版 from IIPC - Netpreserve.org on Vimeo.
IIPCは年1回、加盟機関の代表者による総会を開催し、各機関のウェブアーカイブの事例や開発成果を共有しています。また、複数のワーキンググループが常設されており、各加盟機関がそれぞれのグループにおいて、特定のテーマのプロジェクトに取り組んでいます。
IIPC設立初期(2003~2006年)は、収集ロボットを始めとする基本的な技術の開発に主眼が置かれていましたが、その後は収集や提供においてさらに洗練された技術を開発する段階に移行していきました。その具体的な一例として、2009年5月に実現したWARCの国際規格化があります。
WARCは、汎用性を備えたウェブアーカイブの保存用ファイルフォーマットです。WARCファイルには、収集したウェブサイトのコンテンツ以外に、収集日時、収集方法等のメタデータが記載されています。それらのメタデータの項目やその記述方法が標準化されたことで、メタデータの共有が可能となり、容易にコンテンツデータを交換できるようになりました。さらに、WARCファイルによるコンテンツデータの長期保存の実現も検討されています。
IIPCの活動の中で開発された技術は、インターネットを通じて無償で公開され、改良や再配布が自由に行えます。IIPCで開発された主なものとして、収集ロボット Heritrix、ウェブアーカイブの閲覧用ソフトウェア Wayback(現在はOpenWaybackとして開発が続けられています)、ウェブアーカイブの全文検索ソフトウェア NutchWAXなどがあります。
技術開発だけでなく、加盟機関によるウェブサイトの共同収集プロジェクトにも力が入れられています。「オリンピック・パラリンピック」や「欧州難民危機」等をテーマに、国の枠を超えたウェブアーカイブの取り組みが実現しています。
近年のIIPC総会では、ウェブアーカイブの「利活用」に関する報告が目立つようになってきました。基礎技術の普及によりウェブアーカイブがある程度安定的に運用されるようになったことで、収集したコンテンツを「いかに活用するか」ということに、各アーカイブ機関の関心が移っていることがうかがえます。
活用されるためには、ウェブアーカイブの存在や有用性を広く知ってもらうことが必要です。こうした状況を受け、IIPCは、ウェブアーカイブ関連のツールをまとめたサイトを公開したり、ツイッターやブログで情報発信するなどして、それまで以上に積極的な広報活動に努めるようになっています。
また2016年からは、加盟機関以外にも開かれた国際会議「ウェブアーカイビング会議(Web Archiving Conference : WAC)」を開催しています。それ以前にも、総会の一部のプログラムに非加盟機関の参加が認められていましたが、WACの開催により、研究者やジャーナリストなども巻き込んで、より幅広い視点から議論が交わされることが期待されています。
機関名 | 機関名(日本語) | 国 |
---|---|---|
Arquivo.pt at FCT | FCCN (Portuguese Web Archive) | ポルトガル | |
Bibliotheca Alexandrina | アレクサンドリア図書館 | エジプト |
Internet Archive | インターネットアーカイブ | アメリカ合衆国 |
機関名 | 機関名(日本語) | 国 |
---|---|---|
California Digital Library | カリフォルニア電子図書館 | アメリカ合衆国 |
Columbia University Libraries | コロンビア大学図書館 | アメリカ合衆国 |
Cornell University Library | コーネル大学図書館 | アメリカ合衆国 |
Harvard University Library | ハーバード大学図書館 | アメリカ合衆国 |
Los Alamos National Laboratory Research Library | 米国ロスアラモス国立研究所研究図書館 | アメリカ合衆国 |
Old Dominion University, Department of Computer Science | オールド・ドミニオン大学コンピュータサイエンス学科 | アメリカ合衆国 |
Stanford University Libraries | スタンフォード大学図書館 | アメリカ合衆国 |
UCLA Research Library | UCLAリサーチ図書館 | アメリカ合衆国 |
University of North Texas Libraries | ノーステキサス大学図書館 | アメリカ合衆国 |
Univerzitná knižnica v Bratislave (University Library in Bratislava) | ブラチスラヴァ大学図書館 | スロバキア |
機関名 | 機関名(日本語) | 国 |
---|---|---|
Biblioteca de Catalunya (Library of Catalonia) | カタロニア図書館 | スペイン |
Bibliotheque et Archives Nationales du Quebec (BANQ) | ケベック州立図書館・文書館 | カナダ |
機関名 | 機関名(日本語) | 国 |
---|---|---|
The National Archives (U.K.) | 英国国立公文書館 | 英国 |
機関名 | 機関名(日本語) | 国 |
---|---|---|
Ina (Institut National de l'Audiovisuel) | フランス国立視聴覚研究所 | フランス |
Nederlands instituut voor beeld en geluid (Netherlands institute for sound and vision) | オランダ視聴覚研究所 | オランダ |
(最終更新日:2020/3/16)