トップ > 今月の特集一覧 > 2020年4月特集 「ウェブサイト制度収集開始10周年」

今月の特集(2020年4月) - ウェブサイト制度収集開始10周年 -

今月は、WARPが国立国会図書館法に基づき、国や地方自治体など公的機関のウェブサイトを網羅的に収集する「制度収集」を2010年4月に開始してから、ちょうど10周年にあたります。

そこで、制度収集10年の歩みを、省庁など国の機関と、都道府県や市町村など地方公共団体のウェブサイト収集統計から振り返ってみましょう。

(なお、制度収集の対象には上記の他に、独立行政法人や国公立大学なども含まれます。)

日本国内のウェブサイトを収集保存し公開するWARPは、2002年に実験事業として始まり、2006年から本格事業化しました。開始当初は、当館によるウェブサイト収集に法的根拠がなかったため、公的機関についても民間の機関と同様に、許諾を得られた場合のみ収集を行っていました。そのため、収集可能なタイトル数は限られていました。

収集タイトル数(累計)

2009年3月末から2019年2月末までの収集タイトル数(累計)統計グラフ 収集タイトル数(単位:件)

上記のグラフをみると、制度収集開始直前の2010年3月末から開始2年後の2012年3月末までの2年間で、地方公共団体の収集タイトル数が1,825件から4,149件と、2倍を超えるペースで大幅に増加したことがわかります。

一方で国の機関をみると、数に顕著な変化はみられませんが、実はその裏で、収集の対象範囲が大幅に広がっています。制度収集開始以前は許諾がウェブサイトの一部に限られていたこともありましたが、制度収集では各機関のウェブサイト全体が収集対象となったためです。これはタイトル数には表れない部分といえるでしょう。

収集ファイル数(累計)

2009年3月末から2019年2月末までの収集ファイル数(累計)統計グラフ 収集ファイル数(単位:千点)

ファイル数は、htmlファイルやpdfファイル、画像ファイル(jpg、gif等)など、収集した様々な種類のファイルの合計です。この2010年3月末から2020年2月末までの約10年間で国の機関は、約2900万点から約20億点と約71倍に、地方公共団体は約5700万点から約32億点と約55倍に増加しました。

収集データ量(累計)

2009年3月末から2019年2月末までの収集データ量(累計)統計グラフ 収集データ量(単位:テラバイト)

同期間のデータ量の推移をみると、国の機関は3.2テラバイトから443.9テラバイトと約138倍に、地方公共団体約4.7テラバイトから602.5テラバイトと約128倍に増加し、どちらも100倍を超える規模になりました。

ファイル数やデータ量でも地方公共団体の数値が国の機関を上回っていますが、タイトル数の差と比較すると、その差は大幅に縮まっています。これは、省庁の基本的な収集サイクルが月1回なのに対し、地方公共団体は年4回であることと、中央省庁のウェブサイトの規模が大きいことが関係しています。

70年を超す納本制度と比べればまだまだ始まったばかりのインターネット資料の制度収集ですが、公的機関におけるウェブベースの情報発信の増加や文書のペーパーレス化の流れと共に、その役割はますます重くなっていくものと思います。制度収集と民間ウェブサイトの収集を車の両輪として進んでいくWARPを、これからもどうぞよろしくお願いします。

今月の特集一覧

ページの先頭へ