トップ > 今月の特集一覧 > 2023年1月特集「WARPで保存したサイトをバブルチャートで可視化!」

今月の特集(2023年1月) - WARPで保存したサイトをバブルチャートで可視化! -

国立国会図書館インターネット資料収集保存事業(WARP)では、収集・保存したウェブサイトの数(タイトル数)が2015年10月に1万件を突破し、20周年を迎えた2022年には1万4千件を突破しました。

そこで、どのようなウェブサイトがどのくらい保存されているのか、一目で分かるようにバブルチャートを使って2022年10月末時点で保存しているウェブサイトを可視化しました。「保存したサイトの可視化」のページに掲載しているので、ぜひご覧ください。バブルチャートの中の円の一つ一つがウェブサイトのタイトル、色がコレクションの種別、大きさが保存容量を表しています。

さらに、今月の特集では、2015年10月末時点のデータとの比較を行い、7年前からどのように変化しているか探ります。

バブルチャートの比較  - 2015年10月末と2022年10月末 -  

2015年10月末から2022年10月末の7年間で、タイトル数は1万件から1万4千件に増加し、保存容量は630TBから2,600TBと約4倍に増加したことから、2022年10月末時点のバブルチャートの方が円の数が増え、規模も大きくなっていることが分かります。

コレクション種別の色分けに着目すると、外側の紫色の部分が減り、赤色やオレンジ色の部分が増えたように見えます。これは、赤色やオレンジ色の部分に相当する「都道府県」、「政令指定都市」、「市町村」のコレクションが、タイトル数はほぼ増加しなかったものの、いずれも保存容量の全体に占める割合が2015年10月末時点と比較して高くなったためです。そのことがよく分かるように、保存容量全体に占めるコレクション別の割合を比較したのが、次のグラフです。

2015年10月末と2022年10月末時点のコレクション別割合の比較 (グラフ)コレクション別割合の比較  - 2015年10月末と2022年10月末 -  

また、それぞれのバブルチャートを拡大してみると、特に「法人・機構」(薄緑色)と「大学・学術機関」(紫色)のコレクションで円の数が増加していることが分かります。これは、公益法人、私立大学などの民間のウェブサイトについては収集するための許諾依頼を日々行っており、年々タイトル数が増加しているためです。また、学術機関については近年、学協会に対して集中的に依頼を行っているため、タイトル数が増加しています。

結びに

可視化した詳細画像からは、保存したウェブサイトの一覧画面に飛ぶこともできます。ぜひ目に留まった円をクリックして、ワープしてみてください。

本年もWARPのご活用をどうぞよろしくお願いいたします。

今月の特集一覧

ページの先頭へ