「ホームページで以前掲載されていた内容が消されていた」などの理由で、過去のホームページを閲覧したいときがあります。今回はそのような場合に使えるサービスをご紹介します。「Wayback Machine」はWebの過去のページを検索して閲覧できるサービスです。
Wayback Machineとは?
サンフランシスコの非営利団体「Internet Archive社」が提供しているWebアーカイブサービスです。「Webアーカイブサービス」とは自動で世界中のホームページのHTMLや画像ファイルなどを定期的に巡回して、「Webアーカイブ」として自動で履歴保存するサービスです。ユーザーはWebサイトのURLを入力するだけで過去のホームページ内容を閲覧することができます。
Wayback Machineの使い方
過去のホームページを閲覧する
それでは、実際に画面入りで使い方を解説いたします。Wayback Machineのサイトより、対象のWebサイトのURLを入力し、「BROWSE HISTORY」ボタンをクリックます。今回は例として、WebCliの過去のホームページを調べたいと思いますので、WebCliのURLを入力します。
以下のカレンダー画面が表示されます。上部の部分には年度ごとのアーカイブ件数が棒グラフで表示されています。いずれかの年度をクリックするとその年度のカレンダーに切り替えることができます。WebCliは2018年開始のサービスですので、2018年以前のアーカイブは存在しませんが、稼働して長いサービスであれば最長で1996年以前まで遡って閲覧することができます。
カレンダーのうち、アーカイブが保存がされた日付には青丸のマークがついています。この青丸マークのうち、見たい日付ををクリックします。
すると、その日付時点のホームページが表示されます。当時の画像も含めて確認ができる他、また、リンク先のページも含めて保存されていますので、このページ内のリンクの箇所をすると当時のリンク先の状態も含めて確認することができます。(ただし、一部のjsファイルの処理は動作しない場合があります。)
手動でアーカイブに登録する
Wayback Machineは定期的に世界中のインターネットページを巡回してページを自動保存していますが、サイトごとに巡回の間隔は不定期となっています。(アクセス数が多いホームページほど頻繁に巡回されるようですが、いつの日付が保存されるかはランダムとなっています。)
もし、今日時点のWebページをアーカイブとして登録したい場合は、サイトトップの右下にある「Save Page Now」という欄にサイトのURLを入力して「SAVE PAGE」ボタンより手動でアーカイブ登録することもできます。
「SAVE PAGE」ボタンを押すと以下のような画面が表示されます。しばらく時間がかかりますが、「Done」と表示されれば、登録完了です。ただし、さきほどのアーカイブの検索結果に反映されるには最大10時間ほどかかりますが、以下の赤枠のURLにより、すぐにアーカイブの内容を確認することもできます。
Webサイトを分析する
また、アーカイブの検索結果カレンダー画面の上部メニューにある各タブより、様々な分析も可能です。
クロールや手動アーカイブ履歴を確認する
「Collenctions」タブに切り替えると、年度ごとにクロールや手動アーカイブがどのぐらいあったかを確認することができます。
2つの日付間の比較を行う
「Changes」タブをクリックすると2つのアーカイブ間の内容比較ができます。カレンダーが表示されますので、2つの日付を選択し、「Compare」をクリックします。
これで、選択した2つの日付時点のページが比較表示されます。相違点はハイライトで表示されますので、視覚的にどこが変わったかを調べることができます。
ファイルの統計を分析する
「Summary」タブに切り替えると、そのページのHTMLや画像、スタイルシートなどの数や構成比が確認できます。
サイトマップ(サイト構造)を分析する
「Site Map」タブに切り替えると、アーカイブの年度ごとにサイトのページ構造を円構造で確認することができます。最も中心がトップページで、外側にいくほどリンクではられた子ページとなっています。円グラフ内をマウスオーバーすることでURLが表示されます。URLをクリックすることで対象のページや画像を閲覧することができます。
URL一覧を表示する
「URLs」タブに切り替えると、サイト内のHTMLページが画像ファイルのURLがリスト形式で確認できます。URLや拡張子で絞り込み表示できる他、リンク先をクリックすることでページや画像を確認することができます。
以上がWayback Machineの主な機能をご紹介しました。当時のホームページの状態の確認だけでなく、ページ間の相違点比較やファイルの構成比率などもできるサービスとなりますので、今後のホームページ分析にも活用いただけたらと思います。
Wayback Machineの特徴
Webアーカイブするサービスは他社にもありますが、Wayback MachineはWebアーカイブサービスの中でも一番歴史が長く、保存されているページ数が多いのも特徴です。(2022年3月時点で約2940億ページが保存されています。)
例えば、国内では手動でアーカイブできる「魚拓Web」というタイプのアーカイブもありますが、Wayback Machineは自動アーカイブ・手動アーカイブの他いずれにも対応していることも特徴となっています。
Wayback Macineの価格
完全無料でご利用いただけます。
Wayback Machineのサイト情報
URL:https://archive.org
運営会社:Internet Archive
Wayback Machineの評判
レビューを書く | |
まだレビューはありません。最初のレビューを書いてみませんか?