「該当のドメインで運用されていた、過去のサイトを復元させたい」。この場合、普通は運用されていたドメインで公開されていたサーバー上の情報が必要です。 しかし、 SEO目的で他社が運用していた中古ドメインを取得した場合や、何らかの事情でサーバー情報を復元できない場合には、過去にサーバーであげられていた情報を参照することはできません。
このような場合、該当ドメインで過去に公開されていたスクリーンショットをWeb魚拓サービスから確認し、それらの情報からリバースエンジニアリングの形で過去サイトを再現する、という力技を行使せざるを得ません。
しかし、このようなリバースエンジニアリングは工数もコストも膨大なものがかかります。
そこで、Web魚拓の過去データから「自動で」静的なWebサイトの形、あるいはWordPressに対応した形でWebサイトを復元してくれるサービスを見つけました。 概要と触ってみた所感をご共有します。
目次:
Web魚拓の過去データからスクレイピングし、取得したデータで復元してくれるサービス
Wayback Machine DownloaderでWeb魚拓アーカイブをサイト丸ごと復元
Wayback Machine: Internet ArchiveのWeb魚拓過去データからスクレイピングし、取得したデータで復元してくれるサービスというものが存在します。
その名も、”Wayback Machine Downloader”。価格も1ドメインにつき$15〜と、非常にお手頃。
後に紹介するオプションで、WordPressに対応させたデータで復元させることが可能です。
Wayback Machine Downloader - $11/whole domain - Free Trial
Wayback Machine Downloaderで魚拓からサイト復元ができる仕組み
Wayback Machine Downloaderの仕組みとしては、Wayback Machineで指定した日付の過去データをスクレイピング。指定したURLおよびXMLサイトマップからサイト全体のページのをスクレイピングしているようです。
スクレイピングされたデータからHTMLファイルが出力されます。
オプションで、WordPress形式のデータへ変換させることが可能。WordPressがインストールされた形で復元させることが可能です。
ただし、WordPress形式の復元の場合、復元されたページはすべて固定ページとして復元されるため注意が必要です。
その後に「投稿」として新しく記事を追加させたい場合、テーマ(Wayback Machine Downloaderというテーマがインストールされます)を調整してアーカイブ部分を出力させる作業が必要になります。
具体的な流れと、復元し取得したファイルの公開のためのサーバーへの設置方法が書かれています。
Restore a Website From The Web Archive - Wayback Machine Downloader
WordPress形式で復元させた場合には、公開サーバーにApacheが導入されていることが要件になります。Nginx等のWebサーバーでないことを確認のうえ実施してください。
私はWordPress形式での復元先サーバーにエックスサーバーを選択しましたが、エックスサーバーの内部で実質的に動いているのはApacheのため、無事に復元させることができまし。
Wayback Machine Downloaderの価格
Wayback Machine Downloaderの価格表はこのとおり。
Wayback Machine Downloader Pricing
左の$15プランは1ドメインをHTMLの形で復元するもの。
中央の+$60プランは復元したサイトをWordPress形式で復元してくれます。
メニューやフッターの部分もWordPressに適応させた形で復元してくれます。
全体の金額としては、通常の復元$15に加える形でプラス$60、合計で$75かかります。
無料のデモページでサイト復元を体験
以下のデモページにて、無料で復元を体験できます。
Free Demo - Wayback Machine Downloader
復元時のSEOオプションが充実
$15の単一ドメインのプランで復元をする場合。
復元時のオプションがなかなか充実しており、たとえば下記のようなことが可能です。
- 壊れたイメージは除去
- Google Analyticsコードを除去
- 広告コードを除去
- XMLサイトマップを生成
- 404エラーページをすべてホームページ(TOP)に設置
Wayback Machine Downloaderで実際にサイト復元させる場合の具体的な手順と方法
Wayback Machine Downloaderを利用して、WordPress形式で具体的にサイト復元を実行してみました。
復元先としてはエックスサーバーを利用。その時の復元・公開までの具体的な手順を Wayback Machine DownloaderでWordPressサイトを復元させる方法と手順 で紹介しています。
この記事の気になった箇所を読み返す:
Category: 便利サービス