ActiveTK's Note

【悪質】archive.todayのアーカイブ作成を拒否する方法


作成日時 2023/09/29 20:35
最終更新 2023/09/29 20:55


  • まず初めに
  • アーカイブ作成を拒否する方法
  • 結果

  • まず初めに

    archive.todayは、Webアーカイブを簡単に誰でも作成できるサービスです。

    Webサイトの過去の状態を記録しておきたい場合や、消えてしまったサイトを閲覧したい場合などに活用できます。

    しかし、このサービスはweb.archive.orgなどの他のWebアーカイバーとは異なり、以下のような特徴があります。

  • ほぼ100%、アーカイブ削除の申請を受け付けない。
  • robots.txtやrobotsタグの設定によらず、サーバー運営者の意思を無視してアーカイブを作成する。
  • 生成されたアーカイブページは、検索エンジンにインデックスされる。

  • 一つ目と二つ目の特徴は「情報の保存」という観点から保護されるべきではあるものの、3つ目の特徴はサイト運営者からすると迷惑な話です(アクセス数を奪われてしまうため)。

    そこで、本記事ではarchive.todayによるアーカイブ作成を拒否する方法をご紹介させて頂きます。


    アーカイブ作成を拒否する方法

    archive.todayは、しばしばサーバーのIPアドレスを変更したりドメインを移動したりするため、クローラーのIPアドレスをリスト化して拒否することは困難です。

    そこで、archive.todayを拒否するためのスクリプト「archive-today.blocker.js」をサイトに導入することにより、自動で弾くことができます。

    利用方法は簡単で、サイトのHTMLソースコードに以下の行を追加して下さい(headタグ内がオススメです)。

    <script src="https://code.activetk.jp/archive-today.blocker.js" defer></script>

    結果

    上記のスクリプトを導入したサイトをアーカイブしようとすると、以下のような画面となります。


    このように、サイトが表示される代わりにメッセージが表示されるようになります。