【悪質】archive.todayのアーカイブ作成を拒否する方法
作成日時 2023/09/29 20:35
最終更新 2023/09/29 20:55
最終更新 2023/09/29 20:55
まず初めに
ほぼ100%、アーカイブ削除の申請を受け付けない。 robots.txtやrobotsタグの設定によらず、サーバー運営者の意思を無視してアーカイブを作成する。 生成されたアーカイブページは、検索エンジンにインデックスされる。
アーカイブ作成を拒否する方法
結果

archive.todayは、Webアーカイブを簡単に誰でも作成できるサービスです。
Webサイトの過去の状態を記録しておきたい場合や、消えてしまったサイトを閲覧したい場合などに活用できます。
しかし、このサービスはweb.archive.orgなどの他のWebアーカイバーとは異なり、以下のような特徴があります。
一つ目と二つ目の特徴は「情報の保存」という観点から保護されるべきではあるものの、3つ目の特徴はサイト運営者からすると迷惑な話です(アクセス数を奪われてしまうため)。
そこで、本記事ではarchive.todayによるアーカイブ作成を拒否する方法をご紹介させて頂きます。
アーカイブ作成を拒否する方法
archive.todayは、しばしばサーバーのIPアドレスを変更したりドメインを移動したりするため、クローラーのIPアドレスをリスト化して拒否することは困難です。
そこで、archive.todayを拒否するためのスクリプト「archive-today.blocker.js」をサイトに導入することにより、自動で弾くことができます。
利用方法は簡単で、サイトのHTMLソースコードに以下の行を追加して下さい(headタグ内がオススメです)。
<script src="https://code.activetk.jp/archive-today.blocker.js" defer></script>
結果
上記のスクリプトを導入したサイトをアーカイブしようとすると、以下のような画面となります。

このように、サイトが表示される代わりにメッセージが表示されるようになります。