Tips

Wayback Machine にサイトを保存させない

投稿日:

robots.txt ファイルとは? にも書いたのですが、Wayback Machine というサイトがあります。

Wayback Machine
Wayback Machine

Wayback Machine は、世界中のウェブサイトをクロールして保存し、誰でもが保存されたサイトを検索して見ることができるようになっているサービスです。1つのウェブサイトに対して、期間をおいて何度も保存するため、時系列で複数時期の姿を見ることができます(1つのウェブサイトの全てのページが保存されるわけではありません)。

これはこれで便利な面もあるのですが、自分が運営するサイトが勝手に保存されていつまでも見られるようになっていることを気持ちが悪いと思う人もいるのではないでしょうか?

しかも、保存されたページを削除させるには、削除依頼を出す必要があり結構な手間が掛かります。この点において、悪質なサービスである印象も強いです。(Google もやっていることはほとんど同じなのですが、削除方法がきちんと用意されています)

ということで、Wayback Machine に自分のウェブサイトを保存させたく場合は、新しくウェブサイトを作成した時点で robots.txt ファイルに以下を記述しておくことをお勧めします。

User-agent: ia_archiver
Disallow: /

robots.txt ファイルについては、以下のページを参照してください。

robots.txt ファイルとは?

2018.05.24

-Tips

執筆者:fitallright

関連記事

CodePen で書いたコードを自分のWebサイトに埋め込む方法

CodePen とは、Web上で HTML, CSS, JavaScript を書いてすぐに結果を表示することができるサービスです。 結果を確認しながら、コードを書いたり修正できるので、ちょっとしたW …

Webサイトで絵文字を使う

Webサイトに絵文字を使う方法について説明します。 目次1. 絵文字を探す2. HTML内で絵文字を使う2つの方法1. 絵文字をそのままコピー&ペーストする方法2. 数値文字参照を使う方法3. Wor …

レンタルサーバーにおけるデータ転送量とは?

レンタルサーバーの機能やスペックを見ていると「転送量の目安」といった項目を目にすることがあります。 ウェブサイトへのアクセスが少ないうちは、あまり気にする必要はない項目ではあるのですが、できれば、 レ …

エックスサーバーに WP-CLI を導入する

WordPress は優れた管理サイトが用意されているため、ほとんどの操作をここから行うことができます。 しかし、何らかの原因で管理サイトにアクセスができなくなった場合に備え、別の操作方法を用意してお …

エックスサーバーに Bolt (CMSツール)を設置する

エックスサーバーに Bolt という CMS を設置する手順を紹介します。 Bolt 自体の紹介というよりは、エックスサーバーのような共用レンタルサーバーに、CMS を設置する一つの方法(手順)を紹介 …

ロリポップ!「スタンダードプラン」
さくらのレンタルサーバ「スタンダードプラン」