Tips

Wayback Machine にサイトを保存させない

投稿日:

robots.txt ファイルとは? にも書いたのですが、Wayback Machine というサイトがあります。

Wayback Machine
Wayback Machine

Wayback Machine は、世界中のウェブサイトをクロールして保存し、誰でもが保存されたサイトを検索して見ることができるようになっているサービスです。1つのウェブサイトに対して、期間をおいて何度も保存するため、時系列で複数時期の姿を見ることができます(1つのウェブサイトの全てのページが保存されるわけではありません)。

これはこれで便利な面もあるのですが、自分が運営するサイトが勝手に保存されていつまでも見られるようになっていることを気持ちが悪いと思う人もいるのではないでしょうか?

しかも、保存されたページを削除させるには、削除依頼を出す必要があり結構な手間が掛かります。この点において、悪質なサービスである印象も強いです。(Google もやっていることはほとんど同じなのですが、削除方法がきちんと用意されています)

ということで、Wayback Machine に自分のウェブサイトを保存させたく場合は、新しくウェブサイトを作成した時点で robots.txt ファイルに以下を記述しておくことをお勧めします。

User-agent: ia_archiver
Disallow: /

robots.txt ファイルについては、以下のページを参照してください。

robots.txt ファイルとは?

2018.05.24

-Tips

執筆者:fitallright

関連記事

Webサイトで絵文字を使う

Webサイトに絵文字を使う方法について説明します。 目次1. 絵文字を探す2. HTML内で絵文字を使う2つの方法1. 絵文字をそのままコピー&ペーストする方法2. 数値文字参照を使う方法3. Wor …

お値打ちなドメイン

お得なドメイン(各料金がおよそ 1,500円以下のドメイン)とその料金を表にしてみました。 この表には エックスドメイン の料金を記載していますが、「どのドメインがお得か?」という点に関しては、他のド …

WordPress のウィジェットに、特定のカテゴリの「最近の投稿」を表示する方法

WordPress において、特定のカテゴリ内の「最近の投稿」をウィジェットに表示する方法をご紹介します。 目次WordPress のウィジェットとは?手順設定方法TitleFilterPost de …

WordPress に Font Awesome 5 を導入する方法

WordPress に Font Awesome 5 を導入する方法について説明します。 目次1. はじめに本ページで説明する方法について2. 導入手順「SVG with JS」の導入手順「Web F …

【エックスサーバー】サイトを編集する時は、mod_pagespeed をオフにしましょう

2019年3月27日:「mod_pagespeed設定」機能の新規設定の受付が終了しました。 「mod_pagespeed設定」機能の新規設定の受付終了について – 2019/03/27 …

ロリポップ!「スタンダードプラン」
さくらのレンタルサーバ「スタンダードプラン」