パソコン・Windowsの便利な使い方やテクニック|パソコントラブル出張修理

検索エンジンに特定のWebページをインデックスさせない方法

TOP便利な使い方ホームページ作成 > 検索エンジンのインデックス制御

検索エンジンに特定のWebページをインデックスさせない方法

自分でブログやホームページを運営していて、検索エンジンにインデックスさせたくない特定のページがある場合や、 既にインデックスされているページを検索エンジンから削除したい場合があります。 ほとんどの検索エンジンは検索ロボットを使用してWebサイトをクロールして自動的にページをインデックスしています。 その検索ロボットに対して特定のページをインデックスさせないとか、 特定のページにあるリンクはフォローさせないようなリクエストをmetaタグでHTMLソース内に記述する事が可能です。 また、特定のディレクトリ内をすべてインデックスさせたくない場合は、 robots.txtというファイルをホームディレクトリに置く事で特定のディレクトリ毎インデックス拒否のリクエストも可能です。

但し、この記述をした場合でも、必ず制御できるというものではありません。代表的なgoogleなどではきちんと処理されるようですが、 中には無視される検索ロボットもあるかも知れません。特に一般にはアクセスされると困るような特定の会員サービスページのようなものは、 パスワードで保護するなどの対策が必要です。それでは検索ロボットのインデックスを制御する方法を解説します。

特定のページをインデックスさせたくない場合には、そのページのheadタグ内に以下の記述を入れます。
<meta name="robots" content="noindex, nofollow">

noindexはそのページ自体をインデックスさせない場合で、 nofollowはそのページ内にあるリンク先を辿らない(インデックスさせない)場合に記述します。

また、ページ内にある特定のリンク先だけインデックスさせたくない場合もあるかも知れません。 その場合はアンカータグにrel="nofollow"の記述を入れます。
<a href="www.sample.com/">リンク先</a> →リンク先がインデックスされる
<a href="www.sample.com/" rel="nofollow">リンク先</a> →リンク先はインデックスされない
※rel="nofollow"を使ったほうが良い具体例がGoogleヘルプに示されていますので参照して下さい。
特定のリンクに対して rel="nofollow" を使用する

それから、特定のディレクトリ毎インデックスさせたくない場合には、 ホームディレクトリに「robots.txt」というテキストファイルを置きます。 ホームディレクトリは、ドメインのルートディレクトリとなりますが、サブドメインでもOKです。 これ以外の例えばサブディレクトリなどに設置しても無視されます。
http://www.sample.com/robots.txt →有効 (ドメインのルートディレクトリの場合)
http://sub.sample.com/robots.txt →有効 (サブドメインの場合)
http://www.sample.com/sub/robots.txt →無効 (サブディレクトリの場合)

ファイル内には以下のように記述します。
User-agent: *
Disallow: /sample/sample.html
Disallow: /cgi-bin/

上記ではすべての検索ロボットに対して「sample/sample.html」と「cgi-bin」というディレクトリ内にある すべてのページのインデックスを拒否する設定となります。 User-agent は検索エンジンを指定する場合で、*はすべての検索エンジンに対して有効となります。 Disallow の後にインデックスさせたくないディレクトリを記入します。複数ある場合には1行ずつ記入します。

サイト全体のインデックスを拒否する場合は以下でOK
User-agent: *
Disallow: /

(2013年5月11日)

パソコントラブルの出張修理では、パソコンの故障や修理以外でもこのようなホームページなどの修正や作成も行っておりますのでお気軽にお問い合わせ下さい。
パソコントラブルの出張修理を依頼する

PC・インターネット・Windowsの便利な使い方やテクニックTOP


パソコントラブル出張修理 お問い合わせフォーム パソコントラブル出張修理の料金表 業務ソフト開発 アプリケーションソフト開発 ?