<<  このカテゴリ内の前の記事 Google AdSense に申し込んでみた  ||   このカテゴリ内の次の記事MODx でGoogleMap を表示するための準備 >>

るるろぐ 2008 新着記事

この記事1件を表示

robots.txt で検索エンジンをブロックする

直前の記事「RewriteRule でリダイレクトする」でサイトのURLを変更した後、以前のURLにアクセスされても、not found がかえらないよう、新しいURLにリダイレクトする方法を書いた。

しかし、このままだと、以前のURLも検索エンジンから見ると生きたURLとなる(らしい)。以前の「http://www.liolion.info/Mx/」以下にアクセスしても、リダイレクトされ新しいURL「http://www.liolion.info/modx/」にたどり着くためだ。

実際、「/Mx」以下の削除依頼をしたのだが、それが拒否されてしまった(つまり生きているURLと認識されたため)。このままだと、やがて登録インデックスが多重になってしまう(と思うんだけど)。

ということで、「robots.txt」っつうのを書いて、「/Mx」以下はインデックスされないようにする。

Google のウェブマスターツールにログインすると、「robots.txt」を試せる機能がある。内容を書いて、実際にどういうふうに影響するかを試せるツールだ。

「診断」>「robots.txt」と進むとすでに「robots.txt」が存在するなら、その内容を表示する。この枠の中に、試したい内容を書いても、実際に自分のサイトにアップロードしている「robots.txt」には影響を与えない。つまり、内容を事前に試せるわけだ。

例えば、うちのばあい、「http://www.liolion.info/Mx」以下はすべてインデックスして欲しくないので、以下のように書く。

User-agent: Googlebot
Disallow: /Mx

「google」 だけでなく、他もブロックしたい場合は以下のように書く。

User-agent: *
Disallow: /Mx

そして、その下の枠には、登録URLが表示されているから、ここに実際にブロックしたい(つうか、robots.txtを作用させたい)URLを書いて「テスト」をクリック。つまりこんな風に

http://www.liolion.info/Mx/

すると下の方にメッセージがでる

2 行 ブロック : Disallow: /Mx

もし、ブロックされていないURLならば以下のようになる

許可済み

これで以前のURL「http://www.liolion.info/Mx」がインデックスされることを避けられる。

Googleの説明は以下に

Block or remove pages using a robots.txt file

追記

MODxでフレンドリURLにした場合「/index.php?id=54」などの形式のURLをインデックスに登録さないためには以下を追記する

Disallow: /index.php?*

関連記事:MODxでフレンドリURLをONにしたらrobots.txtを設置する

コメントを書く

コメントの掲載は、管理者の承認が必要な場合があります。すぐに掲載されない場合は、少しお待ち下さい。また、内容によっては掲載しない場合、掲載後、削除する場合もございます。ご了承下さい。

 必須

 必須


トラックバック

このエントリーのトラックバックURL:

http://www.liolion.info/MovT/LULUL/mt-tbon.cgi/717

都合により、上記URLの「mt-tbon.cgi」は、全角で表示しています。TBの際は、恐れ入りますが、半角に直して送信してください。

またこのブログは、トラックバックを受け付けても、それがすぐに反映されない仕組みになっています。管理者が確認後、公開しますので、少しお待ち下さい。尚、内容によっては、公開しない場合もあります。ご了承下さい。また内容に問題がないと思えるのに、いつまで経っても公開されない場合は、なんらかの事情で、pingが届いていない可能性があります。よろしければ再度送信してください(このブログに関してコメントをする?)。

MODx本出版

ここからカテゴリ一覧、記事一覧を表示

CATEGORY

RSS1.0 RSS2.0