• ベストアンサー

XHTML1.0strictで検索にかかりたく無い時の記述は?

以前書いていたHTMLサイトをXHTML1.0strictまたは、 XHTML1.1に変更しようとしています。 友達と内輪なサイトを作って、パソコンの勉強に使って いるので、検索にかかりたくないと思い、 <meta name="robots" content="noindex,nofollow" /> を記述しようとしたのですが、非推奨だと気付きました。 この場合、どのような方法が望ましいのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
noname#18096
noname#18096
回答No.3

> robots.txtだとディレクトリにダミーのindex.htmlを置いた方が気持ち悪くないですよね? robots.txt はクロールを制御するための機構なので、index.html を置くか否かとは関係ないと思います。 robots.txt を見ない検索エンジンもあるかもしれませんが、対応している検索エンジンのためにもrobots.txtを置いた方が良いのではないでしょうか。 robots.txt 未対応の検索エンジンについては、その後に考えても遅くはないと思います。 > ところで、それ以外の選択肢ってありますか? 私もそれほど詳しくはないのですが、検索エンジンの仕様は各検索エンジンのヘルプを参照するのが一番良いかと思います。 ウェブマスター向けヘルプ センター - Google のインデックスからコンテンツを削除するには、どうすればよいですか。 http://www.google.co.jp/support/webmasters/bin/answer.py?answer=35301 Yahoo! ヘルプ - サイト管理者向け http://help.yahoo.co.jp/help/jp/search/indexing/indexing-12.html GoogleとYahooでは、robots.txt に対応しているようですね。 Googleヘルプの「ウェブ サイト全体を削除する」にもありますが、robots.txt に以下の記述を置くことでWebサイト内の全コンテンツのクロールを拒否することが出来ます。 User-agent: * Disallow: / その他にも、様々な検索エンジンのヘルプを見て、インデックスに含めない方法を探されてはどうでしょうか。

epi_chan
質問者

お礼

なるほど! 検索エンジンのヘルプとは思いつきませんでした。 (お恥ずかしい;;) 検索エンジンのみならず、それを利用する側に立って 調査してみれば、色々と気付くことがありそうです。 早速調べてみます。 有り難うございました。

すると、全ての回答が全文表示されます。

その他の回答 (2)

回答No.2

noindexなどの値は厳格な非推奨では無いと思うので現在の状況ではこれらを使うしかないと思われます。 W3Cのバリデーションサービスでソースを検証しても「Valid XHTML」で返ってくるので一応正しい文法と見て良いのではと私は思います。 下のソースで調べてみました。 <?xml version="1.0" encoding="Shift_JIS" ?> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ja"> <head> <meta name="robots" content="noindex,nofollow" /> <title>test</title> </head> <body> <p>test</p> </body> </html> もう一つ <?xml version="1.0" encoding="Shift_JIS" ?> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ja" lang="ja"> <head> <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS" /> <meta name="robots" content="noindex,nofollow" /> <title>test</title> </head> <body> <p>test</p> </body> </html> 使ったバリデーターはW3Cのサービスです。 http://validator.w3.org/

参考URL:
http://validator.w3.org/
epi_chan
質問者

お礼

有り難うございます。 私はいつもHTML-lintのお世話になっているのですが、 strictにこだわりすぎていたかもしれません;; 書いておいて不具合が生じるカテゴリでは無いように 思われますから、変更しようとしていた、 <meta name="robots" content="noindex,nofollow" /> を残して、更にrobots.txtも加えておくのが良いような 気がしてきました。 CGIでディレクトリにアクセス制限をかけるので多分、 拾われることに心配は無いような気もしつつサイトの目的がパソコンやWEBの勉強なものですから、 納得できる解決をしたいと頑張って調べています。 (内容も大した事無いので、事象として他に手段が無いと 判明すれば、それで満足ともいえます^^;) テストしてくださって、有り難うございました。

すると、全ての回答が全文表示されます。
noname#18096
noname#18096
回答No.1

robots.txt を使えば良いのではないでしょうか。

参考URL:
http://www.google.co.jp/search?ie=euc-jp&lr=lang_ja&num=30&q=robots.txt
epi_chan
質問者

お礼

早速有り難うございます。 robots.txtだとディレクトリにダミーのindex.htmlを 置いた方が気持ち悪くないですよね? 以前「おまじない程度にしか効かないよ」と教わったので 選択肢に入れていなかったのですが、検討してみます! ところで、それ以外の選択肢ってありますか? (すみません。robots.txtが嫌だと言う訳ではなくて、 他にもあるなら、知っておきたくて。) *認証などの有料サーヴィスは検討外です。 引き続き、よろしくお願いします。

すると、全ての回答が全文表示されます。

関連するQ&A