※ ChatGPTを利用し、要約された質問です(原文:検索エンジンロボットを制御する)
検索エンジンロボットの制御方法とは?
このQ&Aのポイント
マンションの住人以外の閲覧を避けるために、ロボット検索を回避しようと思っています。
ロボットの閲覧を制限するためには、robots.txtファイルをルートに配置することが推奨されています。
しかし、ルートに複数のhtmlファイルが存在する場合や.htmlファイルと.htmファイルが混在している場合には注意が必要です。
マンションの住人以外の閲覧を避けるために、ロボット検索を回避しようと思っています。そのために、http://tech.bayashi.net/pdmemo/robots.htmlを見ていますが、ルートにrobots.txtファイル
User-Agent: *
Disallow: /cgi-bin/
Disallow: /example.html
を置くことが推奨されています。そこで質問です。
(1)上記 example.html の"example"は固定の名前ですか?それともトップページの名前(例:index.html)に置き換えるのですか?
(2)ルートに複数の html ファイルが存在する場合、robots.txt の内容は変えるのですか?
(3)上記(2)で、ルートに .html ファイルと .htm ファイルが混在している場合はどうですか?
以上、よろしくお願いします。
お礼
ご教示有り難うございます。早速試行してみます。 万能でないことにつきましては、マンション住人を対象とする内容であり、あまり厳密さは必要としておりません。
補足
今日現在、まだロボットの巡回に会っていないようで、効果は得られていませんが、2週間が経ちました(OKWaveスタッフから忠告あり)ので、閉め切りさせていただきます。