※ ChatGPTを利用し、要約された質問です(原文:クローラーbotに別コンテンツ提供)
クローラーbotに別コンテンツ提供
このQ&Aのポイント
New York Timesのように記事全文を読むにはログインが必要だが、クローラには記事全文を提供してもらっているケースがある。
一つの方法として、ユーザーエージェントを見てクローラーなら記事全文表示するという方法があるが、ユーザーエージェントを偽れば記事全文を読めてしまう可能性がある。
クローラーのIPアドレス一覧を提供するという方法もあるかもしれない。
http://web-tan.forum.impressrd.jp/e/2009/06/02/5403
上記ページに
-----------------------------------------
「New York Times」のように記事全文を読むにはログインが必要だが、クローラには記事全文を提供することでインデックスしてもらい、数百万もの記事の検索性を確保したケース
-----------------------------------------
とありますが、これはどのようにして実現したら良いでしょうか?
ユーザーエージェントを見てクローラーなら記事全文表示という方法が思いつきますが、この方法ではユーザーエージェントを偽れば記事全文読めてしまうようになってしまいます。
クローラーのIPアドレス一覧とか提供されてたりするんでしょうか?
お礼
なるほどー ドメインを引いて正当性チェクですね