自宅サーバーでApacheのログが増えてるな、と思ったら、「へびろぐ」のせいだった。じゃあアクセスが増えてるのか、というと、人間によるアクセスではなく、ロボットだった。
- 209.85.238.182 - - [01/Aug/2013:05:16:17 +0900] "GET /snakelog/show.php?path=./cam/13/07/24/1510_480p.jpg HTTP/1.1" 200 1510 "-" "DoCoMo/2.0 N905i(c100;TB;W24H16) (compatible; Googlebot-Mobile/2.1; +http://www.google.com/bot.html)"
とか、
- 119.235.237.19 - - [01/Aug/2013:05:10:19 +0900] "GET /snakelog/cam/13/07/10/0213_480p.jpg HTTP/1.1" 200 18690 "-" "Yeti/1.0 (NHN Corp.; http://help.naver.com/robots/)"
みたいなのが記録に残る。前者がGoogleによるもので、後者はNaverだ。へびろぐでは、1分に1ページのスピードでページが追加され、画像も追加される。そのため、頻繁にロボットが巡回してくるらしい。Googleのログだけで一週間に17000行、Naverの方は3000行分くらい。別にGoogleとNaverのロボットが無駄足を踏もうが構わんのだが、うちのサーバーに大量のログが残ってしまうこともあり、対策することにした。単純にrobots.txtを追加して、URLへの引数付与で自動生成されるページについては巡回を禁止した。
Post a Comment