Dezember letzten Jahres hat Microsoft Live Search seinen neuen Spiderbot MSNbot 2.0b angekündigt und auf das Web losgelassen, aber bereits im Februar 2009 meldete einige webmaster world User Probleme mit dem MSNbot 2.0b. Dieser ignorierte nämlich die Robots.txt.

Die Antwort auf das warum findet man hier, dort heisst es in den Microsoft Forum

For some reason, msnbot/2.0b is visiting the wrong IP addresses to retrieve robots.txt. In other words, it THINKS it is getting robots.txt for www.yoursite.com, but it is really reading the robots.txt file that is served for the default host at the IP address for www.mysite.com (not necessarily www.mysite.com’s robots.txt). Clearly, msnbot/2.0b is using the wrong DNS lookup for its requests.

Microsoft ist das Problem bewusst und versucht es inzwischen zu fixen, leider erklärt das aber nicht wieso der MSNbot 2.0b auch den noindex Meta tag ignoriert und nach 7 Monaten immer noch Seiten im Index von Live Search vorhanden sind, die inzwischen alle via 301 auf die WordPress URLs weitergeleitet werden.

image thumb12 MSNbot 2.0b – ignoriert Robots.txt und noindex tag

Diese Seite sollte also laut meiner Angaben gar nicht mehr existieren…

via MSNbot 2.0b is ignoring robots.txt and No Index meta tags | Chewie.co.uk – Now with 100% less Wookie!


Tags: , , ,
  • Ihren XING-Kontakten zeigen
Ähnliche Beiträge:


Hinterlasse ein Kommentar