Interessantes Thema in den Google Groups, in dem ein Webmaster Google fragt warum seine Seite trotz ausschließlich englischen HTML Seiten als eine spanische Seite anerkannt wird. Google Mitarbeiter, JohnMu erklärt:

Looking at some of the pages indexed for your site, it appears that you have some PDFs in multiple languages.

I assume that some of the Spanish keywords can be found on pages like those. In general, PDFs like that can be a bit problematic as it’s nearly impossible to determine the language they’re in, which could result in the document ranking for an interesting mixture of keywords. If that’s ok with you, then you can certainly leave it — otherwise you could use your robots.txt file to prevent crawling of these files, making them drop out of the index over time.

Wie bitte? Ein paar PDFs in mehreren Sprachen, darunter auch Spanisch, lassen Google glauben, das die Seite auf Spanisch ist?

Ehrlich gesagt ist klingt das ein wenig komisch. Google liefert PDF Seiten wie HTML Seiten als Ergebnis und lässt sich von ein paar PDFs mit unterschiedlichen Sprachen verwirren?

Haben PDFs doch eine größere Bedeutung als bisher angenommen?

Via seroundtable.com


  • Ihren XING-Kontakten zeigen
Ähnliche Beiträge:


Eine Reaktion auf “PDFs verwirren Google”

  1. Das ist ja echt mal merkwürdig ;) Aber kann mir schon vorstellen, dass es sich bei den PDF Dokumente vielleicht um Contenreiche Dokumente handelt. Da muss man ja als Unternehmen echt aufpassen, welche Manuals man so online stellt :)

    Danke für den interessanten Post :)

Hinterlasse ein Kommentar