Es gab eine Zeit, da haben die WBBler geflucht, ihre Forum Seiten wurden kaum oder gar nicht indexiert. Der Grund, Session IDs. Session IDs sind nummern die hinter die URL angehängt werden und die Cookies ersetzen. Das Problem für Suchmaschinen, eine Seite ist über unendlich viele URLs, dank der Session ID, erreichbar.
Bsp. Index.html&sid= 32ea94cb34859332240346d3d…
Nun lese ich auf Suchmaschinen News das Google Seiten mit Session IDs gerade ganz toll findet und diese fleißig in den Index schaufelt. Das Problem dabei, es entstehen unendlich viele Doppel Content Seiten. Es sieht zwar toll aus, wenn man mit der site: Abfrage 3 Mal so viele Seiten im Google Index hat, aber dies Seite landet dann bei den Suchmaschinen Ergebnissen (SERPs) ganz weit hinten.
Um die Aufnahme von Links mit einer Session ID soll folgender Code ganz oben in der htaccess helfen.
php_flag session.use_trans_sid off
Wenn das nicht funktioniert dann sollte folgende htaccess Rule greifen
RewriteCond %{QUERY_STRING} Session ID NameRewriteCond %{HTTP_USER_AGENT} GooglebotRewriteRule .* http://%{HTTP_HOST}/? [R=301]
Session ID Name muss durch die entsprechende Session ID ersetzt werden. Die 301 Weiterleitung, leitet dann alles auf die Startseite um. Beim Wbb würde so eine Weiterleitung müsste dann so aussehen
RewriteCond %{QUERY_STRING} sid=[0-9]+RewriteCond %{HTTP_USER_AGENT} GooglebotRewriteRule .* http://%{HTTP_HOST}/? [R=301]
- Suchen mit Hindernissen – Wie eine Fehlermeldung sich nicht finden lassen will
Computer Probleme zu lösen ist dank Google um einiges leichter geworden. Im Normalfall reicht es die Fehlermeldung 1:1 in Google einzugeben und dann die Ergebnisse... - Google Analytics ändert Session tracking
Google hat die Bedingungen zur Erfassung der einzelnen Session aktualisiert. Wie Google in seinem Google Analytics Blog erklärt, werden die Google Analytics Daten in Zukunft... - Wieviele Seiten befinden sich im Google Index?
Der Site: Befehl liefert bekanntlich ziemlich ungenaue Seitenanzahlen, zum Glück gibt es ja die Google Webmaster Tools die nicht nur darüber informieren wie viele Seiten... - Google Index aufräumen
Geht man davon aus das die Ressourcen die Google seinen Googlebot zur Verfügung stellt endlich sind, ist es nur eine logische Schlussfolgerung das jede Webseite...


März 15th, 2007 at 13:37
Hallo,
mit folgendem PHP-Code funktioniert es auch:
if (!preg_match(‘/google/i’, $_SERVER[“HTTP_USER_AGENT“])) {
session_start();
}
Gruß Sven