<< zurückInhaltsverzeichnisvor >>
 

Onlinehandbuch der Suchmaschinenoptimierung

Version 1 - 14.02.2006
Copyright - Johannes Siemers - internetmarketing-news.de

 

III. Indexierung und Indexierbarkeit

Es gibt verschiedene Wege die Indexierung von Webseiten für Suchmaschinen zu erleichtern bzw. unbeabsichtigt zu erschweren oder auch gar ganz zu verhindern. Daher zu diesem wichtigem Thema an dieser Stelle ein eigenes Kapitel. Einiges aus diesem Kapitel würde allerdings auch gut in das Kapitel zur Onpage-Optimierung passen.

Anmeldung und Aufnahme in den Index

Sollte eine Webseite von einer Suchmaschine noch gar nicht indexiert worden sein, besteht die Möglichkeit diese dort anzumelden. (Link zur Anmeldung bei Google). Davon kann man durchaus Gebrauch machen. Bis Google dann die Seite wirklich indexiert wird aber einige Zeit vergehen und dann wird sich auch erstmal nur die Startseite wiederfinden. Wichtiger ist das andere Webseiten Links auf ihre Webseite setzen. So kann Google auch ganz ohne Anmeldung ihre Webseite entdecken und indexieren. Außerdem wird Google ihre Seite durch die eingehenden Links als wichtiger einstufen und schneller die komplette Webseite in seinen Index aufnehmen. Natürlich kann man auch die Seite anmelden und gleichzeitig anfangen eingehende Links zu sammeln. Sollte ihre Seite erstmals in Google auftauchen und dann nach kurzer Zeit wieder aus den Suchergebnissen verschwinden, ist dies kein Grund zur Beunruhigung. Google hat weltweit mehrere Datencenter und es dauert etwas bis alle Datencenter ihre Seite beinhalten. Je nachdem welches Datencenter sie abfragen ist ihre Seite dann schon im Index zu finden oder auch noch nicht.

Nachdem Google erstmals eine Seite ihrer Domain bekannt ist wird der Googlebot den Links von dieser Seite aus folgen und diese Seiten ebenfalls in seinen Suchindex aufnehmen. Von diesen Seiten geht es dann wiederum weiter bis schließlich die komplette Webseite indexiert wurde. Je mehr Webseiten auf ihre Webseite verlinken je wichtiger wird Google ihre Seite einstufen und entsprechend schneller wird ihre komplette Seite von Google aufgenommen werden. Sollten sie sehr wenige eingehende Links haben, aber über eine sehr große Webseite mit mehreren tausend Seiten verfügen wird Google möglicherweise nicht alle Seiten in seinen Index aufnehmen. Sie sollten dann für mehr eingehende Links sorgen.

Navigation

Bei der Planung ihrer Navigation haben sie ebenfalls die Möglichkeit Google die Indexierung zu vereinfachen oder auch unabsichtlich zu erschweren. In diesem Zusammenhang sind auch vorgeschaltete Startseiten die zum Beispiel ein „nerviges“ Flash-Intro enthalten zu vermeiden. Wenn man darauf keinesfalls verzichten möchte sollten von der Startseite aus zumindest Links auf die wichtigsten Navigationspunkte gesetzt werden. In den meisten Fällen ist es selbst bei sehr großen Projekten mit tausenden Seiten noch möglich mit 3 oder maximal 4 Klicks jede Unterseite von der Startseite aus zu erreichen. Um das wichtige Thema Navigationsdesign noch etwas praktischer zu besprechen hier ein Beispiel einer optimal aufgebauten Baumstruktur:

  • Startseite
    • Auto
      • Volkswagen
        • Passat
        • Golf
        • Polo
      • BMW
      • Mercedes
      • Ferrari
    • LKW
    • Bus
    • Motorrad
In der ersten Navigationsebene unterhalb der Startseite befinden sich die Punkte „Auto“, „LKW“, „Bus“ und „Motorrad“. Von diesen Navigationsebenen geht es auf eine weitere Navigationsebene weiter. Im Beispiel hat zum Beispiel der Navigationspunkt "Auto" eine weitere Unternavigationsebene bestehend aus den Automarken „Volkswagen“, „BMW“, „Mercedes“ und „Ferrari“. Von dieser Unternavigation wird schließlich auf die Unterseiten der einzelnen Modelle gelinkt. Für Volkswagen wären das zum Beispiel Passat, Golf und Polo. So wie die obige Navigation aussieht könnte man natürlich auf jeder Seite die komplette Navigation öffnen. In Wirklichkeit hat die Navigation natürlich noch sehr viel mehr Punkte und enthält zum Beispiel 20 Automarken, 10 LKW-Marken, 3 Busmarken und 10 Motorrad-Marken. Und schon hat man eine prall gefüllte zweite Navigationsebene. Wie also vorgehen? Von der Startseite aus würde ich auf jeden Fall die 4 Hauptnavigationspunkte verlinken. Außerdem bietet es sich an die wichtigsten Navigationsunterpunkte aus der zweiten und dritten Ebene von der Startseite aus zu verlinken. Begibt sich nun der Surfer auf den Navigationspunkt Auto (gelb markiert) werden die verschiedenen Automarken ebenfalls in der Navigation angezeigt. Die Navigation würde sich dann wie folgt darstellen:

  • Startseite
    • Auto
      • Volkswagen
      • BMW
      • Mercedes
      • Ferrari
    • LKW
    • Bus
    • Motorrad
Klickt sich der Surfer von hier aus weiter in den Navigationspunkt Volkswagen könnte sich die Navigation folgendermaßen ändern:

  • Startseite
    • Auto
      • Volkswagen
        • Passat
        • Golf
        • Polo
    • LKW
    • Bus
    • Motorrad
Alternativ wäre es aber auch möglich die Automarken wie in der ersten Baumstruktur weiterhin geöffnet zu halten. Dies würde ich davon abhängig machen wieviele Modelle sich im Durchschnitt in den Unterpunkten wiederfinden. Schließlich sollte neben der Suchmaschinenoptimierung natürlich auch das Design für den Besucher noch stimmig sein und nicht mit der Navigation überfrachtet werden. Wenn der Besucher nun den Navigationspunkt „Passat“ auswählt ergeben sich wiederum verschiedene Möglichkeiten der Gestaltung. Ich würde in jedem Fall die 1. Navigationsebene geöffnet lassen und auch der Navigationspunkt „Volkswagen“ sollte weiterhin geöffnet bleiben.

Ich persönlich nutze auch immer gerne zusätzlich noch die Breadcrumb-Navigation (zu deutsch Brotkrümmelnavigation). Hier ein Beispiel von Yahoo:

Dadurch verbessert sich die interne Linkstruktur noch einmal und die Links können für die Platzierung von Keywords in diesen internen Links genutzt werden. Dazu aber später mehr.

Sitemap

Sollte sich die Gestaltung einer schlanken Navigation sehr schwierig gestalten bietet sich die Nutzung einer Sitemap an um die Anzahl der Ebenen zu reduzieren. Verlinkt man die Sitemap von der Startseite aus und integriert man in die Sitemap die Navigationspunkte der dritten Ebene reduziert man die notwendigen Klicks zum erreichen dieser Ebene um einen Klick von drei auf zwei Klicks. Außerdem können innerhalb der Sitemap auch optimierte Linktexte genutzt werden. Natürlich werden Sitemaps teilweise auch von Surfern zur Orientierung genutzt. Meiner Erfahrung nach ist die Zahl der Sitemap-Nutzer aber vernachlässigbar klein.

Bei besonders großen Webseiten wird man aber natürlich auch mit der Sitemap Probleme bekommen. In diesen Fällen wird man auch die Sitemap unterteilen müssen und zum Beispiel von der Haupt-Sitemap auf weitere Unterseiten-Sitemaps verlinken müssen. Reichen auch diese Unterseiten-Sitemaps nicht aus kann man von hier über eine Seitenavigation beliebig viele Sitemaps einbinden. Hier als kleines Beispiel:

Als Richtwert würde ich pro Sitemap etwa 100 bis maximal 150 Links empfehlen.

Um an dieser Stelle noch einmal auf das obige Beispiel zum Navigationsdesign zurückzukommen. In diesem konkreten Fall sollte die Sitemap zumindest die 20 Automarken, 10 LKW-Marken, 3 Busmarken und 10 Motorrad-Marken beinhalten. Da diese aber von der Startseite aus bereits mit einem Klick erreichbar sind wäre damit nicht viel gewonnen. Interessanter wäre es natürlich die Modelle von der Sitemap aus zu verlinken. Damit hätte die Sitemap hier eine Navigationsebene eingespart. Mit den Marken beinhaltet ihre Sitemap allerdings bereits 43 Links. Gehen wir mal davon aus, dass auf jede Marke im Schnitt 10 Modelle kommen sind es also insgesamt 430 Modelle. Zuviel für eine Sitemap. Eine Idee wäre es sich in der Sitemap auf die 100 wichtigsten Modelle zu beschränken oder aber wie im obigen Beispiel mit einer Seitennavigation zu arbeiten.

Bei meiner Beispielnavigation bin ich außerdem davon ausgegangen das die einzelnen Automodelle keine weiteren Unterseiten haben. Sollten diese weitere Unterseiten und somit eine weitere Navigationsebene besitzen bietet sich eine Optimierung über die Sitemap an - ein mögliches Beispiel findet sich im obigen Bild wieder.

Session

Ein absolutes „SEO-NONO“ sind Sessions. Hiermit haben Suchmaschinen und insbesondere auch Google Riesenprobleme. Da den Suchmaschinenrobots bei jedem Besuch eine andere Session-ID und somit verschiedene Urls zugewiesen werden findet die Suchmaschine immer andere verlinkende Urls vor. Trotzdem gibt es viele Webseiten für die Sessions unverzichtbar sind, z.B. Foren. Die Lösung ist es, dem Googlebot und den anderen Suchmaschinenrobots keine Session-ID zu geben. So schickt der Googlebot bei jedem Seitenaufruf eine Kennung mit, auch Useragent genannt. Im Fall von Google enthält diese immer die Zeichenkette „Googlebot“. Mit zum Beispiel PHP kann man die Useragent-Kennung einfach auf diese Zeichenkette überprüfen und das Starten der Session so verhindern. Beispiel:

<?php
if (!eregi('googlebot', $_SERVER(“HTTP_USER_AGENT“))) {
SESSION_start();
}
?>

Ist man auf dem deutschen Markt tätig wird man wahrscheinlich aber auch Yahoo und MSN keine Steine in den Weg legen wollen. Der Start der Session könnte dann folgendermaßen gestaltet werden:

<?php
if (eregi("Googlebot",$_SERVER[HTTP_USER_AGENT]));
else if (eregi("MSNbot",$_SERVER[HTTP_USER_AGENT]));
else if (eregi("slurp",$_SERVER[HTTP_USER_AGENT]));
else session_start();
?>

Frames

Auf die Nutzung von Frames sollte bei der Gestaltung einer Website verzichtet werden. Aus SEO-Sicht bringen sie nur Probleme und Arbeit mit sich und heutige Technologien machen Frames absolut überflüssig. Sollte ihre Seite Frames benutzen ist es zwar möglich diese trotzdem zu optimieren, in den meisten Fällen halte ich es aber dann für ratsamer die Seite zu überarbeiten und auf Frames zu verzichten. Da ich selber das letzte Mal im vergangenen Jahrtausend Frames benutzt habe kann ich dazu an dieser Stelle aber auch keine guten Optimierungsratschäge geben. Ich empfehle daher die Konsultation eines SEO-Forums.

Google Sitemap

Die Google Sitemap ist eine Möglichkeit Google über neue Seiten oder auf die Aktualisierung bestehender Seiten aufmerksam zu machen. Bisher beobachte ich Google Sitemaps nur interessiert. Für mich selber sehe ich darin bisher keinen wirklichen Nutzen. Google stellt zur Funktionsweise der Sitemap umfangreiche Informationen zur Verfügung, außerdem gibt es einen englischsprachigen offiziellen Google-Blog zur Google Sitemap. Sie können Google damit über Urls, die Änderungshäufigkeit dieser Urls von „always“ bis „never“ und die Priorität dieser Url im Vergleich zu den anderen Urls ihrer Website informieren. Interessanter finde ich die mittlerweile von Google im Rahmen von Google Sitemap bereitgestellten Statistiken. Nachdem sie ihre Webseite freigeschaltet haben sind verschiedene Statistiken verfügbar. Insbesondere auch die Übersichten zu Fehlern bei der Indexierung könnten ihnen dabei helfen Fehler in ihrer Webseite zu entdecken. Insofern würde ich schon dazu raten sich einmal bei Google Sitemaps anzumelden um auf diese Daten gelegentlich einen Blick werfen zu können. Ansonsten dürfte es nicht Schaden bei Problemen mit der Indexierung ihrer kompletten Webseite durch Google zu versuchen Google mit Hilfe von Google Sitemap auf die Sprünge zu helfen.

Javascript

Es gibt verschiedene Technologien die Google bei der Indexierung größere Probleme bereiten können. Javascript ist eine davon. Es gibt zwar mittlerweile von Google Bestrebungen auch Javascript zu verstehen, sonderlich weit ist man damit aber bisher noch nicht gekommen. Dies liegt wohl auch daran das man derzeit in erster Linie darauf abzielt Javascript im Zusammenhang mit der Nutzung für Spam-Seiten zum Beispiel für Doorwaypage-Weiterleitungen zu erkennen. Texte und auch insbesondere Links denen Google folgen soll sollten nicht als Javascript eingebunden werden. Es stellt aber auch kein Problem dar Javascript für kleinere Spielereien oder Funktionen auf ihrer Webseite zu nutzen. Sollten wichtige Informationen oder Links durch Javascript von Google nicht "verstanden" werden können, sollten diese Inhalte zusätzlich im noscript-Tag im Anschluss an den Javascript-Bereich geschrieben werden. Google folgt Links innerhalb des noscript-Bereiches und nutzt den Text für das Ranking. Natürlich lädt dieser noscript-Bereich jetzt gradezu zum Spammen ein. Man sollte sich allerdings nicht beschweren wenn man aufgrund dieses Spammings von Google aus dem Index verbannt wird.

Gelegentlich trifft man auch auf JavaScript-Aufklapp-Navigationen, wie zum Beispiel auf highranking.com. Da Google mit dieser Navigation nichts anfangen kann sollten sie unbedingt noch eine für Google brauchbare Navigation anbieten. Diese finden sie bei highrankings.com im Footer, also am Ende der Webseite wieder. (An dieser Stelle sei auch der Newsletter von Jill Whalen auf High Rankings empfohlen.)

JavaApplets

Kurz gesagt, mit JavaApplets kann Google überhaupt nichts anfangen. Natürlich stellt es kein Problem dar JavaApplets in eine Webseite zu integrieren. (Auch wenn man dadurch mich und einige andere Surfer wahrscheinlich nur nerven wird.) Mit dem was innerhalb des JavaApplet abläuft kann Google allerdings dann absolut gar nichts anfangen. Es sollten also auch Texte und Links außerhalb der Applets für Google zur Indexierung bereitstehen.

Flash

Ebenfalls Probleme bereitet Google Flash. Auch wenn Google mittlerweile Flash-Dateien indexiert und auch teilweise auslesen kann ist es ratsam auf eine reine Flash-Webseite zu verzichten, da sich von einer reinen Flash-Webseite dann nur ein Eintrag der Domain in Google wiederfindet - Unterseiten gibt es nicht. Um die Inhalte der Flash-Seiten auch in Google komplett mit Unterseiten zu platzieren wäre die Erstellung einer HTML-Version notwendig. Einzelne Flash-Elemente, wie zum Beispiel Flash-Banner, innerhalb einer normalen HTML-Webseite stellen natürlich kein Problem dar. Wer keine HTML-Version als Alternative erstellen möchte kann die Flashseite über den Umweg einer Frame-Seite einbinden oder aber zusätzlich den noscript-Tag nutzen um Google zumindest ein wenig Text zu bieten. Aber zu wirklich großem Erfolg wird man damit durch reine Flash-Seiten bei den Suchmaschinen nicht kommen.

Parameter

Eine Url sollte möglichst keine angehängten Parameter besitzen, maximal sollten es 2 Parameter sein. Lange Zeit haben Suchmaschinen Urls mit mehreren angehängten Parametern nicht oder nur zögerlich indexiert. Mittlerweile werden auch Urls mit bis zu 5-6 Parametern indexiert, aber immer noch sehr zögerlich und bevorzugt auf Seiten die sehr oft von anderen Webseiten verlinkt werden. In meinen Projekten verzichte ich generell auf angehängte Parameter, dank des Apache-Moduls mod_rewrite stellt dies auch kein Problem dar. Mehr zu mod_rewrite erfahren sie im folgenden Kapitel "Onpage-Optimierung".

<< zurück<top>vor >>