So funktioniert die Suche

Diese Prozesse bilden die Grundlage dafür, wie wir Informationen im Web erfassen und verwalten, um Ihnen die nützlichsten Ergebnisse zu liefern. Unser Index umfasst weit über 100 Millionen Gigabyte und wir haben über eine Million Stunden Rechnerzeit investiert. Erfahren Sie in unserem Video mehr über die Grundlagen.

 

Informationen mithilfe von Crawling finden

Wir verwenden Software, die "Webcrawler" genannt wird, um öffentlich zugängliche Webseiten zu erkennen. Der bekannteste Crawler heißt "Googlebot". Crawler rufen Webseiten auf und folgen den Links auf diesen Seiten, ähnlich wie beim Surfen im Web. Sie gehen von Link zu Link und bringen Daten zu diesen Webseiten zurück auf die Server von Google.

Das Crawling beginnt mit einer Liste von Webadressen aus früheren Crawlings und Sitemaps, die von Website-Inhabern zur Verfügung gestellt werden. Unsere Crawler besuchen diese Websites und suchen dabei nach Links zu anderen Seiten. Dabei wird besonders auf neue Websites, Änderungen an bestehenden Websites und "tote" Links geachtet.

Mithilfe von Computerprogrammen wird bestimmt, welche Websites gecrawlt werden, in welchen Abständen und wie viele Seiten von jeder Website abgerufen werden. Google akzeptiert keinerlei Zahlungen, um bestimmte Websites für die Suchergebnisse häufiger zu crawlen. Uns sind bestmögliche Ergebnisse wichtiger, da dies auf lange Sicht den Anforderungen der Nutzer entspricht - und damit auch den unseren.

Auswahl für Website-Inhaber

Für die meisten Websites ist es nicht erforderlich, das Crawling, die Indexierung oder das Erscheinen der Seiten einzuschränken. Sie können ohne zusätzliche Schritte in den Suchergebnissen angezeigt werden. Wir bieten Website-Inhabern jedoch zahlreiche Möglichkeiten festzulegen, wie Google ihre Websites crawlt und indexiert. Dies ist über die Webmaster-Tools und eine Datei mit dem Namen "robots.txt" möglich. Mithilfe der robots.txt-Datei können Website-Inhaber festlegen, dass ihre Websites nicht vom Googlebot gecrawlt werden sollen, oder sie können spezifischere Anweisungen geben, wie Seiten auf ihren Websites zu verarbeiten sind.

Website-Inhaber können zahlreiche Details festlegen, unter anderem, wie Inhalte für einzelne Seiten indexiert werden. Zum Beispiel können sie sich dafür entscheiden, ihre Seiten ohne Snippets (Zusammenfassung der Seite unterhalb des Titels in den Suchergebnissen) oder ohne Cache-Version (alternative Version der Seite auf den Servern von Google falls die Live-Seite nicht verfügbar ist) anzuzeigen. Webmaster können die Suchfunktion über die benutzerdefinierte Suche auch in ihre eigenen Seiten integrieren.

Informationen per Indexierung organisieren

Das Web gleicht einer ständig wachsenden öffentlichen Bibliothek mit Milliarden von Büchern und keiner zentralen Kartei. Google erfasst im Wesentlichen die Seiten während des Crawlings und erstellt dann einen Index, damit wir genau wissen, wie man Dinge nachschlagen kann. Ähnlich wie der Index am Ende eines Buches umfasst der Google-Index Informationen zu Wörtern und ihrer Position. Vereinfacht gesagt suchen unsere Algorithmen im Index nach Ihren Suchbegriffen, um die entsprechenden Seiten zu finden.

Ab da wird der Suchvorgang um einiges komplexer. Wenn Sie zum Beispiel nach "Hunde" suchen, möchten Sie wahrscheinlich keine Seiten abrufen, auf denen das Wort "Hunde" zigmal vorkommt. Sie suchen wahrscheinlich nach Fotos, Videos oder einer Liste mit Hunderassen. Das Index-System von Google beachtet viele verschiedene Aspekte der Seiten, z. B. wann sie veröffentlicht wurden, ob sie Fotos, Videos oder andere Elemente enthalten. Mit dem Knowledge Graph gehen wir weiterhin über das Übereinstimmen von Suchbegriffen hinaus, um Personen, Orte und Dinge, die für Sie interessant sind, besser zu verstehen.

 

Webmaster-Tools

Weitere Informationen zu den Tools und Ressourcen für Website-Inhaber finden Sie in der Webmaster-Zentrale.

Grafik: So funktioniert die Suche

Schauen Sie sich die Grafik an, in der die einzelnen Phasen des Suchprozesses dargestellt werden: von den ersten Schritten vor der Suche über das Ranking bis zur Darstellung der Suchergebnisse.