Google nutzt eine Maschinen-Lerntechnologie namens RankBrain um die Lieferung der Suchresultate zu unterstützen. Hier ist, was wir bisher darüber wissen.

Hinweis: Diese Geschichte wurde seit ihrer Erstveröffentlichung im Oktober 2015 überarbeitet um die neuesten Informationen zu reflektieren.
Gestern erreichte mich die Nachricht, dass Google ein maschinelles Lernsystem für künstliche Intelligenz namens “RankBrain” nutzt um die Sortierung der Suchergebnisse zu unterstützen. Sie fragen sich, wie das funktioniert und mit dem Google-Gesamtwertungssystem harmoniert? Hier ist, was wir über RankBrain wissen. Die folgenden Informationen stammen aus drei Originalquellen und wurden im Laufe der Zeit aktualisiert, mit Notizen wo Aktualisierungen vorgenommen wurden.
Was ist RankBrain?
RankBrain ist der Name von Google eines Maschinenlernsystems für künstliche Intelligenz, welches genutzt wird um beim Sortieren der Suchergebnisse zu helfen, so Bloomberg und bestätigt von Google.
Was ist maschinelles Lernen?
Maschinelles Lernen nennt man es, wenn ein Computer sich selbst beibringt, wie man etwas tut, anstatt es durch einen Menschen oder ein detailliertes Programm zu lernen.
Was ist künstliche Intelligenz?
Echte künstliche Intelligenz, kurz KI, ist ein Computer, der so intelligent wie ein Mensch sein kann, zumindest im Sinne des Wissenserwerbs sowohl durch Lehren als auch durch den Aufbau auf das bereits gelernte um neue Verknüpfungen zu erstellen.
Echte künstliche Intelligenz existiert natürlich nur in Science-Fiction-Novellen. In der Praxis bezeichnet KI Computersysteme, welche designt wurden um zu lernen und Verknüpfungen herzustellen.
Was unterscheidet eine KI vom maschinellen Lernen?

In Bezug auf RankBrain scheinen beide ziemlich synonym zu sein. Sie hören die Begriffe womöglich beide in austauschbarer Verwendung oder, dass maschinelles Lernen als Beschreibung für künstliche Intelligenz verwendet wird.
Ist also RankBrain für Google die neue Art um Suchergebnisse zu bewerten?
Nein. RankBrain ist Teil von Googles Gesamt-Suchalgorithmus, einem Computerprogramm, welches benutzt wird um Milliarden Seiten zu durchsuchen, welches es kennt und diejenigen herauszufinden, welche am relevantesten für die jeweiligen Suchanfragen sind.
Wie ist der Name von Googles Suchalgorithmus?
Es nennt sich Hummingbird, wie wir bereits in der Vergangenheit berichteten. Viele Jahre hatte der Gesamt-Suchalgorithmus keinen formalen. Jedoch überarbeitete Google in der Mitte des Jahres 2013 diesen Algorithmus und gab ihm einen Namen, Hummingbird (Kolibri).
Ist RankBrain also Teil von Googles Hummingbird-Suchalgorithmus?
So haben wir das verstanden. Hummingbird ist der Gesamt-Suchalgorithmus, wie der Motor in einem Auto. Der Motor besteht aus zahlreichen Einzelteilen wie Ölfilter, Benzineinspritzung, Radiator, usw. Ebenso umfasst Hummingbird zahlreiche Teile von denen RankBrain der neueste ist.
Insbesondere wissen wir, dass RankBrain Teil des gesamten Hummingbird-Algorithmus ist, da der Bloomberg-Artikel deutlich macht, dass RankBrain nicht alle Suchvorgänge verarbeitet, da dies nur der Gesamt-Algorithmus tun würde. Hummingbird beinhaltet auch andere Teil mit bekannten Namen aus der SEO-Sparte wie Panda, Penguin und Payday, designt um Spam zu bekämpfen, Pigeon designt um lokale Ergebnisse zu verbessern, Top Heavy designt um Seiten voller Werbung zu degradieren, Mobile Friendly designt um handyfreundliche Seiten zu belohnen und Pirate designt um Copyright-Verletzungen zu bekämpfen.
Ich dachte, dass der Google-Algorithmus “PageRank” genannt wurde
PageRank ist Teil des gesamten Hummingbird-Algorithmus, welcher eine spezielle Art hat um Seiten Punkte für externe Links zu geben, welche auf die Seite führen. PageRank ist speziell, da es der erste Name war, den Google jemals einem Teil seines Ranking-Algorithmus gab, weit in der Vergangenheit als die Zeit der Suchmaschine gerade erst begann, 1998.
Was ist mit diesen “Signalen”, die Google für die Einstufung nutzt?
Die Signale sind Dinge, welche Google nutzt um festzustellen, wie Webseiten bewertet werden sollten. Zum Beispiel wird es die Wörter auf einer Webseite lesen, da Worte ein Signal sind. Wenn einige Wörter fett geschrieben sind, könnte dies dann ein weiteres Signal sein, welches festgestellt wird. Die Berechnungen, die als Teil von PageRank einer Seite eine PageRank-Bewertung geben, werden als Signal verwendet. Wenn eine Seite als handyfreundlich festgestellt wird, handelt es sich um ein weiteres Signal, das registriert wird.
Alle diese Signale werden von verschiedenen Teilen innerhalb des Hummingbird-Algorithmus bearbeitet um herauszufinden, welche Seiten Google als Reaktion auf verschiedene Suchanfragen anzeigt.
Wieviele Signale gibt es?
Google hat ziemlich konsequent davon gesprochen, mehr als 200 Hauptbewertungssignale zu haben, welche wiederum bis zu 10,000 Variationen oder Untersignale haben können. Typischerweise hieß es “hunderte” Faktoren im gestrigen Bloomberg-Artikel.
Wenn Sie mehr visuelle Richtlinien für Bewertungssignale wünschen, werfen Sie einen Blick auf unser Periodensystem der SEO-Erfolgsfaktoren:
Wir denken, es ist ein ziemlich guter Guide für die generellen Dinge, welche Suchmaschinen wie Google nutzen um Webseiten zu bewerten.

seo-faktoren
Und RankBrain ist das drittwichtigste Signal?
Das ist richtig. Aus dem nichts ist dieses neue System zu dem geworden, was Google als den drittwichtigsten Faktor zur Webseitenbewertung bezeichnet. Aus dem Bloomberg-Artikel:
RankBrain ist eines von “hunderten” Signalen, welche in einen Algorithmus einfließen zur Erkennung der Resultate, die auf einer Google-Ergebnisseite angezeigt und wo sie bewertet werden, so Corrado. In den wenigen Monaten, seit denen es im Einsatz ist, wurde aus RankBrain das drittwichtigste Signal, welches zu den Suchergebnissen einer Suchanfrage beiträgt, sagt er.
Was sind das wichtigste und das zweitwichtigste Signal?
Als diese Geschichte ursprünglich geschrieben wurde, wollte Google uns dies nicht sagen. Unsere Vermutung war:
Meine persönliche Schätzung ist, dass Links das wichtigste Signal sind und die Art von Google um Stimmen aus der Anzahl an Links zu vergeben. Es ist auch ein schrecklich alterndes System, wie ich in meinem Artikel Links: Die kaputte “Wahlbox” welche von Google & Bing benutzt wird beschrieben hatte.
Als zweitwichtigstes Signal nehme ich das „Wort“ an, worunter alles von den Worten auf der Seite bis zur Interpretation der Worte, die die Nutzer in der Google-Suche außerhalb der RankBrain-Analyse eingeben.
Das erwies sich als ziemlich korrekt. Im März 2016 enthüllte Google die ersten beiden Faktoren, welche Inhalte und Links waren. Oder Links und Inhalte, da sie nicht verrieten, welcher der erste war.

Nun wissen wir es: Hier sind Googles Top 3 Suchbewertungsfaktoren
Was genau tut RankBrain?
Von Emails mit Google konnte ich herausfinden, dass RankBrain hauptsächlich als Weg zur Interpretation der Suchanfragen der Nutzer verwendet wird um Seiten zu finden, die nicht genau dieselben Worte wie in der Suchanfrage beinhalten.
Hat Google nicht bereits einen Weg gefunden, Seiten über die Sucheingaben hinaus zu finden?
Ja, Google hat schon seit langem Seiten über die genau eingegebenen Begriffe hinaus gefunden. Wenn Sie zum Beispiel vor vielen Jahren etwas wie “Schuh” bei Google eingegeben hätten, hätte es keine Seiten gefunden, die “Schuhe” enthält, da es technisch gesehen zwei verschiedene Wörter sind. Aber “herrühren” hat es Google erlaubt schlauer zu werden, zu verstehen, dass Schuhe eine Variante des Schuhs ist, genau wie “laufen” eine Variation von “Lauf”.
Google hat auch Synonym Smarts, so dass es bei der Suche nach “Sneakers” versteht, dass Sie auch “Laufschuhe” gemeint haben könnten. Es hat sogar einige begriffliche Smarts erhalten um zu verstehen, dass Seiten über “Apple” das Technologie-Unternehmen sowie die Frucht “Apfel” sein können.
Was ist mit dem Knowledge Graph?
Der Knowledge Graph, 2012 gestartet, war eine Möglichkeit für Google um cleverer zu in Bezug auf Wortverknüpfungen zu werden. Wichtiger ist es, dass Google lernte, wie man nach “Dingen und nicht Strings“, so Google.
Strings bedeutet nur nach einer Reihe von Buchstaben zu suchen, so wie Seiten, die mit der Buchstabierung „Obama“ übereinstimmen. Dinge bedeutet, dass Google stattdessen versteht, wenn jemand nach “Obama” sucht, dass dieser Benutzer vermutlich den US-Präsidenten Barack Obama meinte, eine echte Person mit Verbindung zu anderen Personen, Orten und Dingen.
Der Knowledge Graph ist eine Datenbank aus Fakten über Dinge in der Welt und deren Beziehung zueinander. Es ist der Grund, weshalb Sie eine Suche wie “Wann wurde Obama geboren” starten können und eine Antwort über Michele Obama erhalten, ohne ihren Namen zu verwenden:
Wie hilft RankBrain bei der Verfeinerung der Suchergebnisse?
Die Methoden, welche Google bereits zur Verfeinerung der Suchergebnisse verwendet, gehen generell irgendwo auf einen Menschen zurück, der Arbeit verrichtet, entweder im Erstellen der Stammlisten, Synonymlistens oder dem Erstellen von Datenbankverbindungen zwischen den Dingen. Natürlich gibt es auch Automation, jedoch hängt es meist an der menschlichen Arbeit.
Das Problem ist, dass Google drei Milliarden Suchen pro Tag bearbeitet. 2007 sagte Google, dass 20 bis 25 Prozent dieser Anfragen zuvor nie gesehen wurden. 2013 konnte es diese Zahl runter auf 15 Prozent bringen, was im gestrigen Bloomberg-Artikel erwähnt und auch von Google bestätigt wurde. Aber 15 Prozent von drei Milliarden ist immer noch eine gigantische Zahl von Anfragen, die nie zuvor von einem Menschen eingegeben wurden — 450 Millionen pro Tag. Darunter können komplexe, Mehrwort-Anfragen, sogenannte “langschwänzige” Anfragen sein. RankBrain wurde designt um zu helfen, diese Anfragen effektiver hinter der Bühne auf eine Art zu übersetzen, mit der es die besten Seiten für den Suchenden findet.
Wie Google uns gesagt hat, kann es Muster zwischen scheinbar unverbundenen komplexen Suchen erkennen und verstehen, wie ähnlich sie tatsächlich einander sind. Dieses Lernen wiederum ermöglicht es in Zukunft komplexe Suchvorgänge besser zu verstehen und zu bestimmen ob sie mit gewissen Themen verwandt sind. Am wichtigsten ist es, was Google uns erzählt hat, dass es diese Gruppen von Suchanfragen mit den Ergebnissen verknüpfen kann, von denen es denkt, dass der Suchende es am meisten mag.
Google hat uns keine Beispiele für Gruppen von Suchanfragen genannt oder Details darüber verraten, wie RankBrain einschätzt, was die besten Seiten sind. Letzteres womöglich weil es eine mehrdeutige Suche in etwas Spezifischeres übersetzen kann, kann es bessere Ergebnisse liefern.
Wir wäre es mit einem Beispiel?
Während Google uns keine Gruppen von Suchanfragen nannte, gab der Bloomberg-Artikel ein einzelnes Beispiel einer Suche, bei der RankBrain vermutlich hilft. Hier ist sie:
Was ist die Bezeichnung des Konsumenten an höchster Stelle der Nahrungskette
Für einen Laien wie mich klingt “Konsument” wie die Referenz zu einem kaufenden Kunden. Jedoch ist es auch ein wissenschaftlicher Ausdruck für etwas, dass Nahrung zu sich nimmt. Es gibt auch Stufen von Konsumenten in der Nahrungskette. Der Konsument auf der höchsten Stufe? Der Titel – der Name – ist „Jäger”.
Geben wir diese Suchanfrage in Google ein, erhalten wir gute Antworten, selbst wenn die Anfrage selbst ziemlich komisch klingt:
Stellen Sie sich nun vor, wie ähnlich sich die Resultate einer Suche wie “Top-Level der Nahrungskette” wären, siehe unten:
Stellen Sie sich vor, dass RankBrain diese lange und komplizierte Anfrage mit der viel kürzeren verbindet, welche womöglich häufiger getätigt wird. Es versteht, dass sie das Gleiche sind. Als Ergebnis kann Google alles, was es über das Erhalten von Antworten für die kurze Anfrage verwenden um zu verbessern, was es bei der ungewöhnlichen Anfrage als Ergebnisse liefert.
Lassen Sie mich betonen, dass ich nicht weiß, ob RankBrain diese beiden Suchen verbindet. Ich weiß nur, dass Google das erste Beispiel gab. Das ist einfach eine Darstellung, wie RankBrain verwendet werden kann um eine ungewöhnliche Suche mit einer gewöhnlichen zu verknüpfen um die Dinge zu verbessern.
Kann Bing das mit RankNet auch machen?
Damals 2005 startete Microsoft die Nutzung seines eigenen Maschinellen Lernsystems namens RankNet als Teil dessen, was später die Bing-Suchmaschine wurde. Tatsächlich wurde der leitende Forscher und Schaffer von RankNet kürzlich geehrt. Über die Jahre hat Microsoft jedoch selten über RankNet gesprochen.
Sie können darauf wetten, dass sich dies wahrscheinlich ändern wird. Es ist auch interessant, dass wenn ich etwas oben in die Suche bei Bing eingab, als Beispiel dafür wie großartig Googles RankBrain ist, Bing mir gute Ergebnisse zurückgab, darunter eine Auflistung, welche Google auch zurückgegeben hätte:
Eine Suchanfrage bedeutet nicht, dass Bings RankNet so gut wie Googles RankBrain ist oder umgekehrt. Unglücklicherweise ist es wirklich schwierig eine Liste auszuarbeiten, mit der man diese Art vergleiche durchführen kann.
Weitere Beispiele?
Google hat uns ein frisches Beispiel gegeben: “Wie viele Esslöffel in einer Tasse?”. Google sagte, dass RankBrain unterschiedliche Ergebnisse in Australien im Vergleich zu den Vereinigten Staaten für diese Abfrage begünstigt, da die Messungen in den einzelnen Ländern unterschiedlich sind, trotz der ähnlichen Namen. Ich habe versucht, dies zu testen, indem ich bei Google.com im Vergleich zu Google Australien suchte. Ich habe selbst nicht viele Unterschiede gefunden. Auch ohne RankBrain würden die Ergebnisse oft auf diese Weise unterschiedlich sein, wegen der “altmodischen” Mittel der Bevorzugung von Seiten bei bekannten australischen Webseiten für die Nutzer, welche Google Australien verwenden.
Hilft RankBrain wirklich?
Obwohl meine zwei Beispiele weniger als Zeugnis für die Großartigkeit von RankBrain dastehen, glaube ich wirklich, dass es wahrscheinlich einen großen Einfluss darauf hat, so behauptet Google. Das Unternehmen ist ziemlich konservativ mit dem, was in seinen Ranking-Algorithmus einfließt. Es führt ständig kleine Tests durch. Aber es bringt nur große Veränderungen, wenn es einen hohen Vertrauensgrad hat.
RankBrain Integration, in dem Maße, dass es angeblich das drittwichtigste Signal ist, ist eine große Veränderung. Es ist keine, die Google durchführen würde, denke ich, es sei denn sie glaubten es würde wirklich helfen.
Wann hat RankBrain gestartet?
Google sagte uns, dass es ein allmähliches Rollout für RankBrain Anfang 2015 geben sollte und dieser für ein paar Monate komplett live und global wäre.
Welche Suchanfragen sind betroffen?
Im Oktober 2015 sagte Google Bloomberg, dass es eine “sehr große Fraktion” der 15 Prozent Anfragen normalerweise nie zuvor registriert hat, bevor sie von RankBrain verarbeitet wurden. Kurzum, 15 Prozent oder weniger.
Im Juni 2016 kam die Nachricht auf, dass RankBrain für jede Anfrage, die Google handhabt, verwendet würde. Siehe unsere Story darüber:
· Google nutzt RankBrain für jede Suche, beeinflusst die Bewertung einer “ganzen Menge” davon
Lernt RankBrain ständig?
Alle Lernen, dass RankBrain tut, geschieht offline, so Google. Es sind Batches von historischen Suchen und es lernt anhand dieser Vorhersagen zu treffen. Diese Vorhersagen werden getestet und wenn für gut befunden, geht die neueste Version von RankBrain live. Dann wird der lerne-offline-und-teste-Zyklus wiederholt.
Macht RankBrain mehr als nur Suchanfragen verfeinern?
Typischerweise wurde es nicht als Ranking-Faktor oder ein Signal betrachtet, wie eine Abfrage verfeinert wird – sei es durch Abstammung, Synonyme oder heute RankBrain.
Die Signale sind in der Regel Faktoren, die an den Inhalt gebunden sind, wie zum Beispiel die Wörter auf einer Seite, die Links, die auf eine Seite zeigen, ob eine Seite auf einem sicheren Server ist und so weiter. Sie können auch an einen Benutzer gebunden werden, beispielsweise wo sich ein Suchender befindet oder ihrem Such- und Browserverlauf.
Wenn Google also über RankBrain als drittwichtigstes Signal spricht, bedeutet es wirklich als Bewertungssignal? Ja. Google bestätigte uns, dass es eine Komponente ist, bei der RankBrain direkt zum Rang der Seite beiträgt.
Wie genau? Gibt es irgendeine Art von “RankBrain Punktestand”, um die Qualität beurteilen zu können? Vielleicht, aber es scheint viel wahrscheinlicher, dass RankBrain Google irgendwie hilft besser Seiten nach dem Inhalt zu klassifizieren, den sie enthalten. RankBrain könnte besser in der Lage sein als Googles bestehendes System, zusammenfassen worum es auf einer Seite geht.
Oder nicht. Google sagt nichts anderes, als dass eine Ranking-Komponente beteiligt ist.
Wie lerne ich mehr über RankBrain?
Google hat uns gesagt, dass Menschen, die etwas über das Wort “Vektoren” lernen wollen – die Art wie Worte und Phrasen mathematisch verbunden werden können – sollte einen Blick auf diesen Blog Post werfen, welcher darüber spricht, wie das System (welches nicht im Nachhinein RankBrain genannt wurde) Konzepte von Hauptstädten erlernt, nur durch das Durchstöbern von Nachrichtenartikeln:
Es gibt ein längeres Forschungspaper, welches Sie hier finden können. Sie können sogar selbst mit Ihrem eigenen maschinellen Lernprojekt unter der Nutzung von Googles word2vec Tool herumspielen. Zusätzlich hat Google ein gesamtes Gebiet mit KI und Maschinellem Lern-Papers, wie auch Microsoft.
Schauen Sie sich auch unseren Artikel an, wie Maschinelles Lernen funktioniert, nach der Erklärung von Google.

 

Bildquelle: searchengineland.com

Artikel bezieht sich auf den englischen Artikel hier