it-swarm.com.de

Warum gibt Google auf der ersten Seite Tausende von Ergebnissen an, auf der letzten jedoch weniger als hundert?

Warum gibt Google auf der ersten Seite Tausende von Ergebnissen an, aber auf der letzten Seite weniger als hundert?

Das ist eine Art rekursive Google-Suche, die selbsterklärend sein sollte. Ich brauchte einige Zeit, um den Satz zu optimieren und eine Zahl zu finden, die genau übereinstimmt. Deshalb habe ich ihn stattdessen in " Hunderte " geändert! : P

Wenn Sie Google lange genug verwendet haben, sind Sie sicherlich oft auf ähnliche Situationen gestoßen. Immer wenn weniger als 10 Seiten angezeigt werden, ist es recht einfach, sie zu sehen. Der Punkt ist: Die Anzahl der Ergebnisse auf jeder Seite mit Ausnahme der letzten scheint wie ein schreckliche Schätzung .

Was ist noch seltsamer, einige zufällige Zeiten die Schätzung wird plötzlich viel besser und auf allen Seiten fast genau gleich wie auf die letzte Seite - die einzige Seite, die immer korrekt ist.

Weiß jemand warum?

10
cregox

Ich kenne die genaue Antwort nicht - vielleicht weiß es niemand außerhalb von Google. Aber ich habe zwei Datenpunkte, die nützlich sein können.

Der erste ist XKCD's take zum Thema:

Es sieht also wirklich so aus, als gäbe es einen bestimmten Schwellenwert für das Ergebnisvolumen, ab dem Google anscheinend "Screw it" sagt und eine gigantische Zahl ausgibt. Ich stelle mir vor, dass dies wahrscheinlich eher auf Inkompetenz als auf vorsätzliche Täuschung zurückzuführen ist. Ich bin mir sicher, dass es schwierig ist, Seiten aus vielen Quellen schnell zu generieren. Bei Suchanfragen mit vielen Ergebnissen haben sie möglicherweise keine Zeit, um alles zu synchronisieren. Also fummeln sie die Zahlen. Die Tatsache, dass es so aussieht, als hätten sie weit mehr Ergebnisse als sie, ist vermutlich nur ein unbeabsichtigter Bonus.

Der zweite Datenpunkt stammt von einem Informatikprofessor, den ich hatte und der ziemlich neugierig auf das Thema war und der einige Freunde bei Google gestört hat. Sie sagten ihm, dass es manchmal sehr teuer wird, herauszufinden, wie viele Ergebnisse wirklich von einer Suche zurückgegeben wurden. Deshalb raten sie am besten und geben die erste Seite mit den Ergebnissen zurück, um die sich die meisten Menschen kümmern. Erst wenn Sie tatsächlich mit dem Drilldown der Seiten beginnen, bemüht sich Google, die verbleibenden Seiten vollständig zu berechnen.

Beides ist also keine endgültige Antwort, aber sie werden hoffentlich hilfreich sein, um die Arten von Problemen zu erklären, die die Ungenauigkeiten von Google verursachen können.

BEARBEITEN:

Sathyas Antwort auf diese Seite hat eine Antwort von Google 's Webmaster KB.

Wenn Sie eine Suche durchführen, werden die Ergebnisse häufig mit den folgenden Informationen angezeigt: Ergebnisse 1 - 10 von ungefähr XXXX.

Die Berechnung der Gesamtzahl der Suchergebnisse durch Google ist eine Schätzung. Wir wissen, dass eine Ballpark-Zahl wertvoll ist, und durch die Angabe eines Schätzwerts anstelle eines genauen Kontos können wir schneller hochwertige Suchergebnisse zurückgeben.

Wenn Sie auf die nächste Seite der Suchergebnisse klicken, kann sich außerdem die Gesamtzahl der Suchergebnisse ändern. In diesem Fall stellen wir fest, dass einige der Abfrageergebnisse Duplikate sind. Reduzieren Sie diese Duplikate, damit Sie das gewünschte Ergebnis leichter finden können. Durch das Reduzieren der Duplikate wird die geschätzte Anzahl der Ergebnisse sowie die Gesamtzahl der Ergebnisseiten verringert.

6
dsolimano

Nein - die Zahl ist nur ein Näherungswert .

Wenn Sie eine Suche durchführen, werden die Ergebnisse häufig mit den folgenden Informationen angezeigt: Ergebnisse 1 - 10 von ungefähr XXXX.

Die Berechnung der Gesamtzahl der Suchergebnisse durch Google ist eine Schätzung. Wir wissen, dass eine Ballpark-Zahl wertvoll ist, und durch die Angabe eines Schätzwerts anstelle eines genauen Kontos können wir schneller hochwertige Suchergebnisse zurückgeben.

Wenn Sie auf die nächste Seite der Suchergebnisse klicken, kann sich außerdem die Gesamtzahl der Suchergebnisse ändern. In diesem Fall stellen wir fest, dass einige der Abfrageergebnisse Duplikate sind. Reduzieren Sie diese Duplikate, damit Sie das gewünschte Ergebnis leichter finden können. Durch das Reduzieren der Duplikate wird die geschätzte Anzahl der Ergebnisse sowie die Gesamtzahl der Ergebnisseiten verringert.

7
Sathyajith Bhat

Google-Ergebniszählungen sind eine bedeutungslose Metrik . Abgesehen von der Minimierung von Duplikaten haben Sie auch Einfluss darauf, wie die Zählungen in erster Linie durch Multiplikation der Frequenzen berechnet werden und dass Google eine Obergrenze festlegt, die die maximale Anzahl der Ergebnisse festlegt, die jemals zurückgegeben werden.

3
JdeBP

Keine der obigen Antworten ist richtig.

Die Schätzung von Google muss näher an der tatsächlichen Anzahl der Ergebnisse liegen als angegeben.

Dies kann an einem einfachen Beispiel gezeigt werden. Wählen Sie ein etwas häufiges Wort wie "Russland" oder "Michael". In Wahrheit muss es Tausende, wenn nicht Hunderttausende von Websites im Internet geben, die diese Wörter irgendwo auf ihrer Website enthalten. Aber Google-Ergebnisse geben Ihnen möglicherweise nur 700.

Die Wahrheit ist nicht, dass Google weitreichende Überschätzungen vornimmt, sondern dass Google die Anzahl der Ergebnisse, die es Ihnen liefert, jetzt weitestgehend einschränkt. Dies führt zu erheblichen Einbußen bei den Ergebnissen, die für den Einzelnen von großer Bedeutung sind. Es ist bedauerlich, dass ich in einigen Fällen Tausende von Websites mit meinen Begriffen lesen möchte.

Ich weiß das, weil ich Google schon lange verwendet habe, vielleicht 10-15 Jahre, und festgestellt habe, dass die Ergebnisse für Begriffe in der Regel kürzer geworden sind, nicht länger, obwohl die Anzahl der Websites mit den gleichen Begriffen im Allgemeinen sein muss habe in der Zeit, in der ich Google verwendet habe, zugenommen.

Während ich in der Vergangenheit vor Jahren vielleicht 1000 Ergebnisse für einige Begriffe erhalten habe, erhalte ich jetzt 500 Ergebnisse für dieselben Begriffe, für die ich 1000 Ergebnisse erhalten hätte.

2
Rakovsky

Das Problem bei der Google (Image) -Suchmaschine ist, dass sie die Relevanz durch Verringern der Varianz ermittelt. Erstens ist es wichtig zu verstehen, wie es funktioniert. Ein ins Internet hochgeladenes Bild muss auf zwei Arten indiziert werden:

  • basierend auf Originalität (Bild wird von einem "Smart Bot" anhand von Farbe, Größe, Mustern, Formerkennung, Typ usw. analysiert)
  • basierend auf Ähnlichkeit (Bild wird von einem "Smart Bot2" analysiert und mit bereits vorhandenen Bildern in einer Datenbank in Querverweisen versehen und mit einem oder zwei Kategorielabels versehen: "Bild ist passend" und "Bild ist ähnlich wie ... ")

Nachdem die Indizierung abgeschlossen ist, übernimmt das Bild die "Schlüsselwörter" als Ergebnis der Erkennung, um zu vermeiden, dass dem Endbenutzer Ergebnisse außerhalb des Themas angezeigt werden. Die Sache ist, dass jedes Keyword ein eigenständiger Ausdruck mit einem zugewiesenen Wert in% ist, basierend auf der Relevanzstärke (aus diesem Grund führt das Gruppieren von mehr Wörtern im Suchfeld zu weniger Ergebnissen und auch, wenn Sie ein Bild suchen, indem Sie es hochladen oder eine URL eingeben, Google wird eine "Vermutung" mit nur Top-Schlüsselwörtern vergeben, was bedeutet, dass die Suche niemals alle Bilder anzeigt, nur weil die Suche nicht dafür ausgelegt ist.)

Am Ende eines Tages, wenn Sie eine Bildsuche durchführen und direkt unter dem Suchfeld, sehen Sie eine enorme Zahl, die "25.270.000.000 Ergebnisse (0,55 Sekunden)" sagt. Es ist meistens immer eine Art gefälschte Zahl, weil Sie keine weitere erhalten als 200 (maximal 500, jedoch nur nach Benutzeranforderung) Ergebnisse, die ebenfalls gefiltert werden, um Folgendes auszuschließen:

  • externe Duplikate (wenn dasselbe Bild mehr als 2 Mal auf derselben Site-Seite vorhanden ist)
  • relevanz-Duplikate (zeigt nur "beste Ergebnisse" - siehe Bild unten)
  • bilder, die Probleme mit dem Gesetz haben (siehe Bild unten)
  • bilder, die gegen DMCA verstoßen (siehe Bild unten)
  • bilder, die von SPAM-, MALWARE-, PHISHING-Quellen stammen
  • bilder, die ausgeblendet sind (wenn ein Benutzer die sichere Suche nicht deaktiviert hat)
  • bilder, die von Google auf die schwarze Liste gesetzt wurden ( article )
  • bilder mit unterschiedlichem AR (grundsätzlich alle Bilder, die ein anderes Seitenverhältnis als die Bildsuchreferenz haben. Sie können z. B. alle gewünschten Ergebnisse verpassen, wenn Sie nach dem von Ihnen ausgewählten Bild suchen - sagen wir mit einem seltsamen Verhältnis von 9: 7 -, während alle Bilder in indexiert sind Google hat ein Seitenverhältnis von 3: 4 - das ist vielleicht der größte Nachteil dieser Suchmaschine, da es immer das Seitenverhältnis als erstes Kriterium einhält.
  • und ein paar mehr

Um es zusammenzufassen: Suchergebnisse eines Bildes sind niemals voll relevant. Manchmal erhalten Sie Ihr endgültiges gewünschtes Ergebnis mit einem Suchbegriff "gate poster", andernfalls könnte es "gate cover", "gate bluray", "gate dvd", "gate 2015" oder sogar "自衛隊 自衛隊 の に て に 斯 く く く く く て て く 戦 戦 く" seinえ え "- Sie können einfach nicht" ALL "-Bildergebnisse haben, weil es nichts gibt, was" ALL "ist. Deshalb müssen Sie damit spielen, um dorthin zu gelangen. Und es ist auch wichtig zu erwähnen, dass es andere Bildsuchmaschinen gibt, die den Job anders machen können, weil sie nach unterschiedlichen Standards und Kriterien arbeiten. Es war und ist nicht nur "Google" ... >> https://www.yandex.com/images/

Bemerkenswerte Erweiterungen:

1
user0

Oben steht Seite 70 von 7000 Ergebnissen (Beispiel). Es wird die Seitennummer und wie viele Ergebnisse geben. Es gibt nicht 70 Ergebnisse, sondern 70 Seiten. Hoffe das hilft.

0
Aaron Ford