it-swarm.com.de

Hinzufügen eines Stapelüberlauf-Tags zu einer benutzerdefinierten Suchmaschine von Google

Wie richte ich die benutzerdefinierte Suche von Google so ein, dass nur Seiten aus einem Stapelüberlauf-Tag eingeschlossen werden?

Wenn Sie beispielsweise http://stackoverflow.com/questions/tagged/guava hinzufügen, werden die Artikelseiten nicht gefunden. Es gibt keine gemeinsame Muster-URL für die Seiten und Tags sind keine Unterdomänen.

7
Thomas Jung

Dies ist nicht möglich, wie in den Kommentaren erwähnt.
Google kann wirklich nicht erklären, wozu die benutzerdefinierte Suchmaschine (Custom Search Engine, CSE) in der Lage ist.

Nimm dein Beispiel https://stackoverflow.com/questions/tagged/guava

Die erste Frage (zum aktuellen Zeitpunkt dieses Beitrags)

Java Generics Wildcards Question

Lassen Sie uns versuchen, dies von der CSE zu erhalten.

Verwenden des URL-Musters

www.stackoverflow.com/questions/tagged/guava?*, die laut Hilfeseite :

Stimmt mit allen URLs überein, die mit www.example.com oder example.com beginnen

Dies sollte sich um Fragen kümmern

Man erhält für eine benutzerdefinierte Suche nach "Java" ... keine Ergebnisse

Es wurde versucht, mit einer regulären alten Suche erneut zu duplizieren
site:stackoverflow.com/questions/tagged/guava -inurl:Java Java inurl:page

Beachten Sie, dass wir ohne inurl:page eines der Ergebnisse erhalten

Textdatei in Java Mit Commons oder Guava setzen

Nicht das gewünschte Ergebnis, aber dennoch ein Ergebnis. Jetzt ist es an der Zeit, die CSE zu verfeinern, da die CSE jetzt nicht mehr die erste Seite von stackoverflow.com/questions/tagged/guava durchsucht, sondern nur die unter Paginierung stehenden.

Also die aktualisierten URL-Muster

www.stackoverflow.com/questions/tagged/guava?*www.stackoverflow.com/questions/tagged/guava

wobei die zweite Seite nur mit einer einzelnen Seite übereinstimmen sollte, gemäß Hilfeseite . Macht es ? Nein. Es stimmt mit dem URL-Muster www.stackoverflow.com/questions/tagged/guava* überein. Zuerst dachte ich, dass es vielleicht implizit ist, aber ich las die Hilfe erneut:

Beispielsweise stimmt das Muster "www.foo.com/bar" nur mit der einzelnen Seite "www.foo.com/bar" überein. Um alle Seiten abzudecken, deren URL mit "www.foo.com/bar" beginnt, müssen Sie am Ende explizit a '*' hinzufügen

Also habe ich das Platzhaltermuster nicht hinzugefügt und die CSE hat nach Ergebnissen gesucht, die ich nicht wollte

Ergebnisse vergleichen

Google CSE

Google Search

Zumindest liefern sie jetzt die gleichen Ergebnisse. Obwohl wir immer noch nicht das erste Ergebnis haben Java Generics Wildcards Question . Da bekannt ist, dass sich die Anzahl der Ergebnisse aus irgendeinem Grund innerhalb von Google ändert, versuchen wir, die Suche zu verfeinern, und gehen davon aus, dass das Ergebnis mit "Java Generics" noch gefunden werden kann.

Dies macht die Ergebnisse wirklich anders, da die CSE 0 Ergebnisse und die Google-Suche 21 Ergebnisse liefert. Letztendlich denke ich nicht, dass Sie sich auf die Google-Suche so verlassen sollten, wie Sie es möchten. Es scheint einfach nicht richtig zu suchen.

Eine andere Möglichkeit, die ich ausprobiert habe, ist die Verwendung des Parameters link:

link:https://stackoverflow.com/questions/tagged/guava

sie können jedoch keine anderen Parameter verwenden, wenn Sie diese verwenden.

Eine dritte Möglichkeit wäre die Verwendung von StackOverflow Search

https://stackoverflow.com/search?q=%5Bguava%5D

(aber dies ist ratenbeschränkt, Sie werden nicht weit kommen) und Sie können es nicht mit der CSE koppeln.

Möglicherweise müssen Sie nach einer Site suchen, die eine ordnungsgemäße Zuordnung aufweist (diese befindet sich am Ende jeder Stackoverflow-Seite) und die Fragen nach Tags organisiert

Beispiel

http://wolfrevokcats.com/questions/java?generics&guava/Java-generics-wildcards-question

Oder so ähnlich, auf diese Weise wäre es Google-freundlicher für Ihre Bedürfnisse.

3
phwd