it-swarm.com.de

Exportieren Sie die Liste der Websites aus einer benutzerdefinierten Suchmaschine von Google

Ich habe eine öffentliche Google Custom Search Engine mit über 700 Websites im Index. Ich finde anscheinend keine einfache Möglichkeit, die Websites zu exportieren. Welche Möglichkeiten habe ich?

1
ale

Jetzt gibt es eine Funktion zum Herunterladen der Site-Liste. Hier sind die Schritte, die ich verwendet habe:

  1. Gehen Sie zu Ihrer benutzerdefinierten Suchmaschine
  2. Klicken Sie in der Systemsteuerung auf die Registerkarte Erweitert. Die URL sieht ungefähr so ​​aus: http://www.google.com/cse/panel/advanced ? .....
  3. Suchen Sie im Hauptfenster nach Download-Anmerkungen und laden Sie sie in Ihrem bevorzugten Format herunter
3
Niran Kundapur

Es gibt keine "nette" Art, dies zu tun. Im Folgenden finden Sie einige Anweisungen, die nur eine Liste von Websites enthalten, die aus diesem Google-Supportforum-Artikel stammen.

  • Rufen Sie das Kontrollfeld einer Ihrer CSEs auf. Notieren Sie auf der Seite "Allgemein" des Control Panels Ihre "Suchmaschinen-ID" (a.k.a. 'CX-Wert'). Die Suchmaschinen-ID besteht aus einem 21-stelligen numerischen Code, gefolgt von einem Doppelpunkt und einem 11-stelligen Suffix.

  • Gehen Sie zur Seite "Erweitert" des Control Panels. Notieren Sie sich die Namen der Einschluss- und Ausschluss-Labels, die im folgenden Text erwähnt werden: "... Sites mit [...] kennzeichnen, wenn Sie sie einschließen möchten ...." und "... Sites mit [...] kennzeichnen wenn Sie sie ausschließen möchten ... "(Hinweis: Die CSE verfügt möglicherweise über mehr als einen Namen für die Einschlusskennzeichnung.)

  • Öffnen Sie ein separates Browserfenster oder eine Registerkarte. Kopieren Sie die unten gezeigte URL-Vorlage und fügen Sie sie in die Adressleiste Ihres Browsers (URL-Feld) ein.

  • Ersetzen Sie anstelle von "XXXXXXXXXXXXXXXXXXXX" den 21-stelligen Code aus dem ersten Teil Ihrer CSE-ID. Ersetzen Sie anstelle von "JJJJJJJJJ" das 11-stellige Suffix Ihrer CSE-ID. Ersetzen Sie "LABELNAME" durch einen Markennamen.

  • http://www.google.com/cse/api/XXXXXXXXXXXXXXXXXXXXX/annotations/YYYYYYYYYY?label=LABELNAME&num=5000&start=0&feed=0&output=tsv

  • (Verwenden Sie Copy-and-Paste, um die Ersetzungen vorzunehmen. Überprüfen Sie das Ergebnis sorgfältig, um sicherzustellen, dass die Ersetzungen vollständig und korrekt sind und keine zusätzlichen Zeichen oder Leerzeichen hinzugefügt wurden.)

  • Besuchen Sie die resultierende URL, und Sie sollten die TSV-formatierten Anmerkungen erhalten, die der angegebenen Bezeichnung für die angegebene CSE entsprechen.

Hinweis: Wenn beim Öffnen der .tsv-Datei in Excel Probleme auftreten: Benennen Sie die Datei um, ändern Sie die .tsv-Erweiterung in .txt, und öffnen Sie sie dann in Excel.)

2
codingbadger

Falls Sie "ausgeschlossene Websites" aus erweiterten Optionen exportieren möchten. Es scheint keinen offiziellen Weg dafür zu geben. Wenn Sie Chrome dev-Tools auf der Registerkarte "Netzwerk" öffnen und auf die nächste Seite ausgeschlossener Websites klicken, wird die XHR-Anforderung angezeigt, die ausgelöst wurde.

Kopieren Sie den XHR-Link, der ungefähr so ​​aussehen sollte:

https://cse.google.com/cse/api/XXXXXXXXXXXXXXXXXXXXX/annotations/XXXXXXXXX?start=10&num=10&label=_cse_exclude_XXXXXXX

Ändern Sie start in 0 und num in so viele, wie Sie haben (oder exportieren möchten), und es sollte ein XML-Dokument heruntergeladen werden, das enthält, wie viele Datensätze Sie angefordert haben.

1
Kiee