it-swarm.com.de

Suche in HTML-Quelle mit GOOGLE?

Ich habe mehrere Websites und kann mich nicht erinnern, wo ich einige Codezeilen geschrieben habe. Da meine Seiten von Google indexiert werden, möchte ich wissen, ob Google die Möglichkeit bietet, innerhalb des HTML-Quellcodes/Markups selbst zu suchen anstatt . ) Nur die Suche innerhalb des visuellen, gerenderten Teils einer Seite zulassen?

Vielen Dank

53
Entretoize

Es gibt eine neue Suchmaschine namens NerdyData, mit der Sie nach HTML/CSS/JS-Quellcode suchen können

Sie indizieren über 160 Millionen öffentliche Domains und ich fand die Daten nützlich.

33
Noah Freitas

Ich bin auf meinen Reisen auf die folgenden Ressourcen gestoßen (einige bereits oben erwähnt):

HTML-markierungsorientierte Suchmaschinen

Ich würde auch gerne folgendes einwerfen:

Riesige Website-Crawl-Datenarchive

Wie können wir diese Crawling-Daten analysieren?

Eine Idee, wie Sie mit der Analyse einiger dieser massiven Daten beginnen können, finden Sie unter Big Data/Map-Reduce-Frameworks .

Google listet einige Ideen zur Verwendung von Apaches Spark project zur Analyse von Common Crawl's Dump (s) . Zum Verständnis das Dateiformat) (s) von Common Crawl verwendet , beziehen sich auf Folgendes:

In dem Artikel Zugriff auf Common-Crawl-Dataset-on-S wird der kostengünstige Zugriff auf 250 TB + Dumps von Common Crawl beschrieben ohne Übertragen dieser Datenmenge außerhalb des AWS/S3-Netzwerks von Amazon. Dies setzt natürlich voraus, dass Sie are eine Kombination AWS/EC2/S usw. verwenden, um die Crawl-Daten zu analysieren.

Schließlich pflegt Patrick Durusaeinige interessante Blogseiten, die sich auf die Verwendung von Common-Crawl beziehen .

Persönlich finde ich dieses Thema faszinierend. Ich schlage vor, dass wir diese Crawling-Daten abrufen, solange sie aktuell sind! ;-)

24
Big Rich

Sie können versuchen PublicWWW für die Suche in Quelle/Markup. Es ermöglicht das Auffinden von HTML, JavaScript, CSS und einfachem Text im Quellcode von Webseiten auf mehr als 167 Millionen Websites.

Mit PublicWWW können Sie:

  • Finden Sie verwandte Websites über die eindeutigen HTML-Codes, die sie gemeinsam nutzen, z. B. Widgets und Publisher-IDs.

  • Identifizieren Sie Websites anhand bestimmter Bilder oder Abzeichen.

  • Finden Sie heraus, wer Ihr Thema noch verwendet.
  • Identifizieren Sie Websites, die Sie erwähnen.
  • Finden Sie die Partner Ihres Konkurrenten.
  • Identifizieren Sie Websites, auf denen Ihre Konkurrenten persönlich zusammenarbeiten oder interagieren.
  • Hinweise zur Verwendung einer Bibliothek oder einer Plattform.
  • Finden Sie Codebeispiele im Internet.
  • Finden Sie heraus, wer welche JS-Widgets auf ihren Websites verwendet.
  • ...

Natürlich können Sie nicht nur Ihre Websites finden, die ein Code-/Markup-Snippet verwenden.

6
James Andreenko

Google kann Ihren Code von der Website aus nicht durchsuchen. Sie können http://nerdydata.com/ verwenden. Es ist die beste Codesuchmaschine, die ich verwendet habe! Ich denke, Sie werden Ihren genauen Code von dieser Seite erhalten.

2
Limon Pervez