it-swarm.com.de

Webspider für Ubuntu

Ich suche einen Web-Spider für Ubuntu wie diesen Webripper - Calluna Software . Sie können eine ganze Site herunterladen, wie Sie es mit können

wget -r -m example.com

aber die Funktion, nach der ich suche, ist, dass Sie einen Suchbegriff wie "Linux" eingeben können, der das Web durchsucht und diese herunterlädt. Gibt es auf Ubuntu solche Programme?

11
zeitue

Mit Google Alerts können Sie eine Art Suchseite erstellen, die an einen Feed gesendet wird, und diese dann mit einem RSS-Reader oder Thunderbird lesen.

Ich benutze Thunderbird für RSS. Ich weiß nicht, ob es RSS-Reader gibt, die den Feed in einfaches HTML exportieren könnten.

4
To Do

Geben Sie httrack (CLI) oder webhttrack (Webinterface) ein, es ist im Universumsrepo. Ich bin mir nicht sicher, welches Suchwort-Feature Sie beschreiben, aber es bietet eine Reihe leicht konfigurierbarer Optionen.

http://packages.ubuntu.com/de/oneiric/webhttrack

HTTrack Website Copier - Freie Software Offline Browser (GNU GPL)

9
bkzland

Sie können http ripper ausprobieren.

Hier sind einige Funktionen, die auf der Website veröffentlicht wurden:

Free Software (GPL 3)
Generic (works with almost every website)
Runs on GNU/Linux and Windows
Nearly undetectable / blockable by servers
Built with python and pygtk

http://29a.ch/httpripper/screenshots/2.pngBildschirmfoto

Sehen Sie sich ein Tutorial des Entwicklers von httpripper an:

Download-Link:

Es hat bei mir unter Ubuntu 11.10 x64 funktioniert

3
blade19899