Mittwoch, September 12, 2007

Mit wget ganze Sites abräumen

wget -r -nd -np -erobots=off "http://server.tld/"
  • -r recursive (= folge und Downloade alle verlinkten Dokumente wie HTML-Dateien und Bilder)
  • -nd nodirectories (= lege Downloads nicht in Unterordner ab)
  • -np noproblem ... eh ... noparent (= folge keinen Links, die eine Ordner-Ebene höher liegen)
  • -erobots=off evaluate robots.txt (= beachte robots.txt)

Im Netz habe ich auch noch diese Version gefunden:

wget -m -k -K -E "http://server.tld/"

Hat ebenso gut geklappt.

Labels: ,

3 Kommentare | neuen Kommentar verfassen

Kommentare

neuen Kommentar verfassen

Blogger callcenterjunkie um 12.09.2007 09:51:00 Uhr

Mario, hast Du Dir damit eine "Sicherheitskopie" von PG gezogen? ^^

Anonymous mix um 12.09.2007 12:12:00 Uhr

leider ziehts css-files&co nicht mit.. :/

Blogger eMeidi um 13.09.2007 00:53:00 Uhr

@callcenterjunkie: *grins* Nein, leider nicht. Aber für was auch, wenn man root-Zugang auf das Produktiv-System hat? (Just kidding, lieber Oli ...)