Dienstag, 11. September 2007, 22:15 Uhr

Mit wget ganze Sites abräumen

wget -r -nd -np -erobots=off "http://server.tld/"

-r recursive (= folge und Downloade alle verlinkten Dokumente wie HTML-Dateien und Bilder)
-nd nodirectories (= lege Downloads nicht in Unterordner ab)
-np noproblem … eh … noparent (= folge keinen Links, die eine Ordner-Ebene höher liegen)
-erobots=off evaluate robots.txt (= beachte robots.txt)

Im Netz habe ich auch noch diese Version gefunden:

wget -m -k -K -E "http://server.tld/"

Hat ebenso gut geklappt.

Labels: Linux, Web

Dieser Eintrag wurde am Dienstag, 11. September 2007 um 22:15 aufgeschaltet und ist unter den Labels Linux, Web abgelegt. Du kannst das Blog auch über RSS 2.0 abonnieren. Du kannst einen Kommentar oder einen Trackback hinterlassen.

Kommentar erfassen

think eMeidi

zur Startseite

Mario Aeby, geboren am 25. September 1980 in Bern, Schweiz

Ein Weblog über IT (Linux, OSS, Apple), Heim-Automation; mein mittlerweile abgeschlossenes Geschichtsstudium; Erkenntnisse aus meiner aktuellen Tätigkeit in der Informationssicherheit, meine Erfahrungen als IT-Berater, IT-Auditor, Web-Developer und IT-Supporter; die Schweiz, den Kanton Bern, meine ursprüngliche und auch wieder aktuelle Wohngemeinde Neuenegg, meine vorherige Wohngemeinde Bern, über lokale, regionale und globale Politik; meine Reisetätigkeit und Erfahrungen mit anderen Kulturen; und zu Guter letzt auch das Älter werden.

Alle in diesem Blog gemachten Aussagen und Meinungen sind persönlich und nicht als Ansichten meines aktuellen und/oder meiner bisherigen Arbeitgeber zu verstehen.

M	D	M	D	F	S	S
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

Mit wget ganze Sites abräumen

Kommentar erfassen

think eMeidi

Abonnieren

Vorherige Artikel

Kalender

Suche

Archiv