$ pdfseparate receipts.pdf %d.pdf
pdfseparate ist im Debian-Paket poppler-utils und im MacPorts-Paket poppler enthalten.
Sonntag, 8. Oktober 2023
$ pdfseparate receipts.pdf %d.pdf
pdfseparate ist im Debian-Paket poppler-utils und im MacPorts-Paket poppler enthalten.
Tags: extrahieren, PDF, pdfseparate, poppler, poppler-utils, Seiten
Labels: IT
Montag, 17. Juli 2006
Die meisten Power-User werden es kennen: Da hat man eine PDF-Datei vor sich, die Bilder enthält. Und an diese Bilder will man rankommen. Aber wie?
Kein Problem, wie immer eilt uns OSS zu Hilfe:
pdfimages -j datei.pdf ~/JPEGs/
Sofern das Dokument nicht geschützt ist, werden mit diesem Kommandozeilen-Befehl alle Bilder der Datei datei.pdf im Format JPEG in den angegebenen Ordner extrahiert.
Folgender, leicht angepasster Befehl habe ich im August 2018 verwendet:
pdfimages -all -p datei.pdf gugus
Der Präfix resp. der Ordner gugus ist wichtig; gibt man bspw. . (Punkt) an, werden keine Bilder extrahiert. -all weist pdfimages an, jegliche Art von Bildern zu extrahieren, mit -p werden dem Dateinamen neben dem Präfix die Seiten- und Bildnummer mitgegeben.
Damit das unter macOS klappt, muss das MacPorts-Paket poppler installiert sein.
Tags: extrahieren, GIF, JPEG, PDF, pdfimage, PNG, TIFF
Labels: Linux