Dienstag, 14. Oktober 2008, 14:20 Uhr

Wörter von LaTeX-Dokumenten zählen

Ein klitzekleiner Vorteil hat Microsoft Word gegenüber LaTeX: Es ist äusserst simpel, die Anzahl Wörter und Zeichen eines Dokuments abzufragen.

Da LaTeX aber Inhalt mit Markup vermischt, ist es für solche Dokumente nicht trivial, eine aussagekräftige Zahl zu erhalten.

Glücklicherweise hat sich ein Perl-Jünger dieses Mankos angenommen und ein entsprechendes Script programmiert:

LaTeX word count: script and web-interface

Nachdem man dieses Script heruntergeladen und am geeigneten Ort installiert hat, produziert eine Ausführung folgende Ausgabe:

$ /usr/local/bin/TeXcount.pl *.tex
...
TotalSUM
Words in text: 7862
Words in headers: 115
Words in float captions: 525
Number of headers: 47
Number of floats: 0
Number of math inlines: 8
Number of math displayed: 0

Einen Wunsch hätte ich noch: Die Ausgabe der Zeichenzahl. Diese rechne ich derzeit mit 5 x 7862 hoch – von der Annahme ausgehend, dass deutsche Worter im Schnitt 5 Buchstaben besitzen.

Tags:
Labels: Allgemein

Kommentar erfassen