Unter Linux verwendet man folgenden Befehl:
$ grep --color='auto' -P -n "[^\x00-\x7F]" dump.txt
Quelle: How do I grep for all non-ASCII characters?
macOS‘ grep unterstütz dies leider nicht.
Sonntag, 8. März 2020
Unter Linux verwendet man folgenden Befehl:
$ grep --color='auto' -P -n "[^\x00-\x7F]" dump.txt
Quelle: How do I grep for all non-ASCII characters?
macOS‘ grep unterstütz dies leider nicht.
Donnerstag, 23. Januar 2020
Ein Bash-Script, welches täglich meine SVN-Logs auf unerwartete Zugriffe durchgeht, meldete mir gestern:
... 1 Binary file (standard input) matches ...
Dabei handelt es sich um eine Meldung von grep, mit welchem ich die Apache-Logs filtere. Offenbar enthält das Access Log von dieser Woche Inhalte, die grep glauben machen, dass es sich um eine Binärdatei und nicht um eine ASCII/UTF-8-Datei handelt. In Durchgängen in früheren Monaten und Wochen trat dieses Problem nicht auf.
Wenn man sich sicher ist, dass man grep ASCII-Daten füttert, kann man dies mit einem Argument forcieren:
$ grep --text README.txt
So klappt die Auswertung nun auch wieder mit meinem Bash-Script.
Gemäss diesem Unix & Linux Stack Exchange-Artikel erachtet grep eine Datei als Binär, wenn es erstmalig auf das NUL-Zeichen trifft.
Tags: --text, ASCII, Binärdaten, Binary, grep, UTF-8
Labels: IT