Kürzlich lud ich bei einer Bekannten die Software WirelessNetView auf den Laptop und erstellte damit eine Liste aller WLAN-Netzwerke in der Nachschaft. Die Liste speicherte ich im HTML-Format ab.
Als ich aber die so generierte HTML-Datei in Notepad++ anschaute, musste ich realisieren, dass die Ausgabe in einem speziellen Zeichensatz abgelegt war (UTF-16?): Hinter jedem alphanumerischen Zeichen fand sich noch ein zweites Zeichen, einem Null-Byte.
Wie säubert man eine solche Datei, damit man diese anschliessend greppen oder anderweitig verwursteln kann? Ganz einfach:
$ tr -d '\00' < wlan-ssids.htm > wlan-ssids.txt