Dienstag, 17. November 2009

Du sollst HTML nicht mit Regex parsen!

or many novice programmers, there’s something unusually seductive about parsing HTML the Cthulhu way instead of, y’know, using a library like a sane person. Which means this discussion gets reopened almost every single day on Stack Overflow. The above post from five years ago could be a discussion from yesterday.

Quelle: Coding Horror: Parsing Html The Cthulhu Way

Auch für mich waren Reguläre Ausdrücke während Jahren das Allheiltmittel, um Informationen im HTML-Format aus dem Web auf den lokalen Server zu ziehen und danach gewisse Informationsstücke daraus zu extrahieren.

Meine (mittlerweile verflossene) Anstellung bei Liip öffnete mir aber die Augen. Das erste Mal, als ich mit Marc Ammann, dem Entwickler von GottaGo, über die Abfrage von Fahrplänen über das Web-Interface der SBB fachsimpelte (die Informatikbeamten des Transportunternehmens stehen nicht so auf frei zugängliche APIs). Ich war völlig naiv der Auffassung, dass auch er den HTML-Output des SBB Online-Fahrplans mit Regex durchparsen würde. Stimmte aber nicht, für etwas gibt es ja DOM! Ich machte mir aber keine weiteren Gedanken dazu, weil ich mir nicht vorstellen konnte, dass es etwas besseres als Regex gäbe, um HTML zu zähmen (dabei arbeitete ich doch für eine XML-Bude).

Das zweite, nun definitiv den Ausschlag gebende Aha-Erlebnis ereignete sich im Frühjahr 2009: Bei den Arbeiten zu energiezukunft.ch setzten wir ein Glossary-Plugin für WordPress ein. Als ich einen Blick auf den Sourcecode dieses Plugins warf, entdeckte ich es — die wohl aus PHP-Sicht heilsbringendste Zeile der letzten Monate:

DOMDocument::loadHTML();

Quelle: DOMDocument::loadHTML();

Weiter ausführen möche ich diesen Fingerzeig nicht weiter. Ich darf aber mit gutem Gewissen sagen, dass ich dank dieser Erleuchtung mittlerweile eine kleine, private Applikation in Version 2 realisiert habe. Während die erste Version munter Reguläre Ausdrücke einsetzt (und dabei immer wieder grandios scheitert), benutzt Version 2 ebendiese Klassen, um die Aufgabe mit schönem, einfachen und leicht wartbaren Code auszuführen. Und plötzlich gehört das Gefrickel der Vergangenheit an.

(Aber ja, HTML kann man weiterhin mit Regulären Ausdrücken parsen — und sollte es auch, wenn es nur darum geht, ein kleines Informationsstückchen aus HTML-Code zu extrahieren, ohne dass man gleich einen ganzen Tag daran rumprogrammieren möchte. Wie beispielsweise ubs.mad4you.homeip.net — wobei ich hier auch eher einen JSON-Parser als Reguläre Ausdrücke verwendet hätte. Was solls, der Kern des Scripts war dank Regulären Ausdrücken innert Minuten geschrieben.)

Tags: , ,
Labels: Web

Keine Kommentare | neuen Kommentar verfassen

Dienstag, 17. November 2009

"Idiots relative to resources"

human reproduction rates are also greatly increasing the supply of idiots relative to resources, and that is especially problematic in the USA, where idiots rule the culture and polity.

Quelle: The Fate of the Yeast People – Clusterfuck Nation

Tags: , ,
Labels: Allgemein

Keine Kommentare | neuen Kommentar verfassen

Freitag, 13. November 2009

Köppel ist definitiv reif für den Vaterschaftsurlaub

Köppels Editorial in der Weltwoche 46.09 kann man ja nun wirklich kaum ernst nehmen — ich würde es als klaren Tiefpunkt in der Geschichte der Köppelschen Weltwoche klassifizieren:

Die vielen Ausfälle, Pannen und Verspätungen der SBB in letzter Zeit sind nicht das Resultat von schlechtem Management, sondern werden durch Übernutzung und Überlastung verursacht.

Quelle: Editorial: Zuwanderung, Weltwoche 46.09, S. 5.

… … …?! Habe ich jetzt richtig gelesen? Köppel zeigt Verständnis für die SBB? Einen Staatsbetrieb?! Zugleich entlässt er das SBB-Management aus jeglicher Schuld — obwohl einige Medien in letzter Zeit darüber berichtet haben, dass es gerade dieses „Management“ verpasst habe, rechtzeitig und in ausreichendem Mass in den Werterhalt der Infrastruktur zu investieren?

Er erwähnt auch die Staus auf den Autobahnen, um zu folgern, dass das Land übervölkert sei. Nun, Staus und Komplikationen im Zugsverkehr gründen nicht zuletzt doch gerade darauf, dass Leute von Köppels Weltauffassung seit jeher den Steuerwettbewerb zwischen den Gemeinden und Kantonen loben. Dies führt konsequenterweise dazu, dass man eben nicht in der Stadt, sondern auf der grünen Wiese sein Häuschen errichtet, mindestens zwei PKWs anschafft und in Zukunft frisch-fröhlich 10-20 Kilometer auf die Arbeit in die Stadt pendelt.

Hat nicht die Weltwoche gerade in der letzten Ausgabe die 150 besten Gemeinden gekürt und dem Ranking eine möglichst tiefe Steuersatz als Hauptkriterium zu Grunde gelegt? Der Verkehrskollaps ist ein Resultat dieser unsinnigen optimalen Fokussierung auf Dinge, die wirklich zählen im Leben! Wer will schon in 5 Minuten auf der Arbeit sein, wenn er alleine in seinem 3 Meter langem, 2 Tonnen schweren Gefährt eine Stunde im Stau stehen kann? Hauptsache, er bezahlt weniger Steuern.

Thomas Held, Chefdenker des Think Tanks Avenir Suisse, verwies in einer Fernsehdiskussion zum Thema kürzlich auf die japanische Metropole Tokio. Will die Schweiz mit ihren sperrangelweit geöffneten Grenzen zum europäischen Pendant eines asiatischen Models werden?

Herr Köppel, schauen sie, ein Rat unter Freunden: Möchten Sie den Chefredaktorposten nicht lieber abgeben und künftig einen mittelmässigen Blog führen? Ihre Recherchefähigkeiten stempeln Sie zu einem völlig inkompetenten Journalisten.

Zugegeben, Tokio ist eine Millionenstadt — als Moloch würde ich die Hauptstadt Japans aber dann doch wieder nicht bezeichnen. Abgesehen davon sollte die japanische Migrationspolitik gerade Sie zu impulsiven Freudentänzen verleiten: Ist es nicht Allgemeinwissen, dass die Japaner in Asien wohl die rigideste Migrationspolitik verfolgen (abgesehen vielleicht von Nordkorea), um ihr Volk und ihre Kultur möglichst homogen zu halten?

Und hier hat Sie dann wohl ihr Baby vom Beenden des Satzes abgehalten:

… Trotz komfortablen Mehrspurtunneln staut sich der Verkehr. Da es an bebaubaren Zonen fehlt, wurden seelenlose Wohnquartiere. Thomas Held, …

Hä?

Tags: , , , ,
Labels: Medien, Politik

1 Kommentar | neuen Kommentar verfassen

Donnerstag, 12. November 2009

Der wahre Grund hinter Ali Kebap

Die ganze Schweiz kennt ihn mittlerweile: Den Kebapbrater, den Hotelbesitzer und Pilot in Personalunion: Ali! Mit dieser schweizweiten Plakataktion zeigt die APG wieder einmal die bleibende Wirkung von Plakatwerbung auf.

Sollte man deshalb der Marketingabteilung des Unternehmens gratulieren? Nun, ich vermute seit Beginn der Kampagne, dass dahinter mehr steckt als reine Eigenwerbung.

Ein Blick in die Tagespresse und die Wirtschaftsblätter der Nation bestätigen meinen Eindruck:

Die Allgemeine Plakatgesellschaft (APG) wappnet sich mit einer Reorganisation für die anhaltende Krise am Werbemarkt. Dabei fallen in der ganzen Schweiz 20 Vollzeitstellen weg.

Quelle: APG baut 20 Stellen ab

Schlussendlich ist Ali also nicht viel mehr als ein Platzhalter für Plakatwerbung, die schlicht und ergreifend nicht mehr geschaltet wird. APG wäre ja sonderlich blöd, wenn man bei einer riesigen Nachfrage nach Plakatfläche das Angebot künstlich verknappen würde. Ali hat höchstens interne Verrechnungen im Konzern zur Folge, ohne dass irgendeine Wertschöpfung stattfindet.

Natürlich kann man nun argumentieren: Aber der Bekanntheitsgrad der APG steigt doch mit dieser Aktion! Veto — ein Unternehmen, dass 75 Prozent Marktanteil hält, hat Eigenwerbung wohl kaum nötig.

Tags: , , ,
Labels: Schweiz, Wirtschaft

1 Kommentar | neuen Kommentar verfassen

Donnerstag, 12. November 2009

Vista stabiler als Mac OS X

We’ve significantly improved the graphical user interface, but it’s built on that very stable core Vista technology, which is far more stable than the current Mac platform, for instance.

Quelle: AppleInsider | Microsoft official admits Windows 7 design inspired by Mac OS X

Der glaubt wohl tatsächlich, was er da rumposaunt … Rock Solid Unix — BSD mit Mach Microkernel, sag‘ ich als Mac-Verfechter nur.

Tags:
Labels: Apple

Keine Kommentare | neuen Kommentar verfassen

Sonntag, 8. November 2009

Computerspiele sind unschädlich!

“Computer games don’t affect kids; I mean if Pac-Man affected us kids, we’d all be running around in darkened rooms, munching magic pills and listening to repetitive electronic music.”

Quelle: Facebook | Alison M. …

Tags: ,
Labels: Funny

1 Kommentar | neuen Kommentar verfassen

Sonntag, 8. November 2009

Die Deutschen — ein Volk von Schnäppchenjägern

In Deutschland ist die Spezies der Schnäppchenjäger laut Konsumforschern wesentlich stärker verbreitet als in anderen Ländern. «In Deutschland steht der Preis immer im Mittelpunkt, wenn das Geschäft angekurbelt werden soll. Durch die Dauerberieselung mit solcher Werbung auf allen Kanälen sind die Deutschen zu Schnäppchenjägern erzogen worden», sagt Manfred Twardawa von der Gesellschaft für Konsumforschung (GfK).

Quelle: Das Land der Schnäppchenjäger (Wirtschaft, Aktuell, NZZ Online)

Tags:
Labels: Allgemein

Keine Kommentare | neuen Kommentar verfassen

Samstag, 7. November 2009

Überbevölkertes Indien

„What happens if India trains all these talents and then they leave the country?“ – The answer was: „What happens, if India doesn’t train all these talents and they stay in the country?“.

Quelle: Facebook | Christoph Burgdorfer is at NASSCOM …

Tags: ,
Labels: Allgemein

Keine Kommentare | neuen Kommentar verfassen

Samstag, 7. November 2009

Geschenk an die nächste Generation

We might also say that there is something tawdry about insisting that modern living standards are not negotiable and must be preserved with high public sector debt. In effect, today’s policy makers are saying to the future, „Our current well-being and comfort is more important than any debt you may have to repay. We refuse to live within our means because it would inconvenience us to do so. We are too lazy and selfish to recognise our financial mistakes and pay for them. We’re going to leave that to you. Suckers!“

Quelle: More Money in Cash Right Now Than Equity in U.S. Companies

Tags: ,
Labels: Allgemein

Keine Kommentare | neuen Kommentar verfassen

Samstag, 7. November 2009

IT-Departemente des 21. Jahrhunderts

I was frustrated that we continually kept creating new documentation within the department, and that our servers were always filled lots of outdated and bloated Microsoft Office documents.

Quelle: Implementing an internal wiki – Dan Collins on the Powerhouse’s rollout of Confluence

IT-Departemente, die auch heute, 2009, noch eine solche dateibasierte Dokumentation in proprietären Dateiformaten pflegen, müssen schlichtwegs die schlimmsten IT-Arbeitsplätze dieser Welt sein. Keine 1’000 Pferde würden mich dazu bewegen, zu einer solchen Bude arbeiten zu gehen.

Besitzt ein IT-Departement ein anständiges Wiki, welches von seinen Mitarbeitern gehegt und gepflegt wird, ist das nicht zuletzt auch ein Ausdruck einer fortschrittlichen, offenen und ergebnisorientierten Firmekultur.

Nachtrag

Im selben Artikel kommt auch eines der von mir am heissesten geliebten CMS unter die Räder:

However, I found that Drupal required a large investment in time to understand how all the various components and plugins fitted together. Whilst Drupal is a very flexible tool and there was never just one particular way to achieve what you were after – which has its benefits -but also posed a number of difficulties.

Tags:
Labels: IT

Keine Kommentare | neuen Kommentar verfassen