Hand in Hand: Datenqualität und eCH in Zürich

Dienstag 03.03.2015 Christian Walter
Christian Walter

Christian Walter ist Geschäftsführer und Redaktionsleiter von swiss made software. Bis Ende 2010 arbeitete er als Fachjournalist für das ICT-Magazin Netzwoche, publizierte zuletzt aber auch im Swiss IT Magazin, der Computerworld sowie inside-it.

Komplexe Daten von einem Format in ein anderes zu transformieren birgt Risiken. Vor allem, wenn unterschiedliche Zielsysteme beliefert werden müssen. Damit hinten das Gleiche herauskommt, wie vorne drinsteht, kommt die Software OMrun zum Einsatz.

Stimmt die Qualität der Daten? Herausforderungen an die Datenintegrität in komplexen Systemlandschaften.

«Never change a running system» lautet ein allseits bekannter IT-Grundsatz, der jedoch immer weniger aktuell ist. Ständig zunehmende Anforderungen erhöhen laufend  die  Komplexität der Systeme.  So wird die Sicherstellung der Datenqualität zu  einer  zentralen  und  erfolgskritischen Herausforderung.

eCH Standard

Auch  das  Informatikkompetenzzentrum der  Stadt  Zürich  (OIZ)  sieht  sich beim Projekt  «OMEGA  services»  mit  diesem Problem konfrontiert. Alpha, die zentrale Drehscheibe  für  die  Personendaten der 400'000 Zürcher Einwohner, hat den Endof-Life-Status erreicht und muss abgelöst werden. Dabei gilt es nicht nur veraltete Technologie zu ersetzen, sondern auch die Funktionalität zu optimieren.

Im Unterschied zum bestehenden System hat  die  Neuentwicklung  OMEGA keine eigene Datenbank. Daten greift es direkt bei  TopaZ  ab,  dem Kernsystem des für die Datenerfassung  zuständigen  Bevölkerungsamts. Anschliessend erfolgt nicht nur die Datenverteilung an die verschiedenen städtischen departemente respektive  deren  Fachapplikationen,  sondern auch deren Transformation in einen eCH-XML-Standard. 

Die Transformation erfolgt im sogenannten  eCH-Engine.  Da  die Anzahl Datenausprägungen  sehr  hoch  ist,  handelt es sich bei diesem Vorgang um eine potenzielle Fehlerquelle. Um das Risiko ungenügender  Datenqualität  zu minimieren, holte  die  OIZ die Firma OMIS mit ins Boot. Das Unternehmen ist spezialisiert auf Problemlösungen im Bereich Datenqualität für Systemumstellungen. Ihre Standardsoftware  OMrun  vergleicht  heterogene Datenquellen regelbasiert und automatisiert  und  verfügt  über einen generischen  sowie einen  dynamischen XML-Konverter. Letzterer wurde für die OIZ zum zentralen Faktor.

Black Box Engine

OMrun verwendet nämlich TopaZ-Daten als Referenz («Golden Source») und stellt diesen die XML-Meldungen der eCH-Engine als Prüfling gegenüber. Möglich wird dies aber erst durch den XML-Konverter, denn eigentlich lassen sich Ursprungsdaten und Ergebnis aus technischen Gründen nicht vergleichen. Der Konverter ermöglicht diesen Schritt und erlaubt denvollautomatischen Abgleich beider Datensätze. Der Transformationsprozess innerhalb der eCH-Engine bleibt dabei aussen vor und wird als Blackbox betrachtet.

Dank dieses simplen Ansatzes kamen zahlreiche Fehler zum Vorschein. Diese basierten entweder auf falschen Transformationsregeln in der eCH-Engine oder auf Datenschiefständen im Quellsystem TopaZ. Das Clevere dabei ist, das OMrun alles als falsch betrachtet, was nicht durch eine Regel definiert ist. Das produziert auch unerwartete Einsichten: Lassen sich Fehler nicht den beiden erwähnten Kategorien zuordnen, müssen sie auf Fehlern in der Quellsoftware basieren. Merzt man diese aus, erfolgt ganz nebenbei ein Re-Engineering der Quellsysteme.

Weitere Details zu OMrun gibt es hier.

mehr davon...

...gibt es im neuen swiss-made-software-Buch "Public Innovation". Erhältlich als Print und eBook hier.