Wie können wir helfen?
Datenvalidierung
Die meisten Modelle verwenden nicht die Rohdaten direkt, sondern aus diesen abgeleitete Merkmale. Ein Merkmal folgt definierten Rahmenbedingungen und kann anhand problemorientierter Regeln validiert werden.
Datentypen
Ein Merkmal besitzt einen konkreten Datentyp.
- Aufzählung
- Datum
- Fließkommazahl
- Ganzzahl
- Geometrie
- Logischer Typ
- Zeichenkette
- Zeit
Wertebereiche
Numerische Daten und Datumsangaben fallen in einen definierten Wertebereich.
- Intervall von und/oder bis
- Datumsanteile und/oder Zeitfenster
Vorschriften
Eindeutigkeit
Ein Merkmal oder Kombinationen von Merkmalen müssen eindeutig sein.
Kataloge
Einige Merkmale besitzen diskrete Katalogwerte.
- Bundesländer
- Postleitzahlen
- Buslinien
Fremdverweise
Einige Merkmale verweisen auf Merkmale eines anderen Datensatzes und müssen im Wert binär identisch sein.
Muster
Einige Merkmale müssen einem Muster entsprechen.
- Postleitzahl
- ISBN
- Kreditkartennummer
- Telefonnummer
Kreuzverweise
Einige Merkmale müssen ineinander stimmig sein.
Der Beginn eines Ereignisses darf zeitlich nicht nach dem Ende eines Ereignisses liegen. Die Angabe der PLZ einer Adresse erfordert, dass die Punktgeometrie der Adresse sich innerhalb des entsprechenden PLZ-Gebietes befindet.
Korrektheit
Eine gültige Angabe eines Wohnortes anhand einer Adresse mag syntaktisch korrekt sein, aber ob diese Adresse wirklich existiert bzw. die Person auch wirklich dort wohnt, muss überprüft werden. Die Angabe eines Wohnortes anhand des Bundeslandes mag korrekt, aber nicht präzise genug sein.
Vollständigkeit
Notwendige Datenvollständigkeit von Merkmalen bzw. die zur Beantwortung der Fachfragen erforderlichen Merkmale müssen vorliegen.
Konsistenz
Merkmale können sich gegenseitig widersprechen, z.B. kann eine Person verheiratet sein, aber die Altersangabe könnte einen unrealistischen Wert z.B. 10 einnehmen. Auch können Merkmale zu einer Entität sich über mehrere Datenquellen widersprechen.
Einheitlichkeit
Merkmale können definierte Maßeinheiten besitzen. Ein Merkmal sollte alle Werte in der gleichen Maßeinheit z.B. Meter oder Seemeilen aber nicht in unterschiedlichen Einheiten verwalten.