Datenvalidierung

Du bist hier:
Inhaltsverzeichnis

Die meisten Modelle verwenden nicht die Rohdaten direkt, sondern aus diesen abgeleitete Merkmale. Ein Merkmal folgt definierten Rahmenbedingungen und kann anhand problemorientierter Regeln validiert werden.

Datentypen

Ein Merkmal besitzt einen konkreten Datentyp.

  • Aufzählung
  • Datum
  • Fließkommazahl
  • Ganzzahl
  • Geometrie
  • Logischer Typ
  • Zeichenkette
  • Zeit

Wertebereiche

Numerische Daten und Datumsangaben fallen in einen definierten Wertebereich.

  • Intervall von und/oder bis
  • Datumsanteile und/oder Zeitfenster

Vorschriften

Eindeutigkeit

Ein Merkmal oder Kombinationen von Merkmalen müssen eindeutig sein.

Kataloge

Einige Merkmale besitzen diskrete Katalogwerte.

  • Bundesländer
  • Postleitzahlen
  • Buslinien

Fremdverweise

Einige Merkmale verweisen auf Merkmale eines anderen Datensatzes und müssen im Wert binär identisch sein.

Muster

Einige Merkmale müssen einem Muster entsprechen.

  • Postleitzahl
  • ISBN
  • Kreditkartennummer
  • Telefonnummer

Kreuzverweise

Einige Merkmale müssen ineinander stimmig sein.

Der Beginn eines Ereignisses darf zeitlich nicht nach dem Ende eines Ereignisses liegen. Die Angabe der PLZ einer Adresse erfordert, dass die Punktgeometrie der Adresse sich innerhalb des entsprechenden PLZ-Gebietes befindet.

Korrektheit

Eine gültige Angabe eines Wohnortes anhand einer Adresse mag syntaktisch korrekt sein, aber ob diese Adresse wirklich existiert bzw. die Person auch wirklich dort wohnt, muss überprüft werden. Die Angabe eines Wohnortes anhand des Bundeslandes mag korrekt, aber nicht präzise genug sein.

Vollständigkeit

Notwendige Datenvollständigkeit von Merkmalen bzw. die zur Beantwortung der Fachfragen erforderlichen Merkmale müssen vorliegen.

Konsistenz

Merkmale können sich gegenseitig widersprechen, z.B. kann eine Person verheiratet sein, aber die Altersangabe könnte einen unrealistischen Wert z.B. 10 einnehmen. Auch können Merkmale zu einer Entität sich über mehrere Datenquellen widersprechen.

Einheitlichkeit

Merkmale können definierte Maßeinheiten besitzen. Ein Merkmal sollte alle Werte in der gleichen Maßeinheit z.B. Meter oder Seemeilen aber nicht in unterschiedlichen Einheiten verwalten.

Schlagwörter:
Weiter Datenverfahren