ChatGPT für die DatenbereinigungDatenqualität prüfen und überwachen – von einmaliger Bereinigung zu nachhaltiger Kontrolle

ChatGPT hilft nicht nur beim Bereinigen von Daten, sondern auch beim Sichern von Datenqualität. Wer Datenqualität so überwacht, muss weniger reparieren, kann verlässlicher analysieren und souveräner argumentieren.

Das Problem: Datenprüfung zur Routine machen

Nach einer erfolgreichen Datenbereinigung tritt häufig ein trügerisches Gefühl ein: „Die Daten sind jetzt sauber – das passt schon.“ In der Praxis zeigt sich jedoch schnell:

  • Neue Datenimporte bringen alte Probleme zurück.
  • Manuelle Eingaben unterlaufen Regeln.
  • Datenquellen ändern Formate oder Inhalte.
  • Kleine Abweichungen bleiben lange unbemerkt.

Die Folgen sind:

  • schleichender Qualitätsverlust
  • wachsende Unsicherheit bei Auswertungen
  • Diskussionen über Zahlen statt über Inhalte

Der entscheidende Punkt ist deshalb: Datenqualität ist kein Zustand, sondern ein Prozess.

Der passende Prompt (Beispiel)

Der Perspektivwechsel lautet: Nicht mehr „Wie bereinige ich Daten?“, sondern „Wie erkenne ich frühzeitig Qualitätsprobleme?“ Ein sinnvoller Prompt wäre zum Beispiel:

„Ich möchte die Qualität meiner Excel-Daten dauerhaft überwachen.

Bitte zeige mir sinnvolle Ansätze, wie ich Datenqualitätsprüfungen aufbauen kann, um typische Probleme frühzeitig zu erkennen und transparent zu machen.“

Dieser Prompt zielt auf Prävention statt Reparatur sowie auf Transparenz statt Überraschung.

Wie übergibt man das Szenario an ChatGPT?

Für die Entwicklung von Qualitätsprüfungen benötigt ChatGPT vor allem fachliche Kriterien. Hilfreich sind Angaben wie:

  • Welche Felder sind kritisch? Datum, Betrag, Status
  • Welche Regeln gelten fachlich? Darf leer sein / darf nicht leer sein, Wertebereiche, erlaubte Ausprägungen
  • Welche Probleme treten erfahrungsgemäß auf? Fehlende Werte, Ausreißer, falsche Typen

Entscheidend ist die Definition von „guten Daten“.

Was ChatGPT daraufhin leistet

ChatGPT denkt hier nicht in Korrekturen, sondern in Kontrollmechanismen. Typische Ergebnisse sind:

Vorschläge für Qualitätskriterien:

  • Vollständigkeit
  • Plausibilität
  • Konsistenz
  • Aktualität

Ideen für konkrete Prüfungen, etwa:

  • Kennzeichnung fehlender Pflichtwerte
  • Zählung ungewöhnlicher Ausprägungen
  • einfache Plausibilitätschecks
  • Vergleich mit Erwartungswerten

Einordnung geeigneter Werkzeuge:

  • Formeln für schnelle Sichtprüfungen
  • Power Query für systematische Prüfungen
  • Pivot-Auswertungen für Monitoring

Dabei liefert ChatGPT kein kompliziertes Regelwerk und kein theoretisches Datenqualitätsmodell. Der Fokus liegt auf der praktischen Überwachung.

Worauf man beim Prompt achten sollte

Damit ChatGPT sinnvolle Prüfungen vorschlägt, sollte man:

  • zwischen kritischen und unkritischen Feldern unterscheiden,
  • klar benennen, was fachlich akzeptabel ist und
  • bewusst entscheiden, was nur Hinweis und was Fehler ist.

Damit das Monitoring praktikabel bleibt, ergänzen Sie:

„Welche Prüfungen liefern schnellen Mehrwert?“

„Wie kann ich Probleme sichtbar machen, ohne Daten zu blockieren?“

„Welche Prüfungen sind typisch für diesen Datentyp?“

Wie man das Ergebnis sinnvoll nutzt

Der größte Nutzen entsteht durch frühe Sichtbarkeit:

  • Qualitätsprobleme werden erkannt, bevor sie sich auswirken.
  • Diskussionen basieren auf Fakten.
  • Der Bereinigungsaufwand sinkt.
  • Das Vertrauen in Berichte steigt.

In der Praxis wird ChatGPT hier eingesetzt als:

  • Sparringspartner bei der Definition von Qualitätsregeln
  • Ideengeber für Prüfmechanismen
  • Unterstützung beim Aufbau einfacher Qualitäts-Dashboards

Bewährte Prompts für die Praxis

Qualitätskriterien definieren

„Welche Kriterien eignen sich, um die Qualität dieser Daten zu beurteilen?“

Prüfungen priorisieren

„Welche Datenqualitätsprüfungen liefern mit wenig Aufwand den größten Nutzen?“

Monitoring aufbauen

„Wie kann ich Datenqualitätsprobleme in Excel sichtbar machen?“

Risikoanalyse

„Welche typischen Qualitätsrisiken gibt es bei diesen Daten?“

Didaktischer Prompt

„Bitte erkläre mir Datenqualität so, dass ich sie fachlich vertreten kann.“

Einordnung und Fazit

Viele Excel-Dateien scheitern nicht an fehlenden Funktionen, sondern an fehlender Datenqualitätskontrolle. ChatGPT hilft dabei:

  • Qualität als Prozess zu denken
  • Prüfungen gezielt aufzubauen
  • Datenpflege von Zufall zu System zu machen

Dazu im Management-Handbuch

Vorlagen nutzen

Weitere Kapitel zum Thema