ChatGPT für die DatenbereinigungFehlerhafte und fehlende Werte behandeln und Daten bereinigen

Für eine konsistente Datenanalyse sollten die Rohdaten fehlerfrei und vollständig sein. In der Praxis ist das aber selten der Fall. So hilft ChatGPT bei der situativen Behandlung von Fehlern und fehlenden Daten in Excel.

Das Problem: In einer Excel-Zelle steht nichts Vernünftiges drin

In nahezu jeder Datenquelle treten fehlende oder fehlerhafte Werte auf. So gibt es in Excel-Daten:

  • leere Zellen
  • Platzhalter wie „n. v.“, „k. A.“, „–“
  • Fehlerwerte (#NV, #DIV/0!, #WERT!)
  • unvollständige Datensätze
  • fachlich ungültige Werte

Oft werden diese Probleme spontan gelöst:

  • Einzelne Zellen werden manuell korrigiert.
  • Fehler werden ausgeblendet.
  • Berechnungen werden mit WENNFEHLER() „ruhiggestellt“.

Das führt kurzfristig zu Ruhe – langfristig jedoch zu Intransparenz und falschen Ergebnissen.

Der passende Prompt (Beispiel)

Der entscheidende Schritt ist, nicht nach einer schnellen Korrektur, sondern nach einer Behandlungsstrategie zu fragen. Ein Prompt wäre zum Beispiel:

„Ich habe in Excel Daten mit fehlenden und fehlerhaften Werten. Bitte entwickle eine systematische Strategie, wie solche Werte sinnvoll behandelt werden können:
– wann ersetzen
– wann ignorieren
– wann kennzeichnen
– und wann bewusst stehen lassen.

Erkläre mir das Prinzip und geeignete Umsetzungswege.“

Dieser Prompt zielt auf Transparenz statt Verschleierung sowie auf Systematik statt Einzelfall.

Wie übergibt man die Daten an ChatGPT?

Für diesen Praxisfall reicht eine Beschreibung der Fehlerarten völlig aus. Hilfreich sind entsprechend:

  • typische Fehlerwerte
  • Hinweise auf fachliche Bedeutung
  • Information, ob Werte zwingend benötigt werden

Beispielhafte Hinweise:

„Leere Mengenwerte sind fachlich nicht zulässig.“

„Fehlende Preise sollen später ergänzt werden.“

„Divisionen können zu 0 führen.“

Entscheidend ist nicht der Fehler selbst, sondern seine Bedeutung im fachlichen Kontext.

Was ChatGPT daraufhin leistet

ChatGPT betrachtet Fehlerwerte nicht als Excel-Problem, sondern als Datenqualitätsfrage. Ergebnisse der KI sind:

eine Klassifizierung von Problemfällen:

  • technisch fehlend
  • fachlich unbekannt
  • rechnerisch ungültig

Vorschläge für sinnvolle Strategien:

  • gezieltes Ersetzen
  • bewusste Kennzeichnung
  • getrennte Behandlung in Auswertungen

Einordnung der Risiken:

  • verdeckte Fehler durch pauschales WENNFEHLER()
  • verfälschte Durchschnittswerte
  • scheinbar „saubere“ Reports mit falscher Basis

ChatGPT setzt fehlende oder fehlerhafte Daten nicht einfach auf Null (0), sondern macht konkrete Vorschläge zur Fehlerbehandlung.

Worauf man beim Prompt achten sollte

Damit ChatGPT sinnvoll helfen kann, sollte man:

  • den fachlichen Kontext klar beschreiben
  • nicht nur sagen, dass ein Fehler existiert, sondern auch: warum
  • explizit nach Alternativen fragen

Hilfreiche Ergänzungen sind:

„Welche Risiken entstehen, wenn ich Fehlerwerte unterdrücke?“

„Wie kann ich fehlerhafte Werte sichtbar lassen, ohne Auswertungen zu stören?“

„Welche Strategie ist fachlich vertretbar?“

So wird ChatGPT zum Qualitätspartner, nicht zum Fehlerunterdrücker.

Wie man das Ergebnis sinnvoll nutzt

Eine systematische Fehlerbehandlung bringt mehrere Vorteile:

  • höhere Datenqualität
  • transparentere Auswertungen
  • bessere fachliche Diskussionen
  • klarere Verantwortlichkeiten

In der Praxis wird ChatGPT hier eingesetzt als:

  • Sparringspartner bei Datenqualitätsfragen
  • Unterstützung bei der Definition von Regeln
  • Entscheidungshilfe zwischen „ersetzen“ und „offenlegen“

Bewährte Prompts für die Praxis

Fehlerarten klassifizieren

„Bitte hilf mir, fehlende und fehlerhafte Werte fachlich zu klassifizieren.“

Strategien vergleichen

„Wann ist Ersetzen sinnvoll und wann problematisch?“

Transparenz wahren

„Wie kann ich Fehler sichtbar lassen, ohne meine Auswertung zu zerstören?“

Risikoanalyse

„Welche Risiken birgt der Einsatz von WENNFEHLER in Berichten?“

Didaktischer Prompt

„Bitte erkläre mir den Umgang mit Fehlerwerten so, dass ich ihn fachlich begründen kann.“

Einordnung und Fazit

Fehlerwerte sind kein Zeichen schlechter Arbeit – sie sind ein normaler Bestandteil realer Daten. Das eigentliche Risiko entsteht erst, wenn sie unkontrolliert verborgen werden.

ChatGPT hilft nicht beim Wegrechnen von Fehlern, sondern beim richtigen Umgang mit ihnen. Sie können

  • Fehler gezielt behandeln,
  • Regeln definieren und
  • Datenqualität systematisch verbessern.

Eine saubere Fehlerstrategie ist Voraussetzung für belastbare Analysen und Vertrauen in Zahlen.

Dazu im Management-Handbuch

Vorlagen nutzen

Weitere Kapitel zum Thema