Excel mit ChatGPTDatenbereinigung in Power Query mit ChatGPT

Wie Sie unterschiedliche Eingaben und „unsaubere“ Einträge in Ihren Datenquellen mit einem genauen Prompt für eine Power-Query-Abfrage bereinigen und logisch strukturierte Daten für die Analyse erhalten.

Das Problem mit Daten aus unterschiedlichen Quellen

Daten, die aus externen Quellen, anderen Dateien oder manuellen Eingaben stammen, sind selten „sauber“. Typische Probleme sind:

  • führende oder doppelte Leerzeichen
  • uneinheitliche Groß- und Kleinschreibung
  • unterschiedliche Schreibweisen desselben Begriffs
  • Sonderzeichen, Bindestriche oder Unterstriche
  • Textzusätze, die eigentlich keine fachliche Bedeutung haben

In Excel werden solche Probleme oft mit Formeln gelöst – manchmal mühsam und fehleranfällig. Power Query ist für genau diese Aufgaben gemacht, wird aber in der Praxis häufig klickbasiert und unsystematisch eingesetzt.

Der entscheidende Punkt ist nicht, wie man Leerzeichen entfernt, sondern wie man Datenbereinigung logisch strukturiert.

Der passende Prompt (Beispiel)

Statt einzelne Bereinigungsschritte abzufragen, ist es sinnvoll, das Ziel klar zu formulieren:

„Ich habe eine bestehende Power-Query-Abfrage mit unsauberen Textdaten.
Bitte entwickle eine saubere, nachvollziehbare Datenbereinigungslogik für Power Query, die typische Probleme löst:
– Leerzeichen bereinigen
– Schreibweisen vereinheitlichen
– Formate korrigieren
– Texte normalisieren.
Die Abfrage soll übersichtlich aufgebaut sein und sich gut erweitern lassen.“

Der Prompt lenkt ChatGPT auf das Prinzip der Bereinigung, nicht auf einzelne Klicks.

Wie übergibt man die Daten an ChatGPT?

Damit ChatGPT eine direkt nutzbare Lösung liefert, werden die bestehende Abfrage oder vorhandene Musterdaten benötigt. Deshalb übergeben Sie mit dem Prompt:

  • entweder den vollständigen M-Code einer bestehenden Abfrage,
  • oder einen kurzen Ausschnitt typischer Rohdaten (zum Beispiel ein paar Beispielzeilen als Text).

ChatGPT benötigt keine vollständige Datei, sondern nur ein Verständnis für das Datenformat und das gewünschte Ziel der Bereinigung. Gerade bei Textbereinigung reichen oft wenige Beispielwerte, um Muster zu erkennen.

Was ChatGPT daraufhin leistet

ChatGPT denkt bei der Datenbereinigung nicht in Einzelschritten, sondern in logischen Ebenen. Typischerweise entsteht eine Struktur wie:

Grundlegende Textbereinigung

  • führende und doppelte Leerzeichen entfernen
  • unerwünschte Sonderzeichen ersetzen

Normalisierung

  • Groß- und Kleinschreibung vereinheitlichen
  • alternative Schreibweisen angleichen
  • konsistente Bezeichnungen herstellen

Formatkorrekturen

  • Zahlen- und Datumsformate korrigieren
  • fehlerhafte Typen robust abfangen

Optionale fachliche Bereinigung

  • irrelevante Textteile entfernen
  • Kommentare oder Zusatzinfos abschneiden

Das Ergebnis ist meist eine klar strukturierte Abfrage mit wenigen, gut benannten Schritten, die sich leicht erweitern lässt.

Worauf man beim Prompt achten sollte

Der entscheidende Unterschied liegt darin, wie man konkret die Bereinigung beschreibt:

  • Wer nur „Leerzeichen entfernen“ schreibt, bekommt meist eine einfache Lösung.
  • Wer hingegen das Ziel der Normalisierung benennt, erhält eine durchdachte Bereinigungslogik.

Hilfreiche Ergänzungen im Prompt sind beispielsweise:

robust gegenüber Ausreißern

nicht nur kosmetisch, sondern fachlich sinnvoll

gut lesbare Schrittnamen

geeignet für spätere Erweiterungen

Je klarer das Ziel, desto besser wird die Struktur der Abfrage.

Wie man das Ergebnis sinnvoll nutzt

Der größte Nutzen entsteht, wenn man Datenbereinigung nicht als Einmalaktion betrachtet:

  • Die Abfrage wird zur zentralen Bereinigungslogik.
  • Neue Dateien können immer wieder durch dieselbe Logik laufen.
  • Formeln in Excel werden deutlich einfacher.
  • Nachgelagerte Auswertungen werden stabiler.

In der Praxis wird ChatGPT hier oft genutzt als:

  • Entwurfshelfer für Bereinigungsregeln
  • Übersetzer fachlicher Anforderungen in Power-Query-Logik
  • Qualitätsfilter vor Reporting und Analyse
  • Grundlage für standardisierte Importprozesse

Fazit

Dieser Praxisfall zeigt, dass Datenbereinigung mehr ist als das Entfernen von Leerzeichen. ChatGPT hilft dabei, aus unsauberen Rohdaten eine saubere, nachvollziehbare Struktur zu entwickeln – nicht durch Klicks, sondern durch Logik.

Gerade in Power Query ist das entscheidend, denn gut strukturierte Bereinigungslogik ist leichter zu verstehen, einfacher zu warten, robuster gegenüber neuen Daten und langfristig deutlich effizienter.

Dazu im Management-Handbuch

Vorlagen nutzen

Weitere Kapitel zum Thema