Python in Excel – GrundlagenNeue Möglichkeiten im Controlling mit Python und Excel

Das Controlling im Wandel: Von Tabellen zu Datenarchitekturen
Excel – Stärke im Frontend, Grenzen im Backend
Python – Datenverarbeitung als strukturierter Prozess
Konkretes Beispiel: Berechnung eines Deckungsbeitrags
Praxisfall: Monatsreporting mit 1,2 Millionen Datensätzen
Erklärung der einzelnen Schritte
Der strategische Mehrwert
Excel bleibt – aber in neuer Rolle
Auswirkungen auf das Rollenbild des Controllers
Fazit

Das Controlling im Wandel: Von Tabellen zu Datenarchitekturen

Über Jahrzehnte war das Controlling stark tabellenorientiert. Excel entwickelte sich zum universellen Werkzeug für:

Budgetplanung
Forecast
Investitionsrechnungen
Abweichungsanalysen
Management-Reporting

Excel ist flexibel, intuitiv und in nahezu jedem Unternehmen verfügbar. Kaum ein Reporting-Prozess kommt ohne Excel aus. Doch die Rahmenbedingungen haben sich grundlegend verändert:

Datenvolumina steigen exponentiell.
Transaktionsdaten werden granularer.
Datenquellen werden vielfältiger.
Entscheidungszyklen verkürzen sich.
Prognoseanforderungen werden komplexer.

Während früher monatliche Aggregationen ausreichten, erwarten Management und Märkte heute tiefere Analysen, schnellere Aktualisierung und höhere Prognosequalität. Hier stößt die klassische Tabellenlogik zunehmend an strukturelle Grenzen.

Excel – Stärke im Frontend, Grenzen im Backend

Excel ist hervorragend geeignet für:

Visualisierung
Szenariorechnungen
flexible Modellierung
Management-Präsentationen

Doch Excel arbeitet zellenbasiert. Das bedeutet:

Jede Berechnung steht in einer einzelnen Zelle.
Formeln werden kopiert.
Die Logik verteilt sich über mehrere Arbeitsblätter.
Prozesse sind oft nur implizit dokumentiert.

Bei kleinen Datenmengen ist das effizient. Bei Hunderttausenden oder Millionen Datensätzen wird es problematisch. Denn:

Die Performance leidet.
Es entstehen mehr Fehlerquellen.
Prozesse sind schwer reproduzierbar.
Die Versionierung wird unübersichtlich.

Excel bleibt damit ein starkes Analyse-Frontend – aber keine optimale Datenverarbeitungs-Engine für große und komplexe Datenstrukturen.

Python – Datenverarbeitung als strukturierter Prozess

Python hat sich weltweit zur führenden Sprache für Datenanalyse entwickelt. Der Grund liegt nicht in technischer Komplexität, sondern in struktureller Klarheit. Anders als Excel denkt Python nicht in Zellen, sondern in Datenstrukturen.

Das zentrale Element ist der sogenannte DataFrame (zum Beispiel über die Bibliothek pandas). Ein DataFrame ist eine Tabelle – allerdings mit programmierbaren Methoden.

Der entscheidende Unterschied ist: In Excel wird Logik häufig visuell modelliert. In Python wird Logik explizit definiert. Das sorgt für bessere:

Transparenz
Reproduzierbarkeit
Skalierbarkeit
Dokumentierbarkeit

Gerade in prüfungsrelevanten oder regulierten Umgebungen ist das ein erheblicher Vorteil.

Konkretes Beispiel: Berechnung eines Deckungsbeitrags

Im klassischen Excel-Modell würde man in einer Zelle wie C1 eine Formel hinterlegen, um den Deckungsbeitrag zu berechnen. Zum Beispiel in der Form =A1-B1. Diese Formel würde man dann für die gesamte Spalte kopieren und am Ende eine Summe über die Spalte C bilden.

In Python sieht die Berechnung so aus:

df["Deckungsbeitrag"] = df["Umsatz"] - df["variable_Kosten"]

Was passiert hier genau?

df ist ein DataFrame – also eine komplette Tabelle.
df["Umsatz"] greift auf die gesamte Umsatzspalte zu.
df["variable_Kosten"] greift auf die gesamte Spalte mit den variablen Kosten zu.
Die Subtraktion wird automatisch zeilenweise für alle Datensätze durchgeführt.
Das Ergebnis wird als neue Spalte „Deckungsbeitrag“ gespeichert.

Das bedeutet: Egal ob 10.000 oder 1.000.000 Zeilen – die Berechnung erfolgt vollständig, konsistent und ohne manuelle Kopiervorgänge. Betriebswirtschaftlich heißt das:

keine vergessenen Formeln
keine inkonsistenten Bereiche
keine manuelle Nacharbeit

Die Logik ist klar dokumentiert und jederzeit reproduzierbar.

Praxisfall: Monatsreporting mit 1,2 Millionen Datensätzen

Angenommen, ein Unternehmen exportiert monatlich Verkaufsdaten aus dem ERP-System. In einer CSV-Datei sind demnach enthalten:

1,2 Millionen Positionen
300 Produkte
10 Regionen
variable Kosten je Position

Ziel des Reportings sind Berechnungen zum:

Umsatz je Produktgruppe
Deckungsbeitrag je Region
Vergleich zum Vormonat
Top-10-Kunden

In Python könnte der Prozess für die Umsatz- und Deckungsbeitragsrechnung folgendermaßen aussehen:

import pandas as pd

df = pd.read_csv("umsatz.csv", headers=True)

report = df.groupby("Region", as_index=False).agg({
"Umsatz": "sum",
"variable_Kosten": "sum"
})

report["Deckungsbeitrag"] = report["Umsatz"] - report["variable_Kosten"]
report

Erklärung der einzelnen Schritte

1. Einlesen der Daten

df = pd.read_csv("umsatz.csv")

Die Datei wird vollständig eingelesen und als DataFrame gespeichert. Alle Datensätze stehen nun strukturiert zur Verfügung.

2. Gruppierung der Daten

df.groupby(["Produktgruppe", "Region"])

Hier werden die Daten nach Produktgruppe und Region gruppiert. Das entspricht einer Pivot-Tabelle mit zwei Dimensionen.

3. Aggregation

.agg({
"Umsatz": "sum",
"variable_Kosten": "sum"
})

Die Umsätze und Kosten werden je Gruppe summiert. Das Ergebnis ist eine verdichtete Tabelle – bereit für die Berichterstattung.

4. Berechnung der Kennzahl

report["Deckungsbeitrag"] = report["Umsatz"] - report["variable_Kosten"]
report

Der Deckungsbeitrag wird auf aggregierter Ebene berechnet. Damit entsteht ein vollständiger Reporting-Datensatz.

Hinweis: Je nachdem, wie die Daten in der CSV-Datei vorliegen oder wie die Ausgabe des Ergebnisses dargestellt werden soll, ergänzen Sie den Python-Code um weitere Parameter wie headers=True oder as_index=False.

Der strategische Mehrwert

Diese Vorgehensweise verändert das Controlling in mehrfacher Hinsicht:

Reproduzierbarkeit: Der Prozess ist vollständig dokumentiert. Jeder Monat wird identisch berechnet.
Skalierbarkeit: Die Logik funktioniert unabhängig von der Datenmenge.
Qualitätssicherheit: Manuelle Eingriffe werden minimiert. Fehlerquellen sinken deutlich.
Automatisierung: Der Code kann in automatisierte Workflows integriert werden. Reports können ohne manuelle Zwischenschritte erstellt werden.

Excel bleibt – aber in neuer Rolle

Python ersetzt Excel nicht. Excel bleibt:

Planungsinstrument
Visualisierungsplattform
Szenario-Simulator
Kommunikationsmedium für das Management

Python übernimmt:

Datenaufbereitung
Aggregation großer Datenmengen
komplexe Berechnungen
statistische Analysen

Die Kombination aus Excel und Python führt zu einer klaren Arbeitsteilung:

Excel = Frontend
Python = Analyse-Engine

Auswirkungen auf das Rollenbild des Controllers

Der klassische Controller war vor allem Zahlenaufbereiter, Report-Ersteller und dazu Excel-Spezialist. Der moderne Controller wird zunehmend:

Datenarchitekt
Prozessgestalter
Automatisierungsexperte
Schnittstelle zwischen Fachbereich und IT

Es geht nicht darum, Data Scientist zu werden. Es geht darum, Datenprozesse zu verstehen und strukturierter zu denken.

Fazit

Excel bleibt das Herzstück der Unternehmenssteuerung. Doch Python ergänzt Excel um Skalierbarkeit, Automatisierung und strukturelle Klarheit. Die Verbindung beider Technologien ist kein kurzfristiger Trend, sondern eine logische Weiterentwicklung datengetriebener Unternehmensführung.

Unternehmen, die diese Kombination strategisch einsetzen, gewinnen:

Geschwindigkeit
Transparenz
Prognosefähigkeit
Wettbewerbsfähigkeit

Das Controlling der Zukunft ist nicht weniger Excel – sondern Excel plus Python.

Kapitel 299

Python in Excel – Grundlagen

1
Neue Möglichkeiten im Controlling mit Python und Excel
2
Von VBA zu Python als weiterer Schritt im Controlling
3
Architektur, Chancen und Grenzen von Python im Unternehmenseinsatz
4
Schritt-für-Schritt-Anleitung für die Aktivierung von Python in Excel

Dokumentenpaket kaufen Premium-Mitglied werden