Python in Excel für die DatenanalyseHilfreiche Funktionen in Python für die explorative Beschreibung eines Datensatzes

  • Einzelne Spalten einer Datentabelle analysieren
  • Häufigkeitsverteilung von Kategorien – value_counts()
  • Mehrere Spalten gleichzeitig analysieren
  • Spaltennamen anzeigen – columns
  • Weitere grundlegende Informationen über einen DataFrame
  • Werte eines DataFrames anzeigen – values
  • Struktur eines DataFrames anzeigen – shape
  • Anzahl von Zeilen und Spalten bestimmen – len()
  • Zufällige Stichproben aus einem Datensatz ziehen – sample()

Einzelne Spalten einer Datentabelle analysieren

In vielen Fällen interessiert man sich bei der Datenanalyse nicht für den gesamten Datensatz, sondern nur für bestimmte Variablen. Beispielsweise möchte man vielleicht nur untersuchen, wie sich die Verkaufsmenge oder der Preis verteilt.

Mit Pandas lassen sich einzelne Spalten eines DataFrames sehr einfach auswählen und anschließend analysieren.

Angenommen, Sie möchten nur die Spalte Verkaufsmenge statistisch untersuchen. Dann können Sie diese Spalte gezielt auswählen und anschließend die Funktion describe() darauf anwenden.

Es gibt zwei Möglichkeiten, eine Spalte auszuwählen.

Dazu im Management-Handbuch

Vorlagen nutzen

Weitere Kapitel zum Thema