Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Heatmap | Visualisierung mit Seaborn
Ultimative Visualisierung mit Python
course content

Kursinhalt

Ultimative Visualisierung mit Python

Ultimative Visualisierung mit Python

1. Einführung in Matplotlib
2. Erstellen Häufig Verwendeter Diagramme
3. Anpassung von Plots
4. Mehr Statistische Diagramme
5. Visualisierung mit Seaborn

book
Heatmap

Ein Heatmap ist eine Methode zur Visualisierung von zweidimensionalen Daten, bei der Farben verwendet werden, um die Größe jedes Wertes darzustellen. Hier ist ein Beispiel für ein Heatmap:

In diesem Beispiel haben wir ein Heatmap verwendet, um die paarweise Korrelation zwischen den Variablen in einem Datensatz darzustellen. Mit einem solchen Heatmap ist alles ordentlich und klar, genau das, was wir von einer guten Visualisierung erwarten.

Erstellen eines einfachen Heatmaps

seaborn hat eine Funktion namens heatmap(). Ihr einziger erforderlicher Parameter ist data, das ein 2D (rechteckiger) Datensatz sein sollte.

Vielleicht der häufigste Anwendungsfall eines Heatmaps ist mit einer Korrelationsmatrix, wie im obigen Beispiel. Gegeben ein DataFrame, sollten wir zuerst seine corr()-Methode aufrufen, um eine Korrelationsmatrix zu erhalten, und erst dann diese Matrix als Argument für die heatmap()-Funktion übergeben:

1234567891011
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://staging-content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix) plt.show()
copy

Alles ist hier ziemlich einfach, jedoch haben wir nicht alle Spalten des DataFrame verwendet, um eine Korrelationsmatrix zu erstellen (numeric_only=True), da sie Zeichenfolgen enthalten und nicht numerisch sind.

Annotation und Farben

Dieses Heatmap kann informativer gestaltet werden, indem der entsprechende Wert (Korrelationskoeffizient in unserem Fall) in jede Zelle geschrieben wird. Das kann einfach durch Setzen des annot Parameters auf True erreicht werden.

Es ist auch möglich, die Farben für unsere Heatmap zu ändern, indem der cmap Parameter gesetzt wird (Sie können die Paletten hier erkunden).

Mit diesem Wissen, lassen Sie uns nun unser Beispiel modifizieren:

1234567891011
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://staging-content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Setting annotation and color palette sns.heatmap(correlation_matrix, annot=True, cmap='viridis') plt.show()
copy

Wir könnten auch die Farbskala auf der rechten Seite entfernen, indem wir cbar=False setzen.

In den meisten Fällen ist das alles, was Sie von einer Heatmap-Anpassung benötigen, jedoch können Sie immer mehr in der Dokumentation erkunden.

Verbesserung der Lesbarkeit

Das Letzte, was die Lesbarkeit unseres Heatmaps verbessern würde, ist das Drehen der Ticks mit den bereits bekannten Funktionen xticks() und yticks():

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://staging-content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix, annot=True, cmap='viridis') # Rotating the ticks by 20 degrees counterclockwise plt.xticks(rotation=20) plt.yticks(rotation=20) plt.show()
copy
Aufgabe

Swipe to start coding

  1. Verwenden Sie die richtige Methode, um eine Korrelationsmatrix zu erstellen.
  2. Setzen Sie das Argument der Methode, um nur numerische Variablen einzuschließen.
  3. Verwenden Sie die richtige Funktion, um ein Heatmap zu erstellen.
  4. Setzen Sie correlation_matrix als Daten für das Heatmap, indem Sie das erste Argument angeben.
  5. Fügen Sie die Werte in jeder Zelle der Matrix hinzu, indem Sie das zweite Argument angeben.
  6. Setzen Sie die Palette (Farbkarte) des Heatmaps auf 'crest', indem Sie das dritte (rechtsstehende) Argument angeben.
  7. Drehen Sie die Ticks der x- und y-Achse um 15 Grad gegen den Uhrzeigersinn, indem Sie ein Schlüsselwortargument in xticks() und yticks() angeben.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 7
toggle bottom row

book
Heatmap

Ein Heatmap ist eine Methode zur Visualisierung von zweidimensionalen Daten, bei der Farben verwendet werden, um die Größe jedes Wertes darzustellen. Hier ist ein Beispiel für ein Heatmap:

In diesem Beispiel haben wir ein Heatmap verwendet, um die paarweise Korrelation zwischen den Variablen in einem Datensatz darzustellen. Mit einem solchen Heatmap ist alles ordentlich und klar, genau das, was wir von einer guten Visualisierung erwarten.

Erstellen eines einfachen Heatmaps

seaborn hat eine Funktion namens heatmap(). Ihr einziger erforderlicher Parameter ist data, das ein 2D (rechteckiger) Datensatz sein sollte.

Vielleicht der häufigste Anwendungsfall eines Heatmaps ist mit einer Korrelationsmatrix, wie im obigen Beispiel. Gegeben ein DataFrame, sollten wir zuerst seine corr()-Methode aufrufen, um eine Korrelationsmatrix zu erhalten, und erst dann diese Matrix als Argument für die heatmap()-Funktion übergeben:

1234567891011
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://staging-content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix) plt.show()
copy

Alles ist hier ziemlich einfach, jedoch haben wir nicht alle Spalten des DataFrame verwendet, um eine Korrelationsmatrix zu erstellen (numeric_only=True), da sie Zeichenfolgen enthalten und nicht numerisch sind.

Annotation und Farben

Dieses Heatmap kann informativer gestaltet werden, indem der entsprechende Wert (Korrelationskoeffizient in unserem Fall) in jede Zelle geschrieben wird. Das kann einfach durch Setzen des annot Parameters auf True erreicht werden.

Es ist auch möglich, die Farben für unsere Heatmap zu ändern, indem der cmap Parameter gesetzt wird (Sie können die Paletten hier erkunden).

Mit diesem Wissen, lassen Sie uns nun unser Beispiel modifizieren:

1234567891011
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://staging-content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Setting annotation and color palette sns.heatmap(correlation_matrix, annot=True, cmap='viridis') plt.show()
copy

Wir könnten auch die Farbskala auf der rechten Seite entfernen, indem wir cbar=False setzen.

In den meisten Fällen ist das alles, was Sie von einer Heatmap-Anpassung benötigen, jedoch können Sie immer mehr in der Dokumentation erkunden.

Verbesserung der Lesbarkeit

Das Letzte, was die Lesbarkeit unseres Heatmaps verbessern würde, ist das Drehen der Ticks mit den bereits bekannten Funktionen xticks() und yticks():

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://staging-content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix, annot=True, cmap='viridis') # Rotating the ticks by 20 degrees counterclockwise plt.xticks(rotation=20) plt.yticks(rotation=20) plt.show()
copy
Aufgabe

Swipe to start coding

  1. Verwenden Sie die richtige Methode, um eine Korrelationsmatrix zu erstellen.
  2. Setzen Sie das Argument der Methode, um nur numerische Variablen einzuschließen.
  3. Verwenden Sie die richtige Funktion, um ein Heatmap zu erstellen.
  4. Setzen Sie correlation_matrix als Daten für das Heatmap, indem Sie das erste Argument angeben.
  5. Fügen Sie die Werte in jeder Zelle der Matrix hinzu, indem Sie das zweite Argument angeben.
  6. Setzen Sie die Palette (Farbkarte) des Heatmaps auf 'crest', indem Sie das dritte (rechtsstehende) Argument angeben.
  7. Drehen Sie die Ticks der x- und y-Achse um 15 Grad gegen den Uhrzeigersinn, indem Sie ein Schlüsselwortargument in xticks() und yticks() angeben.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 7
Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
We're sorry to hear that something went wrong. What happened?
some-alt