Introduzione al Metodo .groupby()
Sono lieto di vederti in questa sezione. Qui raggrupperemo i nostri dati per trovare informazioni su diversi gruppi di righe. Esamina il set di dati sui ritardi (puoi scorrere questa tabella orizzontalmente):
Raggruppare i dati è vantaggioso e ora lo approfondiremo. Immagina di voler calcolare il numero di ritardi per ogni numero di volo. Osserva l'esempio di codice e poi la spiegazione:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay']].groupby('Flight').sum() print(data_flights.head())
Spiegazione:
data[['Flight', 'Delay']].groupby('Flight').sum()
data[['Flight', 'Delay']]- Queste sono le colonne su cui si lavora, incluse quelle su cui si effettua il raggruppamento;groupby('Flight')- La colonna'Flight'è l'argomento della funzione.groupby(). Questo significa che le righe con lo stesso valore nella colonna'Flight'verranno raggruppate insieme;.sum()- Questa funzione opera sulle righe all'interno di ciascun gruppo creato da.groupby(). In questo caso, somma i valori nella colonna'Delay'per le righe che appartengono allo stesso gruppo'Flight'.
Poiché la colonna 'Delay' contiene solo 0 (nessun ritardo) o 1 (ritardo avvenuto) come possibili valori, la somma delle righe rappresenta il numero di ritardi per ciascun volo.
Infatti, .sum() è una delle molte funzioni di aggregazione che si possono utilizzare. Verranno approfondite tutte nel corso delle lezioni.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Fantastico!
Completion tasso migliorato a 3.03
Introduzione al Metodo .groupby()
Scorri per mostrare il menu
Sono lieto di vederti in questa sezione. Qui raggrupperemo i nostri dati per trovare informazioni su diversi gruppi di righe. Esamina il set di dati sui ritardi (puoi scorrere questa tabella orizzontalmente):
Raggruppare i dati è vantaggioso e ora lo approfondiremo. Immagina di voler calcolare il numero di ritardi per ogni numero di volo. Osserva l'esempio di codice e poi la spiegazione:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay']].groupby('Flight').sum() print(data_flights.head())
Spiegazione:
data[['Flight', 'Delay']].groupby('Flight').sum()
data[['Flight', 'Delay']]- Queste sono le colonne su cui si lavora, incluse quelle su cui si effettua il raggruppamento;groupby('Flight')- La colonna'Flight'è l'argomento della funzione.groupby(). Questo significa che le righe con lo stesso valore nella colonna'Flight'verranno raggruppate insieme;.sum()- Questa funzione opera sulle righe all'interno di ciascun gruppo creato da.groupby(). In questo caso, somma i valori nella colonna'Delay'per le righe che appartengono allo stesso gruppo'Flight'.
Poiché la colonna 'Delay' contiene solo 0 (nessun ritardo) o 1 (ritardo avvenuto) come possibili valori, la somma delle righe rappresenta il numero di ritardi per ciascun volo.
Infatti, .sum() è una delle molte funzioni di aggregazione che si possono utilizzare. Verranno approfondite tutte nel corso delle lezioni.
Grazie per i tuoi commenti!