Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Challenge: Exploratory Analysis of a Flights Dataset | Section
Introduction to PySpark
Section 1. Chapitre 11
single

single

Challenge: Exploratory Analysis of a Flights Dataset

Glissez pour afficher le menu

Tâche

Glissez pour commencer à coder

You are given a flights dataset as a list of rows. Load it into a DataFrame using createDataFrame and complete the following steps, storing results in the specified variables:

  1. Count the total number of rows – store in total_rows;
  2. Find the airline with the most delayed flights (Delay == 1) – store the airline code as a string in most_delayed_airline;
  3. Count the number of delayed flights (Delay == 1) – store in delayed_count;
  4. Find the top 3 busiest routes (unique AirportFrom + AirportTo pairs by flight count) – store as a list of tuples [(origin, destination, count), ...] in top_routes.

Print all results.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 11
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

some-alt