Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Challenge: Exploratory Analysis of a Flights Dataset | Section
Introduction to PySpark
Sección 1. Capítulo 11
single

single

Challenge: Exploratory Analysis of a Flights Dataset

Desliza para mostrar el menú

Tarea

Desliza para comenzar a programar

You are given a flights dataset as a list of rows. Load it into a DataFrame using createDataFrame and complete the following steps, storing results in the specified variables:

  1. Count the total number of rows – store in total_rows;
  2. Find the airline with the most delayed flights (Delay == 1) – store the airline code as a string in most_delayed_airline;
  3. Count the number of delayed flights (Delay == 1) – store in delayed_count;
  4. Find the top 3 busiest routes (unique AirportFrom + AirportTo pairs by flight count) – store as a list of tuples [(origin, destination, count), ...] in top_routes.

Print all results.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 11
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

some-alt