Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ Challenge: Exploratory Analysis of a Flights Dataset | Section
Introduction to PySpark
セクション 1.  11
single

single

Challenge: Exploratory Analysis of a Flights Dataset

メニューを表示するにはスワイプしてください

タスク

スワイプしてコーディングを開始

You are given a flights dataset as a list of rows. Load it into a DataFrame using createDataFrame and complete the following steps, storing results in the specified variables:

  1. Count the total number of rows – store in total_rows;
  2. Find the airline with the most delayed flights (Delay == 1) – store the airline code as a string in most_delayed_airline;
  3. Count the number of delayed flights (Delay == 1) – store in delayed_count;
  4. Find the top 3 busiest routes (unique AirportFrom + AirportTo pairs by flight count) – store as a list of tuples [(origin, destination, count), ...] in top_routes.

Print all results.

解答

Switch to desktop実践的な練習のためにデスクトップに切り替える下記のオプションのいずれかを利用して、現在の場所から続行する
すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 1.  11
single

single

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

some-alt