Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Challenge: Analyzing a Text File with RDDs | Section
Introduction to PySpark
Abschnitt 1. Kapitel 6
single

single

Challenge: Analyzing a Text File with RDDs

Swipe um das Menü anzuzeigen

Aufgabe

Wischen, um mit dem Codieren zu beginnen

Download the flights dataset and load it into a Spark DataFrame, then convert it to an RDD. Using only RDD transformations and actions – no DataFrame methods – complete the following:

  1. Count the total number of flights in the dataset and store it in total_flights;
  2. Filter flights where DEPARTURE_DELAY is greater than 30 minutes, count them, and store the result in delayed_count;
  3. From the delayed flights, extract unique airlines and store the sorted list in delayed_airlines;
  4. Find the maximum DISTANCE value using reduce() and store it in max_distance.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 6
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

some-alt