Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Challenge: Analyzing a Text File with RDDs | Section
Introduction to PySpark
Osio 1. Luku 6
single

single

Challenge: Analyzing a Text File with RDDs

Pyyhkäise näyttääksesi valikon

Tehtävä

Pyyhkäise aloittaaksesi koodauksen

Download the flights dataset and load it into a Spark DataFrame, then convert it to an RDD. Using only RDD transformations and actions – no DataFrame methods – complete the following:

  1. Count the total number of flights in the dataset and store it in total_flights;
  2. Filter flights where DEPARTURE_DELAY is greater than 30 minutes, count them, and store the result in delayed_count;
  3. From the delayed flights, extract unique airlines and store the sorted list in delayed_airlines;
  4. Find the maximum DISTANCE value using reduce() and store it in max_distance.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 6
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

some-alt