Секція 1. Розділ 6
single
Challenge: Analyzing a Text File with RDDs
Свайпніть щоб показати меню
Завдання
Проведіть, щоб почати кодувати
Download the flights dataset and load it into a Spark DataFrame, then convert it to an RDD. Using only RDD transformations and actions – no DataFrame methods – complete the following:
- Count the total number of flights in the dataset and store it in
total_flights; - Filter flights where
DEPARTURE_DELAYis greater than 30 minutes, count them, and store the result indelayed_count; - From the delayed flights, extract unique airlines and store the sorted list in
delayed_airlines; - Find the maximum
DISTANCEvalue usingreduce()and store it inmax_distance.
Рішення
Все було зрозуміло?
Дякуємо за ваш відгук!
Секція 1. Розділ 6
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат