Анализ данных с помощью Apache Spark
Перейти к навигации
Перейти к поиску
Задача
Скачать предлагаемый датасет
Скачать и установить Apache Spark последней версии
При помощи фреймворка вычислить метрики:
- Самый популярный фильм по жанру в каждом году
- Режиссёр, снявший наибольшее количество фильмов
- Средний заработок фильмов по годам
Результаты вывести в csv файл
Примерная структура отчета
- Титульный лист
- Введение
- Обзор фреймворка Apache Spark и литературы про него
- Описание решения задачи
- Заключение
- Список литературы
- Приложения (здесь полный код программы)
Список ресурсов
Научный руководитель
к.ф.-м.н., Ph.D., старший преподаватель, Благов Михаил Валерьевич [e-mail][Telegram]