Домашнее задание otus № 7 "Spark"
В этом ДЗ вам предлагается собрать статистику по криминогенной обстановке в разных районах Бостона. В качестве исходных данных используется датасет https://www.kaggle.com/AnalyzeBoston/crimes-in-boston Цель задания - разработать программу построения витрины. Результат - ссылка на репозиторий с кодом. Программа должна запускаться через spark-submit. Пути к данным и к результату должны передаваться в качестве аргументов вызова.
Jar файл расположен в out/artifacts/HW_BostonCrime_jar
Формат запуска: spark-submit <jar_file> <path/to/in/dir> <path/to/out/dir>
Результатом рабботы данного кода является витрина данных сохраненная в файл формата parqet, который в наименовании содержти timestamp (пример: datamart_20230624_125056_414+0000.parquet).