Инструменты для управления эволюцией схемы данных
Перейти к навигации
Перейти к поиску
Задача
- Взять книжку Martin Kleppmann Designing Data-Intensive applications
- Прочитать главы про форматы данных (avro, parquet, csv)
- Прочитать про schema evolution
- Какие существуют на данном этапе инструменты (желательно openSource), которые позволяют
- валидировать совместимость схем данных
- искать несовместимые схемы в существующих директориях
- находить и исправлять проблемные файлы