Артикул: p7104791
Характеристики
- Серия: Бестселлеры O`Reilly
- Год издания:2024
- Жанр: Пользование программами
- ISBN:978-601-08-4037-9
- Возрастное ограничение: 16+
- Количество страниц: 288
- Переплет: Мягкий переплёт
- Бумага: офсет
- Формат: 165x233 мм
- Общий тираж: 700
- Вес: 458 г
Описание
Вы получили два разных, но связанных между собой набора данных? Что делать? Какие инструменты использовать для поиска совпадений? А если все, что у вас есть, — это доступ к базе данных с помощью запроса SQL SELECT? Джим Лемер познакомит вас с лучшими практиками, техниками и хитрыми приемами, которые помогут импортировать, очищать, сопоставлять, оценивать и осмысливать разнородные данные с помощью SQL.
Администраторы баз данных, разработчики, бизнес-аналитики и специалисты data science узнают, как выявлять и удалять дубликаты, парсить строки, извлекать данные из XML и JSON, упорядочивать данные, а также работать над качеством данных и выполнять операции ETL для поиска сходств и различий между разными представлениями одинаковых данных.
Примеры в книге содержат реальные кейсы и рабочий код.