Артикул: p6315726
Характеристики
- Издательство: ДМК Пресс
- Серия: O`Reilly
- Год издания:2015
- Жанр: Программирование
- ISBN:978-5-97060-323-9
- Переплет: Мягкий переплёт
- Формат: 139x200 мм
- Общий тираж: 200
- Вес: 349 г
Описание
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. С помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala. Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения. . .