spark

  1. Robot

    Скачать Практикум по Data Engineering: сквозной ETL на Spark + Postgres + Airflow + BI (Дмитрий Кузьмин)

    Соберёшь полноценный DE-пайплайн на своём ноутбуке: S3-lake → Spark → DWH → Airflow → BI Один проект, который можно показать на собеседовании. Для тех, кто сильный в SQL, но на собесах упирается в “где пайплайны, инкременты, оркестрация и качество”. Программа: 0. Окружение: Docker-стенд...
  2. Скачать Spark для профессионалов. Современные паттерны обработки больших данных [Сэнди Риза, Ури Лезерсон, Шон Оуэн, Джош Уиллс]

    В этой практичной книге четверо специалистов Cloudera по анализу данных описывают самодостаточные паттерны для выполнения крупномасштабного анализа данных при помощи Spark. Авторы комплексно рассматривают Spark, статистические методы и множества данных, собранные в реальных условиях, и на этих...
  3. Robot

    Скачать [bigdata team] Большие данные с BigData Team. Часть 2. Spark: from zero to hero [Алексей Драль]

    На протяжении этой части курса вы будете работать со Spark: от основных терминов и RDD до Spark DataFrames и оптимизации Spark вычислений. В этом модуле вы изучите: cхема выполнения задачи в Spark; основные термины Spark (job, task, stage); представление вычислений в виде графа. Spark Python...
  4. cosmos

    Скачать [bigdata team] Практический курс по Big Data. Часть 2. Spark: from zero to hero

    На протяжении этой части курса вы будете работать со Spark: от основных терминов и RDD до Spark DataFrames и оптимизации Spark вычислений. В этом модуле вы изучите: ▶ cхема выполнения задачи в Spark; ▶ основные термины Spark (job, task, stage); ▶ представление вычислений в виде графа. Spark...
  5. Akuma

    Скачать Расширенная аналитика с PySpark [Ури Лаcерсон, Шон Оуэн, Сэнди Райза, Акаш Тандон, Джош Уиллс]

    Описание книги: Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных...
  6. Robot

    Скачать [ДМК] Графовые алгоритмы [Марк Нидхем, Эми Холдер]

    Узнайте, как алгоритмы графов могут помочь вам использовать отношения в ваших данных для разработки интеллектуальных решений и улучшения ваших моделей машинного обучения. С помощью этого практического руководства разработчики и исследователи данных узнают, как графическая аналитика приносит...
  7. Robot

    Скачать Грокаем стриминг [Джош Фишер, Нин Ван]

    Описание: Стриминговые системы позволяют сократить до минимума время между событием и обработкой информации, чтобы вы получали результаты в реальном времени. В приложениях для финансовой сферы, в вопросах безопасности и IoT важна каждая миллисекунда, поэтому без стриминговых систем не обойтись...
Сверху