Descripción
Al completar este libro, tendrás el conocimiento y las habilidades para implementar sin problemas cargas de trabajo de procesamiento por lotes y streaming a gran escala para analizar flujos de datos en tiempo real con Apache Spark.
Lo que aprenderás
- Dominar los conceptos de clústeres de Spark y procesamiento de datos por lotes
- Comprender la ingesta, transformación y almacenamiento de datos
- Obtener información sobre conceptos esenciales de procesamiento de flujo y diferentes arquitecturas de streaming
- Implementar trabajos y aplicaciones de streaming con Spark Streaming
Para quién es este libroIngenieros de datos, analistas de datos, ingenieros de aprendizaje automático, programadores de Python y R
Autor: Alfonso Antolínez García
Editorial: Apress
Publicado: 06/06/2023
Páginas: 403
Tipo de encuadernación: Tapa blanda
Peso: 1.60lbs
Tamaño: 10.00h x 7.00w x 0.86d
ISBN13: 9781484293799
ISBN10: 1484293797
Categorías BISAC:
- Computadoras | Teoría de la información
- Computadoras | Inteligencia artificial | General
- Computadoras | Lenguajes | Python
Sobre el autor
Alfonso Antolínez García es un gerente de TI senior con una larga trayectoria profesional en varias empresas multinacionales como Bertelsmann SE, Lafarge y TUI AG. Ha trabajado en la industria de los medios de comunicación, la industria de los materiales de construcción y la industria del ocio. Alfonso también trabaja como profesor universitario, impartiendo clases de inteligencia artificial, aprendizaje automático y ciencia de datos. En su tiempo libre, escribe artículos de investigación sobre inteligencia artificial, matemáticas, física y las aplicaciones de la teoría de la información a otras ciencias.

