Spark Streaming

Spark Streaming es una extensión de la API core de Spark que ofrece procesamiento de datos en streaming de manera escalable, alto rendimiento y tolerancia a fallos. Los datos pueden ser ingestados de diferentes fuentes como Kafka, Flume, Kinesis o sockets TCP, etc. Los datos ingestados pueden ser procesados utilizando algoritmos complejos expresados como funciones... Leer más →

Apache Spark

Spark es un sistema de computación distribuida open-source que opera sobre conjunto de máquinas. Fue creado por M.Zaharias y compañeros de trabajo en AMPLab, después cedieron el proyecto a la fundación Apache y en el 2014 fundaron la empresa Databricks ofreciendo una plataforma de analítica en la nube teniendo como núcleo central de su producto... Leer más →

Sitio web ofrecido por WordPress.com.

Subir ↑