Spark Streaming

Spark Streaming es una extensión de la API core de Spark que ofrece procesamiento de datos en streaming de manera escalable, alto rendimiento y tolerancia a fallos. Los datos pueden ser ingestados de diferentes fuentes como Kafka, Flume, Kinesis o sockets TCP, etc. Los datos ingestados pueden ser procesados utilizando algoritmos complejos expresados como funciones... Leer más →

Introdución a Hadoop

Hadoop surge por la necesidad cada vez mayor de disponer de espacio de almacenamiento ilimitado y poder guardar cualquier cosa, estructurada o no. Asociado a esto, se necesitan algoritmos que puedan procesar toda esta información en un tiempo razonable. Hadoop tiene dos partes: una que se ocupa del almacenamiento de datos de distintos tipos (HDFS) y otra... Leer más →

Sitio web ofrecido por WordPress.com.

Subir ↑