Apache Kudu

En septiembre de 2015, Cloudera anunció la versión Beta de Apache Kudu, y dos meses más tarde, decidió donar el proyecto en su totalidad a la Apache Software Foundation para abrirla a toda la comunidad de desarrolladores open-source. En Enero de 2017 Cloudera lanza la versión Enterprise 5.10 y una de las principales diferencias con... Leer más →

Spark Streaming

Spark Streaming es una extensión de la API core de Spark que ofrece procesamiento de datos en streaming de manera escalable, alto rendimiento y tolerancia a fallos. Los datos pueden ser ingestados de diferentes fuentes como Kafka, Flume, Kinesis o sockets TCP, etc. Los datos ingestados pueden ser procesados utilizando algoritmos complejos expresados como funciones... Leer más →

Ranger vs Sentry

Apache Ranger, propiedad de Hortonworks, ofrece un enfoque integral de seguridad para un clúster Hadoop. Apache Sentry, propiedad de Cloudera, ofrece un enfoque de seguridad similar a Ranger. Apache Ranger Proporciona una plataforma centralizada para definir, administrar y generar políticas de seguridad de manera consistente en cada uno de sus componentes. Es un framework que... Leer más →

Sitio web ofrecido por WordPress.com.

Subir ↑