Apache Spark

Spark es un sistema de computación distribuida open-source que opera sobre conjunto de máquinas. Fue creado por M.Zaharias y compañeros de trabajo en AMPLab, después cedieron el proyecto a la fundación Apache y en el 2014 fundaron la empresa Databricks ofreciendo una plataforma de analítica en la nube teniendo como núcleo central de su producto... Leer más →

Impala

Impala ofrece una tecnología de base de datos escalable y paralela sobre Hadoop permitiendo a los usuarios realizar consultas SQL con baja latencia sobre los datos guardados en el HDFS o en HBase sin necesidad de moverlos o transformarlos. Impala esta integrado con Hadoop para que utilice los mismos ficheros, formatos, metadatos, seguridad y frameworks... Leer más →

Sitio web ofrecido por WordPress.com.

Subir ↑