Acerca de la prueba Spark
Apache Spark es una versatile open-source platform diseñada para tareas como consultas interactivas, Machine Learning y procesamiento de datos en tiempo real. En lugar de almacenar los datos por sí mismo, realiza análisis en soluciones de almacenamiento externas como HDFS, Amazon Redshift, Amazon S3, Couchbase, Cassandra, entre otros. Los temas clave incluyen Transformations, RDDs, data Filtering y principios fundamentales.
Relevante para:
- Data Engineer
- Data Scientist