En este apartado, voy a ir subiendo los apuntes que empleo para introducir a los alumnos en los entornos de trabajo Big Data.
- ¿Qué es Big Data?: Explicación de que es el Big Data, cuales fueron los principales avances tecnológicos que dieron lugar a su aparición y las Vs (Volumen, Variedad, Velocidad, Veracidad y Valor) que definen sus características.
- Curado de Datos: En que consiste el curado de datos, los procesos ETL de preparación para la explotación de los datos y los principales tipos de ficheros de datos: csv, json y xml.
- Arquitectura Big Data: Descripción de la arquitectura de los entornos Big Data: Clusters de ordenadores, procesamiento en paralelo y bases de datos distribuidas.
- Hadoop: HDFS y MapReduce
- SPARK