Todo proyecto de ciencia en datos, requiere de una estructura de datos para su implantación y aplicación para conseguir los objetivos de negocio. En este bloque de posts que título: Sistemas de acceso y almacenamiento de datos, explicaré los distintos sistemas de acceso a datos, arquitecturas de almacenamiento y de respaldo.
Para completar todo lo relativo a las arquitecturas de datos, destinare otros dos bloques de posts. Un segundo bloque que abordará todo lo relativo a los Sistemas de Gestión de BBDD y un tercero que tratará sobre Big Data.
Sistemas de acceso a datos
- Organización física de los datos: Introducción básica de como los datos pasaron de guardarse en archivos de papel a los archivos digitales almacenados en un ordenador.
- Archivos de acceso secuencial: Explicación de la estructura y funcionamiento de los archivos de acceso secuencial, la primera solución empleada para la digitalización de los datos.
- Archivos de acceso aleatorio: Explicación de los archivos de acceso aleatorio y sus principales características. La ventaja de velocidad de acceso que presentan frente a los archivos de acceso secuencial. Realización de un ejemplo de archivo de acceso aleatorio.
- Acceso indexado: Explicación de como funciona el acceso indexado. Ejemplos de ficheros de acceso indexado empleando índice denso e índice escaso.
- Indexación por árboles de datos: Paso de la indexación por ficheros secuenciales a emplear estructuras de árboles de datos. Detalle y explicación de la estructura de árbol de datos.
- Árboles binarios de búsqueda: Como funcionan los árboles binarios de búsqueda, como se organizan los nodos dando lugar a la estructura de árbol. Ejemplo de un árbol binario de búsqueda.
- Operaciones con árboles binarios de búsqueda: Las distintas operaciones que se pueden realizar con árboles binarios de búsqueda: Búsqueda, inserción o eliminación de un nodo.
- Hash: El algoritmo hash, sus principales características y como emplearlo para la organización de los datos.
Sistemas de gestión de bases de datos
- Bases de datos.
- Base de datos relacional: ¿Qué es una base de datos relacional? Las tablas y las relaciones que se crean para estructurar el acceso a los datos.
- Traspaso de datos de un fichero a una base de datos relacional: Como trasladar los datos de trabajo desde un fichero a una base de datos relacional, y evitar errores de redundancia.
- SQL: Introducción al lenguaje SQL: ¿Qué es y para qué sirve? Vistazo rápido a los tipos de datos y operadores del lenguaje
- SQL: Definición de la estructura de datos: Sintaxis y función de los principales comandos SQL para definir la estructura de la BBDD de trabajo.
- SQL: Modificar datos: Sintaxis y función de los principales comandos SQL para insertar, actualizar o borrar datos.
- SQL: Recuperación de datos: Descripción y empleo de los comandos SQL para la recuperación de datos.
- Bases de datos NO relacionales: Tipos y características de BBDD NO relacionales y como vienen a complementar a las BBDD relacionales
Arquitecturas de almacenamiento de datos
- RAID: Explicación del funcionamiento de los distintos niveles de sistemas RAID de discos duros y sus posibles combinaciones.
- Arquitecturas de almacenamiento: Los tipos de arquitecturas de almacenamiento clasificadas atendiendo al acceso requerido: Acceso a disco duro (disco interno, DAS, SAN) Y acceso a fichero (NAS).
- Sistemas de copias de seguridad: Los sistemas de copias de seguridad: Los distintos tipos que existen y como planificar las políticas de las copias de seguridad.