El programa, prepara al estudiante para ejercer su actividad en el sector de las Tecnologías de la Información y la Comunicación y el análisis de datos a gran escala como operadores y asesores en el tratamiento de macrodatos.
Personas interesadas en orientarse hacia profesiones emergentes relacionadas con el análisis de datos.
MÓDULO 1 - Programación en entornos Big Data
Lenguajes para Big Data:
Características de los lenguajes de programación para Big Data.
Tipos de datos.
Por categorías: estructurados, no estructurados y multi-estructurados o híbridos.
Por origen: web y redes sociales, comunicación entre máquinas, transacciones, biométricos y generados por personas.
Estructuras de control: de selección, iterativas. Funciones. Recursividad.
Librerías específicas.
Entrada y salida de datos:
Opciones de entrada y salida habituales.
Formatos habituales en Big Data.
Funciones para trabajar con diferentes formatos.
Entornos de desarrollo:
Entornos de desarrollo para programación Big Data.
Instalación y configuración de entornos de desarrollo en local.
Instalación y configuración de entornos de desarrollo en remoto.
Análisis y visualización de datos:
Análisis descriptivo. Utilización de un histórico de datos. Identificación de comportamientos.
Análisis predictivo. Creación de modelos. Establecimiento de un patrón e identifcación de las principales tendencias.
Análisis prescriptivo. Técnicas de simulación y optimización.
Visualización de datos.
MÓDULO 2 - Frameworks para Big Data
Infraestructuras para Big Data:
El paradigma Big Data. Modelo 5V: velocidad, volumen, variedad de los datos, veracidad y valor.
Sistemas de computación distribuida: clusters, cloud.
Componentes básicos y requisitos para la arquitectura de un sistema Big Data.
Componentes de la arquitectura Big Data:
Infraestructura en almacenamiento básica para la ingesta de datos.
Infraestructuras para el procesamiento de datos.
Herramientas adicionales.
Almacenamiento distribuido:
Características de los sistemas de ficheros distribuidos.
Almacenamiento de información permanente.
Sistemas multiusuario.
Transparencia en la identificación y en la ubicación.
Escalabilidad.
Consistencia y seguridad.
Capacidad, redundancia y alta disponibilidad. Tolerancia a fallos.
Despliegue de nodos de almacenamiento,
Administración y acceso a los datos.
Monitorización de sistemas de ficheros distribuidos. Herramientas para monitorizar aplicaciones y servidores.
Administración de entornos Big Data:
Paradigma de computación distribuida y en paralelo, proceso cercano a los datos.
Aplicaciones y técnicas de procesamiento distribuido.
Ingesta de datos.
Metodología MapReduce.
Rendimiento y monitorización de los procesos.
Administración de seguridad de los datos.
MÓDULO 3 - Procesamiento de datos
Ingesta de datos:
Tecnologías de ingesta de datos.
Origen y formato de los datos. Opendata.
Latencia y disponibilidad de los datos.
Causas de la latencia.
Funciones que dependen de la latencia.
Formas de mitigar la latencia.
Actualizaciones de los datos. Histórico de cambios.
Extracción de datos.
Preprocesado de datos:
Transformaciones de los datos.
Destino de los datos. Consumidores de datos.
Calidad de los datos. Formato, origen, veracidad y valor.
Seguridad de los datos.
Procesamiento de datos:
Introducción a los sistemas de procesamiento Big Data.
Procesamiento por lotes. Aplicaciones y características.
Procesamiento en streaming. Aplicaciones y características.
MÓDULO 4 - Bases de datos no relacionales
Arquitecturas disponibles para el almacenamiento masivo de datos:
Características principales, criterios de selección.
Documental. Catálogos, perfles de usuario y sistemas de administración de contenido.
Clave-valor. Escalado horizontal.
Basado en columnas. Familias de columnas.
Grafos. Nodos y bordes.
Series temporales.
Datos de objetos.
Datos de índice externo.
Casos de uso para cada arquitectura:
Documental.
Clave-valor.
Basado en columnas.
Grafos.
Bases de datos no relacionales:
Características principales: flexibilidad, escalabilidad, alto rendimiento y funcionabilidad.
Ejemplos de uso más frecuente.
Instalación y administración de bases de datos no relacionales
Técnicas y procedimientos.
Consulta de datos:
Principales herramientas. Características y criterios de selección.
Programación de consultas y búsquedas en función de la arquitectura utilizada.
Al finalizar el curso con éxito, el alumno obtendrá el Título Oficial de Programa de Especialización en Big Data (Homologado por la Comunidad de Madrid según la Orden 1830/2020, de la Consejería de Educación y Juventud). Además, el programa cuenta con un Curso de Metodologías Ágiles, del cual también recibirán una titulación por IMF.
Para acceder a la formación, es necesario poseer alguna de las siguientes titulaciones de Grado:
Información Adicional
Programa de Becas de hasta el 25%.
Financiación sin intereses y descuento por pronto pago.