Durante el curso, aprenderás a utilizar estrategias de aprendizaje de manera autónoma, aplicándolas a las tecnologías de Aprendizaje de Máquinas con Python, el lenguaje de programación más utilizado en este campo. Los contenidos se impartirán en una modalidad flexible, con abundantes recursos que facilitan el aprendizaje y un contacto continuo e individualizado con el equipo docente, compuesto por profesores que también son profesionales activos en el sector.
Este programa está dirigido a personas interesadas en adquirir, mejorar o actualizar sus conocimientos en el área.
El objetivo del programa es que los alumnos comprendan la importancia de los datos y los métodos para su obtención. Además, se busca estudiar tanto los modelos como los métodos de aprendizaje supervisado y no supervisado.
LOS DATOS, FUENTES DE DATOS Y EXTRACCIÓN
Tipos básicos de datos. Tipos de datos compuestos. Fuentes de datos.
TEORÍA DE PROBABILIDADES Y ESTADÍSTICA
Bases de la teoría de la probabilidad. Parámetros centrales, de dispersión y de forma de las variables aleatorias discretas. Distribuciones. Variables aleatorias multidimensionales. Introducción a la estadística. Apéndice. Otras distribuciones.
REPRESENTACIÓN DE DATOS CON SEABORN
Tipos de datos en aprendizaje de máquinas. Repaso de conceptos de Matplotlib. Combinación de funciones de Matplotlib y de Seaborn. Funciones a nivel de ejes y a nivel de figura en Seaborn. Gráficas de dispersión. Gráficas de funciones del tiempo. Agregación y representación de la incertidumbre. Trazado de subconjuntos de datos con mapeos semánticos. Figuras con gráficas múltiples relacionadas con facetas. Datos categóricos. Diagramas de caja usando Seaborn. Representaciones en violín. Diagramas de barra. Representación de la distribución de una variable. Estimación de la densidad del núcleo. Representación de distribuciones de dos variables. Representación de relaciones entre pares de variables. Representación de relaciones entre variables.
PROCESADO DE DATOS
Librerías de interés en preprocesado de datos. La librería Scikit-learn. Limpieza de datos. Normalización y escalado. Extracción y selección de características.
BASES DEL MODELADO DE DATOS Y DEL APRENDIZAJE
Aprendizaje de máquinas. El modelado de los datos. Clasificación de los algoritmos de aprendizaje. Conjuntos de entrenamiento, validación y prueba. Análisis de errores. Función de pérdida. Validación cruzada. Sobreajuste, infraajuste y regularización. Métricas en Scikit-learn. Clases desequilibradas. Matriz de confusión. Tipos de modelos. La librería Scikit-learn en aprendizaje.
ALGORITMOS SUPERVISADOS (I). REGRESIÓN Y MÁQUINAS DE VECTORES SOPORTE
Parte I. Regresión. Parte II. Máquinas de vectores soporte.
APRENDIZAJE SUPERVISADO (II). REDES NEURONALES
Las neuronas biológicas. Aplicaciones de las redes neuronales. Las neuronas artificiales. El perceptrón lineal. Transformación de un problema no lineal en uno lineal. Redes neuronales artificiales. El perceptrón multicapa. Teoría de aproximación universal. Implementación de las redes neuronales con Scikit-learn. Clasificación multiclase (cuatro clases) con perceptrón multicapa.
SISTEMAS DE APRENDIZAJE NO SUPERVISADA: AGRUPAMIENTOS
Tipos de clustering. El algoritmo K-means. El algoritmo kmeans de la librería sklearn. K vecinos más próximos. Variantes del algoritmo básico. DBSCAN. Uso del módulo scipy en clustering.
Al concluir con éxito recibirás un título propio emitido por la Universidad San Jorge, con 6 créditos europeos ECTS.
En estos casos, se expide el título de “Curso Técnico”, en el que se otorgan créditos ECTS.
Información Adicional
Salidas profesionales: