Ubiqum te ofrece dos semanas de prueba gratuita en todos los cursos. No pagues hasta que estés convencido de que es el curso que necesitas.
Este curso de Data Analytics ofrece un enfoque práctico y personalizado, ideal tanto para profesionales con experiencia técnica como para aquellos con un perfil de negocio. A lo largo de 480 horas de trabajo intensivo, contarás con la supervisión de un mentor personal y trabajarás en tres proyectos, donde aprenderás a usar Python, R y SQL para analizar grandes volúmenes de datos. También adquirirás un dominio avanzado de los principales algoritmos de Machine Learning y la creación de modelos analíticos avanzados.
El bootcamp está diseñado para que puedas aplicar de inmediato los conocimientos adquiridos en tu entorno laboral actual o iniciar una nueva carrera como Data Analyst, con una metodología flexible y práctica desde el primer día.
El curso está dirigido a aquellas personas que necesiten ampliar sus conocimientos profesionales en data analytics y machine learning de una forma profunda, práctica, flexible y personalizada. que les permita compaginar su trabajo actual con una formación de calidad para seguir progresando en su carrera profesional.
Programar en Python, SQL y R. Utilizando las principales librer1as de cada uno.
Conocer y utilizar los principales algoritmos de machine learning mas utilizados en el mundo de los negocios.
Crear modelos sofisticados con datos y algoritmos de machine learning.
Interpretor los resultados del analisis de datos para evaluar su solidez y solvencia.
Comunicar los resultados del analisis a la gerencia y otras audiencias no tecnicas.
Módulo 1:
En el primer proyecto, el alumno trabajará como Analista de Datos para Blackwell Electronics. Su misión es utilizar técnicas de minería de datos y aprendizaje automático para investigar patrones, en los datos de ventas de Blackwell, y proporcionar información sobre las tendencias y preferencias de compra de los clientes. Las conclusiones extraídas de los patrones en los datos ayudarán a la empresa a tomar decisiones sobre actividades de ventas y marketing, y a comprender la relación entre la demografía de los clientes y su comportamiento de compra. Cada tarea tiene entregables específicos, y se utilizan bibliotecas de Python para llevar a cabo dos actividades muy importantes en el Análisis de Datos: EDA (Análisis Exploratorio de Datos) y FE (Ingeniería de Características. Features). El alumno aprende a usar algoritmos de aprendizaje automático y a crear modelos. Finalmente, el alumno preparará una presentación, con sus conclusiones, para una audiencia no técnica.
Aprenderás:
Fundamentos de programación en Python:
Tipos/Estructuras y métodos comunes.
Técnicas de procesamiento de datos (limpieza de datos, valores nulos, etc.).
Gestión de DataFrames (selección y manipulación con loc).
Fundamentos de la creación de gráficos en Python.
Bucles y definición de métodos.
Introducción al aprendizaje automático (ML) y algoritmos:
Definición del proceso de modelado.
Fundamentos de la selección de características (correlación).
División en train/test y técnicas de validación cruzada.
Diferencia entre hiper-parámetros y parámetros.
Introducción a los algoritmos de clasificación (árboles de decisión y bosques).
Evaluación y selección de modelos (matriz de confusión).
Aprenderás a utilizar las siguientes bibliotecas:
pandas, numpy, matplotlib, seaborn.
scikit-learn, statistics.
Módulo 2:
En este segundo módulo, continuarás trabajando como Científico de Datos para Blackwell Electronics, pero en esta ocasión colaborarás directamente con un socio llamado Credit One, una autoridad de calificación crediticia que ofrece servicios de aprobación de crédito al cliente minorista para Blackwell. Credit One te ha encargado examinar la demografía actual de los clientes para comprender mejor qué características podrían estar relacionadas con la probabilidad de que un cliente incumpla sus obligaciones crediticias actuales. Tu trabajo como Analista de Datos consistirá en identificar qué atributos de los clientes están significativamente relacionados con las tasas de incumplimiento de crédito y construir un modelo predictivo que Credit One pueda utilizar para clasificar mejor a los clientes potenciales como "en riesgo" .
Aprenderás:
Avances sobre el módulo 1:
Refuerza tus habilidades en Python.
Revisa los conceptos básicos del modelado.
Recursos y ejercicios adicionales para solidificar tu conocimiento.
Introducción a técnicas avanzadas de procesamiento de datos:
Escalado, imputación vs interpolación, creación de variables ficticias (dummifying).
Codificación One-hot vs codificación de objetivos (target encoding).
Winsorización y transformación para el manejo de valores atípicos.
Optimización de tus modelos predictivos:
Desarrollo de ingeniería de características (feature cross).
Reequilibrio de clases (SMOTE, muestreadores aleatorios, etc.).
Precisión vs. Exhaustividad (Precision & Recall).
Introducción a la optimización de hiper-parámetros y Grid-Search.
Comparación, selección y aplicación de tus modelos.
Introducción al sobreajuste, validación cruzada e importancia de características.
Aprendizaje en conjunto (Ensemble Learning) (bosques y potenciadores de gradiente).
Evaluación avanzada de modelos:
ROC-AUC, puntuación F1 y curvas de calibración.
Resolución de problemas en casos de negocios reales:
Marcos estructurados (por ejemplo, CRISP-DM) para análisis de datos organizados.
Técnicas de comunicación e informes.
Módulo 3:
En este módulo, volverás a trabajar con la Directora de Tecnología de Blackwell Electronics. Como sabes, recientemente han comenzado a aprovechar los datos recopilados de transacciones en línea y en tiendas físicas para obtener información sobre el comportamiento de compra de sus clientes. Tu tarea es ampliar la aplicación de métodos de minería de datos para desarrollar modelos predictivos, y utilizarás R para lograrlo. En este curso, utilizarás métodos de aprendizaje automático para predecir qué marca de productos informáticos prefieren los clientes de Blackwell, basándote en los datos demográficos de los clientes recopilados a partir de una encuesta de marketing.
Introducción a R para el análisis estadístico:
Tipos/Estructuras y métodos comunes.
Técnicas de procesamiento de datos (Limpieza, valores faltantes..)
Visualización de datos con R
Looping & method definition
Profundizar en las técnicas de modelaje.
Algoritmos de clasificación. KNN, SVM.
Importancia de las variables (Feature) (VarImp)
Introducción a modelos de regresión:
Linear Regression & Logistic Regression.
Understanding coefficients, p-value & significance testing
Regularization methods (ridge, lasso)
Sistemas de recomendación:
·Introduction to transactional datasets
·Correlation vs causation: apriori
·Lift, support & confidence
En Ubiqum aprenderás a utilizar esta librerías de R:
caret, readr, ggplot2, arules, idyr, dplyr
Curso de data analytics y machine learning
Se requiere titulación académica superior (se valora titulación STEM o más de tres años de experiencia profesional en empresa)
Nivel de inglés B1 o superior
Otros cursos