Objetivo General: Preparar a los participantes con los conocimientos y habilidades necesarios para trabajar como profesionales en el campo de la ciencia de datos utilizando el lenguaje de programación Python.
Objetivos Específicos:
-
Dominar los conceptos fundamentales de la ciencia de datos, incluyendo la recopilación, limpieza, análisis y visualización de datos.
-
Aprender a utilizar las bibliotecas de Python para ciencia de datos más populares, como NumPy, Pandas, Matplotlib y Seaborn, para manipular y visualizar datos de manera efectiva.
-
Familiarizarse con las técnicas de preprocesamiento de datos, como la normalización, la codificación de variables categóricas y el manejo de valores perdidos.
-
Adquirir habilidades en el modelado predictivo utilizando algoritmos de aprendizaje automático, como regresión lineal, regresión logística, árboles de decisión, y clasificación.
-
Entender los conceptos de validación de modelos, incluyendo la división de datos en conjuntos de entrenamiento y prueba, y la validación cruzada.
-
Aprender a evaluar y comparar el rendimiento de diferentes modelos de aprendizaje automático utilizando métricas como precisión, recall, F1-score y curvas ROC.
-
Dominar la técnica de selección de características para identificar las variables más relevantes en un conjunto de datos y mejorar la precisión del modelo.
-
Entender cómo abordar problemas comunes en ciencia de datos, como el desequilibrio de clases, el sobreajuste y la falta de datos.
-
Practicar la exploración y análisis de datos en proyectos de ciencia de datos del mundo real, desde la formulación de preguntas analíticas hasta la presentación de resultados.
-
Fomentar la colaboración y el trabajo en equipo mediante proyectos grupales donde los participantes apliquen los conocimientos adquiridos para resolver problemas complejos de ciencia de datos.