Objetivo General: Preparar a los participantes con los conocimientos y habilidades necesarios para trabajar como profesionales en el campo de la ciencia de datos utilizando el lenguaje de programación Python.

Objetivos Específicos:

  1. Dominar los conceptos fundamentales de la ciencia de datos, incluyendo la recopilación, limpieza, análisis y visualización de datos.

  2. Aprender a utilizar las bibliotecas de Python para ciencia de datos más populares, como NumPy, Pandas, Matplotlib y Seaborn, para manipular y visualizar datos de manera efectiva.

  3. Familiarizarse con las técnicas de preprocesamiento de datos, como la normalización, la codificación de variables categóricas y el manejo de valores perdidos.

  4. Adquirir habilidades en el modelado predictivo utilizando algoritmos de aprendizaje automático, como regresión lineal, regresión logística, árboles de decisión, y clasificación.

  5. Entender los conceptos de validación de modelos, incluyendo la división de datos en conjuntos de entrenamiento y prueba, y la validación cruzada.

  6. Aprender a evaluar y comparar el rendimiento de diferentes modelos de aprendizaje automático utilizando métricas como precisión, recall, F1-score y curvas ROC.

  7. Dominar la técnica de selección de características para identificar las variables más relevantes en un conjunto de datos y mejorar la precisión del modelo.

  8. Entender cómo abordar problemas comunes en ciencia de datos, como el desequilibrio de clases, el sobreajuste y la falta de datos.

  9. Practicar la exploración y análisis de datos en proyectos de ciencia de datos del mundo real, desde la formulación de preguntas analíticas hasta la presentación de resultados.

  10. Fomentar la colaboración y el trabajo en equipo mediante proyectos grupales donde los participantes apliquen los conocimientos adquiridos para resolver problemas complejos de ciencia de datos.