Estadística y Ciencia de Datos: Brechas en el currículo y desafíos en su educación

La Ciencia de Datos se ha consolidado como una disciplina esencial en la era de la información, destacándose por su capacidad para transformar grandes volúmenes de datos en conocimiento valioso. Este campo interdisciplinario emplea métodos, procesos, algoritmos y sistemas científicos para extraer interpretaciones útiles de datos tanto estructurados como no estructurados. Al integrar disciplinas como la estadística, la informática, la ingeniería de datos y el aprendizaje automático, la Ciencia de Datos aborda las complejidades inherentes al análisis de fenómenos a través de los datos. No obstante, la implementación de estos procesos presenta desafíos para la enseñanza: Las deficiencias en estadística pueden limitar el éxito. Una mala interpretación de datos puede llevar a malentendidos sobre métricas y visualizaciones. La elección incorrecta de modelos y el sobreajuste o subajuste son riesgos cuando no se comprenden bien los supuestos estadísticos detrás de los modelos o conceptos como la validación cruzada. Errores en inferencias estadísticas y problemas de muestreo pueden resultar en conclusiones incorrectas y sesgos en los resultados.

Para quienes aspiran a dominar la Ciencia de Datos, con relación a Estadística, requieren de comprender la Probabilidad y las Distribuciones de Probabilidad. Este conocimiento permite modelar incertidumbres y abordar la variabilidad de los datos con efectividad. También de la Inferencia Estadística, que incluye el manejo de intervalos de confianza y pruebas de hipótesis, permite extrapolar conclusiones sobre poblaciones enteras a partir de muestras. Del Análisis de Datos y Visualización pues no solo ayudan a identificar patrones y tendencias, sino que también son esenciales para comunicar hallazgos de manera coherente y precisa. Finalmente, el análisis estadístico multivariado desempeña un papel crucial para Ciencia de Datos porque permite el examen simultáneo de múltiples variables para entender las relaciones complejas que pueden existir entre ellas.

A medida que la demanda social de conocedores de la Ciencia de Datos siga creciendo, la intersección entre estadística y esta disciplina se vuelve más prominente y demandante de atención en la Escuela. Es este espacio de charla discutiremos sobre la naturaleza del problema y posibles vías de atención desde una perspectiva integral.

Bibliografía

  • Qiao, X., & Jiao, H. (2018). Data mining techniques in analyzing process data: A didactic.
    Frontiers in psychology, 9, 2231.

  • Salles, F., Dos Santos, R., & Keskpaik, S. (2020). When didactics meet data science: Process
    data analysis in large-scale mathematics assessment in France. Large-scale assessments in education, 8(1), 7.

 

  • Eje temático
  • Ponentes: José Armando Albert Huerta1 y Blanca Ruiz Hernández2