Porque “Todo dato tiene su ciencia”, hemos creado una web serie en donde podrás conocer de forma didáctica y con ejemplos prácticos, las diferentes aplicaciones y usos de la ciencia de datos. ¡Te invitamos a verla!
Capítulo 5: ¿Dónde están los billetes?
El Decano va al cajero para obtener sencillo para pagar un taxi, sin embargo, no encuentra billetes chicos. ¿En cuál cajero podría encontrar billetes de $5 mil pesos? La estadística al parecer puede ayudar a resolver este problema. En este capítulo, sabrás porqué es importante saber estadística para ser un data scientist.
¿Porqué estudiar estadística?
La estadística es la disciplina científica que se encarga de investigar y desarrollar métodos para recoger, organizar y analizar datos. Mediante la implementación de métodos y modelos nos ayuda a obtener conclusiones relevantes para tomar decisiones con evidencia empírica.
¿Cómo la estadística nos ayuda a obtener valor de los datos?
En la era del big data, los procesos de análisis son cada vez más complejos dado el volumen, variedad, velocidad y veracidad de los datos. Para enfrentar este desafío, es necesario implementar técnicas de análisis más sofisticadas y específicas. Los métodos y modelos estadísticos nos permiten ejecutar procesos de análisis de datos que pueden ir creciendo gradualmente en diferentes niveles de complejidad, y mientras mayor sea la complejidad, mayor será el valor que obtendrás de los datos.
¿Qué métodos y modelos estadísticos se usan en data science?
La complejidad analítica presenta una relación directa entre valor y la dificultad de los procesos de análisis.
Analítica descriptiva
¿Qué pasó?. El primer nivel de complejidad permite responder a la pregunta qué ocurrió en un determinado fenómeno bajo análisis. Las técnicas de estadística descriptiva nos permiten analizar una gran variedad de datos históricos (estructurados y no estructurados) y con diferentes métodos estadísticos podemos organizar estos datos y obtener información sobre lo que sucedió.
Analítica de diagnóstico,
¿Por qué sucedió? El segundo nivel de complejidad analítica nos permite responder a la pregunta porqué sucedió un determinado fenómeno. En este nivel de complejidad encontramos las técnicas de inferencia estadística, que mediante la construcción de modelos nos permite estudiar la relación y comparación de variables para obtener conclusiones útiles.
Analítica predictiva
¿Qué pasará? El tercer nivel de complejidad corresponde a la analítica predictiva, que mediante la aplicación de algoritmos matemáticos y estadísticos a datos históricos, nos permitirá identificar patrones, detectar tendencias y realizar pronósticos para orientar el comportamiento de fenómenos futuros. Dentro de estas técnicas encontramos los modelos de regresión, modelos lineales generalizados y series de tiempo.
Analítica prescriptiva
¿Qué hacer para que ocurra? El cuarto nivel de complejidad es la analítica prescriptiva, donde mediante diferentes técnicas estadísticas es posible “preescribir” el comportamiento futuro de determinadas variables, mediante la simulación de escenarios y estimación de probabilidades de ocurrencia, cuantificando así el efecto de las decisiones futuras. Estos métodos estadísticos, en combinación con la programación computacional, dan origen al machine learning, que mediante la iteración de estas operaciones logra ajustar los modelos para automatizar los procesos de toma de decisiones.
¿Qué puedes aprender con nosotros?
Diplomado en Estadística
El Diplomado en Estadística ofrece una formación teórica y conceptual en profundidad de los principales métodos y modelos estadísticos para desarrollar aplicaciones en ciencia de datos.
En el primer curso de métodos estadísticos conocerás las principales técnicas de estadística descriptiva e inferencial, mientras que en el segundo curso conocerás los fundamentos teóricos para la construcción de modelos de regresión y series de tiempo. En el tercer curso de Aplicaciones Estadísticas, conocerás métodos de análisis multivariado y muestreo.
Diplomado en Data Science
En el Diplomado en data science también conocerás los fundamentos conceptuales de los principales métodos y modelos estadísticos pero con una orientación práctica, ya que se pone un mayor énfasis en ejemplos y aplicaciones.
Los contenidos de estadística descriptiva e inferencial se complementan con el uso de software estadístico y dado que el nivel de profundización es relevante se realiza al inicio un taller de nivelación.