Porque “Todo dato tiene su ciencia”, hemos creado una web serie en donde podrás conocer de forma didáctica y con ejemplos prácticos, las diferentes aplicaciones y usos de la ciencia de datos. ¡Te invitamos a verla!
Capítulo 7: ¡Los pasajes me persiguen!
Tina está preparando sus vacaciones de verano y cotiza pasajes al sur de Chile. Al revisar, considera que la tarifa es alta y recuerda que el año anterior compró sus pasajes con oferta para ese tramo, así que decide esperar. Al revisar otros sitios web, se percata que la publicidad continuamente la acecha para que compre el pasaje, hasta que en Instagram, le aparece el anuncio clave, los pasajes a la tarifa que ella espera. ¡Las maletas ya están listas!
Capítulo 8: ¡El correo se me fue a Spam!
María Eugenia recibe un llamado que le alerta sobre un correo no leído. Al revisar su bandeja de entrada no lo encuentra, pero sospecha que se le fue a la carpeta de spam. Y efectivamente, ahí estaba. Pero, ¿porqué hizo eso el correo, si no era spam? ¡No que los computadores eran tan inteligentes!
¿Qué es machine learning?
El aprendizaje de máquinas, más conocido como machine learning, es una disciplina de la ciencia de datos cuyo objetivo es desarrollar técnicas que permitan que las computadoras aprendan de forma autónoma, sin intervención humana. Quizás te puede sonar algo lejano o futurista, pero la verdad es que cada vez que tu correo electrónico completa una frase por ti o las redes sociales te etiquetan en una fotografía, hay técnicas de machine learning detrás. Sus usos y aplicaciones se conocen como Inteligencia Artificial.
¿Cómo puede aprender una máquina?
Al igual que nosotros, que aprendemos por imitación, observación o por instrucción, podemos programar a las computadoras para que hagan lo mismo. Los computadores aprenden mediante el desarrollo de algoritmos, que le permiten identificar patrones y tendencias en un conjunto de datos masivos de forma iterativa, acumulando así experiencia hasta que logran el conocimiento de forma autónoma.
¿Qué tipos de algoritmos debo aprender para implementar machine learning?
Aprendizaje supervisado
Se basa en descubrir la relación existente entre una variable de entrada y otra de salida, y surge de enseñarle al algoritmo el resultado que queremos obtener, por tanto estamos supervisando los resultados de su aprendizaje. Como en el caso de María Eugenia, el detector etiquetó el e-mail como spam a partir de los patrones que ha aprendido del histórico de correos, ya sea por el remitente, la relación entre texto/imágenes o palabras clave en el asunto. Dentro de estas técnicas encontramos los métodos de clasificación como los árboles de decisión, random forest, naive bayes, support vector machine y las redes neuronales artificiales.
Aprendizaje no supervisado
Estos algoritmos consiguen producir conocimiento únicamente de los datos que se proporcionan como entrada, sin necesidad en ningún momento de explicarle al sistema que resultado queremos obtener. En este caso enfrentamos el problema de manera ciega, el sistema aprende sin recibir ninguna pauta previa y los resultados son desconocidos. Este tipo de técnicas se utilizan para segmentación de mercados o análisis de comportamiento en redes sociales. Dentro de estas técnicas encontramos clustering, análisis de componentes principales, k-means y reglas de asociación.
¿Qué puedes aprender con nosotros?
Diplomado en Data Science
En este diplomado aprenderás en profundidad las diferentes técnicas de aprendizaje supervisado y no supervisado. El programa considera la enseñanza de métodos de clasificación como árboles de decisión, random forest, naive bayes, support vector machine y redes neuronales; y en métodos de aprendizaje no supervisado K-means, análisis de componentes principales y clustering. Estos métodos se entrenan en R y en Python.
Inicio: Mayo 2020.
Aplicaciones data science con Python
En este curso podrás desarrollar modelos de machine learning con paquetes de Python. Este curso requiere de un conocimiento más avanzado de modelamiento estadístico y programación, y está orientado a profesionales que tengan experiencia en el área.
Inicio: Segundo semestre 2020.