Al Grano con la Ciencia de Datos: Ejemplos Prácticos para Entender el Mundo Datificado (IV ed.)
Nota:
Los cursos 21ON07 y este, están programados en cuanto a contenidos y calendario para que sea compatible hacer ambos. En caso de matricularse en los dos cursos, puede optar a un descuento de 8€ en el curso 21ON07
Modalidad de realización:
Plataforma Google Meet
Dirección:
Jorge Casillas Barranquero
El mundo datificado en el que vivimos, desde las redes sociales a las plataformas de comunicaciones o los dispositivos móviles, ofrecen una forma de acumular nuevos datos a gran escala, el conocido big data. Ciencia de datos proporciona la experiencia técnica necesaria para analizar estos datos, a veces heterogéneos y no estructurados. Pero este proceso debe ser complementado con un enfoque cualitativo obteniendo datos etnográficos e información subjetiva que permitan poner de manifiesto los contextos del objeto de estudio, el llamado thick data.
Los datos pueden ayudar a comprender grandes temas de interés crucial para muchas áreas. Desde las ciencias biosanitarias a las ciencias sociales y políticas, pasando por la empresa, la economía o el deporte, todas se interesan por análisis cuantitativos que expliquen comportamientos sociales, diseños de mercados, efectos epidemiológicos y cualquier otra forma responsable de mejorar el valor de los datos.
Por las implicaciones éticas que subyacen y la necesidad de complementar el análisis con información cualitativa, en los equipos multidisciplinares de ciencia de datos cada vez es más demandada la participación de especialistas en psicología, antropología, sociología, ciencias políticas, ética, medicina, biología, economía, etc. con una base técnica fundamental en ciencia de datos.
Este breve taller pretende traer el campo de la ciencia de datos a este contexto con un enfoque eminentemente práctico donde, sin necesidad de instalar ningún software, a partir de herramientas on-line, el alumnado podrá aplicar los fundamentos del aprendizaje automático (la rama de la inteligencia artificial que genera conocimiento a partir de datos) y la visualización (técnicas avanzadas de generación de gráficos) para abordar problemas de distinto tipo (sociales, empresa, salud…) desde un nuevo enfoque.
El taller está orientado para toda persona con interés en acercarse por primera vez a la ciencia de datos, el aprendizaje automático y el big data, pero sin conocimientos previos en el campo y sin necesidad de formación avanzada en informática. No obstante, se recomienda cierta destreza en el uso fluido de software e informática en general para mejor aprovechamiento del taller. En cualquier caso, el profesor irá guiando a todo el alumnado para una consecución satisfactoria de los objetivos docentes.
1. Comprender qué es el aprendizaje automático, la ciencia de datos y el big data.
2. Entender lo que pueden y no pueden hacer; lo que deben y no deben hacer.
3. Comprender su base conociendo algunos algoritmos básicos.
4. Ganar experiencia en la aplicación de estas técnicas a datos del mundo real.
– Introducción, aprendizaje automático, big data, casos de uso
– Clasificación: modelos predictivos mediante árboles de decisión
– Clustering: segmentación y análisis relacional
– Reglas de asociación: modelos de causalidad
– Análisis exploratorio de datos mediante visualización
– Implicaciones éticas de la ciencia de datos: la cara oculta del big data
– Prácticas con herramientas on-line especializadas noveles
– Resolución por equipos de un microproyecto de ciencia de datos. Algunos ejemplos de los posibles proyectos son: análisis de Twitter sobre política o salud, predicción de campañas de telemarketing en banca, análisis de ventas en eBay, perfiles de pacientes, diagnóstico de enfermedades, análisis relacional de cuestionarios médicos o sociales, flujos migratorios, etc.
– Vídeos y tutoriales de apoyo, algunos con contenidos originales del profesor, para reforzar y completar la formación autónoma.
Toda la formación será telemática a través de la plataforma Google Meet. Se empleará también software on-line especializado en ciencia de datos y visualización de fácil ejecución en cualquier ordenador de sobremesa o portátil. No podrán emplearse tablets o smartphones para realizar las prácticas, aunque sí se pueden usar para las clases presenciales telemáticas.
El taller consta de 8 horas telepresenciales donde el alumnado puede interactuar en directo con el profesor, que se estima que supone alrededor del 35% del tiempo total de dedicación. Adicionalmente, se recomiendan hasta 6 horas más de vídeos y tutoriales para completar y reforzar la formación. Finalmente, se estima que el trabajo autónomo en el microproyecto en equipos de 2 o 3 personas puede suponer entre 4 y 8 horas de trabajo, incluyendo el tiempo de comunicación entre el equipo. En definitiva, supone hasta 2 horas de media al día de dedicación en el periodo que dura el taller. No obstante, cada alumno o alumna puede adaptar el trabajo autónomo a sus circunstancias personales y participar con mayor o menor esfuerzo.