Cargando Eventos

Al Grano con la Ciencia de Datos: Ejemplos Prácticos para Entender el Mundo Datificado (IV ed.)

Código: 21ON06 Online
01/02/2021 al 09/02/2021

Nota:
Los cursos 21ON07 y este, están programados en cuanto a contenidos y calendario para que sea compatible hacer ambos. En caso de matricularse en los dos cursos, puede optar a un descuento de 8€ en el curso 21ON07

Modalidad de realización:
Plataforma Google Meet

Dirección:
Jorge Casillas Barranquero

Presentación:

El mundo datificado en el que vivimos, desde las redes sociales a las plataformas de comunicaciones o los dispositivos móviles, ofrecen una forma de acumular nuevos datos a gran escala, el conocido big data. Ciencia de datos proporciona la experiencia técnica necesaria para analizar estos datos, a veces heterogéneos y no estructurados. Pero este proceso debe ser complementado con un enfoque cualitativo obteniendo datos etnográficos e información subjetiva que permitan poner de manifiesto los contextos del objeto de estudio, el llamado thick data.
Los datos pueden ayudar a comprender grandes temas de interés crucial para muchas áreas. Desde las ciencias biosanitarias a las ciencias sociales y políticas, pasando por la empresa, la economía o el deporte, todas se interesan por análisis cuantitativos que expliquen comportamientos sociales, diseños de mercados, efectos epidemiológicos y cualquier otra forma responsable de mejorar el valor de los datos.
Por las implicaciones éticas que subyacen y la necesidad de complementar el análisis con información cualitativa, en los equipos multidisciplinares de ciencia de datos cada vez es más demandada la participación de especialistas en psicología, antropología, sociología, ciencias políticas, ética, medicina, biología, economía, etc. con una base técnica fundamental en ciencia de datos.
Este breve taller pretende traer el campo de la ciencia de datos a este contexto con un enfoque eminentemente práctico donde, sin necesidad de instalar ningún software, a partir de herramientas on-line, el alumnado podrá aplicar los fundamentos del aprendizaje automático (la rama de la inteligencia artificial que genera conocimiento a partir de datos) y la visualización (técnicas avanzadas de generación de gráficos) para abordar problemas de distinto tipo (sociales, empresa, salud…) desde un nuevo enfoque.

A quién va dirigido:

El taller está orientado para toda persona con interés en acercarse por primera vez a la ciencia de datos, el aprendizaje automático y el big data, pero sin conocimientos previos en el campo y sin necesidad de formación avanzada en informática. No obstante, se recomienda cierta destreza en el uso fluido de software e informática en general para mejor aprovechamiento del taller. En cualquier caso, el profesor irá guiando a todo el alumnado para una consecución satisfactoria de los objetivos docentes.

Objetivos:

1. Comprender qué es el aprendizaje automático, la ciencia de datos y el big data.
2. Entender lo que pueden y no pueden hacer; lo que deben y no deben hacer.
3. Comprender su base conociendo algunos algoritmos básicos.
4. Ganar experiencia en la aplicación de estas técnicas a datos del mundo real.

Contenidos:

– Introducción, aprendizaje automático, big data, casos de uso
– Clasificación: modelos predictivos mediante árboles de decisión
– Clustering: segmentación y análisis relacional
– Reglas de asociación: modelos de causalidad
– Análisis exploratorio de datos mediante visualización
– Implicaciones éticas de la ciencia de datos: la cara oculta del big data
– Prácticas con herramientas on-line especializadas noveles
– Resolución por equipos de un microproyecto de ciencia de datos. Algunos ejemplos de los posibles proyectos son: análisis de Twitter sobre política o salud, predicción de campañas de telemarketing en banca, análisis de ventas en eBay, perfiles de pacientes, diagnóstico de enfermedades, análisis relacional de cuestionarios médicos o sociales, flujos migratorios, etc.
– Vídeos y tutoriales de apoyo, algunos con contenidos originales del profesor, para reforzar y completar la formación autónoma.

Metodología:

Toda la formación será telemática a través de la plataforma Google Meet. Se empleará también software on-line especializado en ciencia de datos y visualización de fácil ejecución en cualquier ordenador de sobremesa o portátil. No podrán emplearse tablets o smartphones para realizar las prácticas, aunque sí se pueden usar para las clases presenciales telemáticas.

El taller consta de 8 horas telepresenciales donde el alumnado puede interactuar en directo con el profesor, que se estima que supone alrededor del 35% del tiempo total de dedicación. Adicionalmente, se recomiendan hasta 6 horas más de vídeos y tutoriales para completar y reforzar la formación. Finalmente, se estima que el trabajo autónomo en el microproyecto en equipos de 2 o 3 personas puede suponer entre 4 y 8 horas de trabajo, incluyendo el tiempo de comunicación entre el equipo. En definitiva, supone hasta 2 horas de media al día de dedicación en el periodo que dura el taller. No obstante, cada alumno o alumna puede adaptar el trabajo autónomo a sus circunstancias personales y participar con mayor o menor esfuerzo.

Lunes, 1 de febrero de 2021

11:00-13:00 Sesión 1:Conceptos básicos de introducción a ciencia de datos, visualización y a los cuatro paradigmas fundamentales de clasificación, regresión, clustering y reglas de asociación
Jorge Casillas Barranquero

Miércoles, 3 de febrero de 2021

11:00-13:00 Sesión 2: Introducción a software on-line (sin necesidad de instalación) para visualización y ciencia de datos.

Durante la sesión, el alumnado votará para elegir entre varias propuestas (principalmente de aplicaciones sociales, de empresa o de salud) cuatro proyectos distintos (con datos reales), uno representativo de cada paradigma de aprendizaje automático. Posteriormente se organizarán equipos de 2 o 3 personas (buscando multidisciplinaridad y adaptando la dificultad del problema a las destrezas del alumnado) para que aborden uno de esos proyectos. El alumnado dispondrá de varios días para trabajar de forma autónoma en equipo en el proyecto que le corresponda
Jorge Casillas Barranquero

Viernes, 5 de febrero de 2021

11:00-13:00 Sesión 3: La primera parte de la sesión se dedica a completar la formación según las necesidades que se hayan observado e incluyendo otros aspectos como diseñar algoritmos de aprendizaje automático que sean justos y equitativos para evitar sesgos.

La segunda mitad se dedica a una primera puesta en común de los resultados de los distintos equipos y resolución de dudas.
Jorge Casillas Barranquero

Martes, 9 de febrero de 2021

11:00-13:00 Sesión 4: Cada equipo expondrá su trabajo final y se contrastarán los diferentes enfoques seguidos para el mismo problema. Posteriormente se debatirá con el resto del alumnado en una discusión común y se propondrán diferentes mejoras al análisis.
Jorge Casillas Barranquero