Cargando Eventos

Ciencia de Datos: Un Enfoque Práctico en la Era del Big Data (VI ed.)

Código: 20GR10 Granada
30/01/2020 al 21/02/2020

Lugar de celebración:
ETS de Ingenierías Informática y de Telecomunicación
Universidad de Granada

Dirección:
Jorge Casillas Barranquero
Catedrático de Universidad.
Departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada

Reconocimiento de créditos
Este curso tiene hasta ahora, reconocimiento de créditos ECTS OPTATIVOS en los Grados:
3 créditos ECTS OPTATIVOS en todos los Grados impartidos en la Facultad de Comunicación y Documentación
2 créditos ECTS OPTATIVOS en todos los Grados impartidos en la Facultad de Ciencias
3 créditos ECTS OPTATIVOS en todos los Grados impartidos en la ETS de Ingeniería de Caminos, Canales y Puertos
3 créditos ECTS OPTATIVOS en el Grado en Ingeniería Informática impartido en la ETS de Ingenierías Informática y de Telecomunicación
3 créditos ECTS OPTATIVOS en el Grado en Ingeniería de Tecnología de Telecomunicación impartido en la ETS de Ingenierías Informática y de Telecomunicación
3 créditos ECTS OPTATIVOS en todos los Grados impartidos en la ETS de Ingeniería de la Edificación

Este curso podrá ser convalidado por créditos de libre configuración en las titulaciones a extinguir

Introducción:
Ciencia de datos es un área de trabajo interdisciplinar que incluye procesos para recopilar, preparar, analizar, visualizar y modelizar datos que permitan generar conocimiento útil para comprender problemas complejos y ayudar en la toma de decisiones. Estos datos con frecuencia son no estructurados y heterogéneos. En muchas ocasiones, se trata de grandes volúmenes de datos que por su complejidad y diversidad requiere de arquitecturas y técnicas innovadoras para extraer conocimiento relevante: es el conocido big data. Ciencia de datos es un campo emergente con una alta aplicabilidad en ciencias de la salud, marketing, negocios, mercados financieros, transporte, comunicaciones, redes sociales, etc.
Como indica la consultora Gartner (la más prestigiosa en tecnologías de la información), los científicos de datos no son analistas de negocio tradicionales, son profesionales con la rara capacidad para obtener modelos matemáticos a partir de datos que generan beneficios empresariales claros y contundentes. Así, cada vez más se exigen profesionales con habilidades en campos como informática, matemáticas, estadística negocios que dominen las nuevas tecnologías y sepan gestionar datos. Las empresas de todos los sectores están adoptando cada vez más la ciencia de datos, de modo que la demanda de expertos en este sector es enorme; así lo refleja un estudio del MIT Sloan Management Review (2015), está considerada como una de las mejores oportunidades laborales de los próximos años (no en vano, Glassdoor la define como la mejor profesión en 2016). Catalogada por el Harvard Business Review como la profesión ‘más sexy del siglo XXI’ (2012). Según un estudio basado en información de LinkedIn (2015), el número de profesionales en ciencia de datos se ha duplicado en los últimos cuatro años. Otro estudio de Burtch Works (2015) reconoce el impacto positivo en el salario al incluir conocimientos de ciencia de datos.

Objetivos:
Los planes de formación universitaria reglada difícilmente reaccionan a oportunidades laborales emergentes. Además, se tiende a delimitar fronteras que dificultan el desarrollo de especialidades híbridas. Este curso pretende iniciar al alumno en el campo de ciencia de datos, sirviendo así de puente entre diversas disciplinas y ayudando a completar la formación universitaria con una orientación eminentemente práctica. El curso se compone de 30 horas lectivas presenciales repartidas en 15 horas de conceptos teóricos y fundamentos y otras 15 horas de prácticas con software especializado y datos de casos reales.
La teoría incluye visualización de datos, técnicas de clasificación básicas (árboles de decisión, redes neuronales…) y avanzadas (máquinas de soporte vectorial, ensemble learning, deep learning…), preprocesado (eliminación de ruido, imputación de valores perdidos, reducción de datos…), aprendizaje no supervisado (agrupamiento y reglas de asociación), aprendizaje incremental y minería de flujo de datos, big data y sus paradigmas y, finalmente, experiencias reales de ciencia de datos en la empresa. La práctica introduce al alumno en herramientas software tales como KNIME y R y arquitecturas big data como Spark. También se adquirirá experiencia en competiciones con problemas reales (Kaggle, DrivenData…).

A quién va dirigido:
Las personas que se dedican a la ciencia de datos se conocen como científicos de datos, que no es más que una mezcla de matemáticos, estadísticos, informáticos y creativos con habilidades para recopilar, procesar y extraer valor de las diversas y extensas bases de datos; imaginación para comprender, visualizar y comunicar sus conclusiones a los no científicos de datos; y capacidad para crear soluciones basadas en datos que aumentan los beneficios, reducen los costos y ayudan a construir un mundo mejor.
El curso se orienta a estudiantes de grado, máster y profesionales con formación previa principalmente en informática, matemáticas, estadística, física, ingeniería o empresariales que busquen completar su formación como científico de datos. La presentación de los fundamentos teóricos y el uso de software especializado se impartirán de forma apropiada para atender a las diferentes necesidades del alumnado. Ciencia de datos es una disciplina que se nutre de experiencias y formaciones diversas, de forma que el curso aprovechará la variedad de necesidades y capacidades del alumnado.

Evaluación:
Respuesta a preguntas de teoría y competición internacional en una plataforma de ciencia de datos (Kaggle o DrivenData)
Asistencia: Obligatorio asistir al 80% de las clases

Para más información: https://sci2s.ugr.es/CienciaDatosBigData

Jueves, 30 de enero de 2020 (Aula -1.2)

15:30-16:00 Presentación del curso
16:00-17:00 Tema 1: Ciencia de datos, analítica avanzada y big data
Jorge Casillas Barranquero
17:00-18:00 Tema 2: Análisis exploratorio de datos: visualización
Jorge Casillas Barranquero
18:00-18:30 Descanso
18:30-20:30 Tema 3: Fundamentos de clasificación: árboles de decisión, lazy, RNA, bayesianos, evaluación
Alberto Fernández, Profesor Titular de Universidad, Departamento de Ciencias de la Computación e Inteligencia Artificial, Universidad de Granada. Computación e Inteligencia Artificial, Universidad de Granada.

Viernes, 31 de enero de 2020 (Laboratorio -1.1)

16:30-18:30 Práctica 1: KNIME: predicción fundamental
Jesús Alcalá Fernández, Profesor Titular de Universidad, Departamento de Ciencias de la Computación e Inteligencia Artificial, Universidad de Granada
18:30-19:00 Descanso
19:00-20:00 Práctica 1: KNIME: predicción fundamental
Jesús Alcalá Fernández

Jueves, 6 de febrero de 2020 (Laboratorio -1.1)

15:30-17:30 Tema 4: Preprocesamiento: selección y procesado de instancias y características, tratamiento del ruido.
Salvador García, Catedrático de Universidad. Departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada
17:30-18:00 Descanso
18:00-20:00 Práctica 1: KNIME: predicción fundamental
Jesús Alcalá Fernández

Viernes, 7 de febrero de 2020 (Aula -1.2 y Laboratorio -1.1)

15:30-18:00 Tema 5: Clasificación avanzada: SVM, ensemble learning, problemas no balanceados, deep learning
Salvador García
18:00-18:30 Descanso
18:30-20:30 Práctica 2: R para Ciencia de Datos: visualización y predicción avanzada.
Jorge Humberto Guanín Fajardo, Profesor Agregado Facultad de Ciencias de Ingeniería. Universidad Técnica Estatal de Quevedo, Ecuador.

Jueves, 13 de febrero de 2020 (Aula -1.2)

16:30-18:30 Tema 6: Segmentación y relaciones: clustering y reglas de asociación.
Jorge Casillas Barranquero
18:30-19:00 Descanso
19:00-20:00 Tema 7: Aprendizaje incremental y data stream mining
Jorge Casillas Barranquero

Viernes, 14 de febrero de 2020 (Laboratorio -1.1 y Salón de Grados)

15:30-18:30 Práctica 2: R para Ciencia de Datos: visualización y predicción.
Jorge Humberto Guanín Fajardo
18:30-19:00 Descanso
19:00-20:00 Tema 9: Ciencia de datos en acción: experiencias de empresa
Miguel Camacho Collados, Coordinador del Área de Inteligencia Artificial, Ministerio de Economía y Empresa

Jueves, 20 de febrero de 2020 (Aula -1.2 y Laboratorio -1.1)

16:00-17:30 Tema 8: Big data: fundamentos y paradigmas.
Alberto Fernández
17:30-18:00 Descanso
18:00-20:30 Práctica 3: Spark + MLLib: big data
Diego J. García Gil

Viernes, 21 de febrero de 2020 (Laboratorio -1.1)

16:00-18:30 Práctica 3: Spark + MLLib: big data.
Diego J. García Gil
18:30-19:00 Descanso
19:00-19:30 Kaggle/DrivenData
19:30-19:40 Clausura