Cargando Eventos

Ciencia de Datos: Un Enfoque Práctico en la Era del Big Data (3ª edición)

Código: P01 Padul
04/02/2017 al 25/03/2017

Dirección:
Jorge Casillas

Lugar de realización
Centro de la Construcción Sostenible de Padúl (CLOC)

Reconocimiento de créditos
Posibilidad de reconocimiento de créditos ECTS OPTATIVOS en los Grados

Curso reconocido con (hasta el momento):

3 créditos ECTS OPTATIVOS en el Grado en Ingeniería Electrónica Industrial.
1.5 créditos ECTS OPTATIVOS en el Grado en Estádistica.
1 créditos ECTS OPTATIVOS en el Grado en Matemáticas.

Este curso podrá ser convalidado por créditos de libre configuración en las titulaciones a extinguir

Justificación del curso y objetivos
Ciencia de Datos es un área de trabajo interdisciplinar que incluye procesos para recopilar, preparar, analizar, visualizar y modelizar datos que permitan generar conocimiento útil para comprender problemas complejos y ayudar en la toma de decisiones. Estos datos con frecuencia son no estructurados y heterogéneos. En muchas ocasiones, se trata de grandes volúmenes de datos que por su complejidad y diversidad requiere de arquitecturas y técnicas innovadoras para extraer conocimiento relevante: es el conocido big data. Ciencia de Datos es un campo emergente con una alta aplicabilidad en ciencias de la salud, marketing, negocios, mercados financieros, transporte, comunicaciones, redes sociales, etc.
Como indica la consultora Gartner (la más prestigiosa en tecnologías de la información), los científicos de datos no son analistas de negocio tradicionales, son profesionales con la rara capacidad para obtener modelos matemáticos a partir de datos que generan beneficios empresariales claros y contundentes. Así, cada vez más se exigen profesionales con habilidades en campos como informática, matemáticas, estadística o negocios que dominen las nuevas tecnologías y sepan gestionar datos. Las empresas de todos los sectores están adoptando cada vez más la Ciencia de Datos, de modo que la demanda de expertos en este sector es enorme; así lo refleja un estudio del MIT Sloan Management Review (2015). Está considerada como una de las mejores oportunidades laborales de los próximos años. Catalogada por el Harvard Business Review como la profesión ‘más sexy del siglo XXI’ (2012). Según un estudio de LinkedIn (2015), el número de profesionales en Ciencia de Datos se ha duplicado en los últimos cuatro años. Otro estudio de Burtch Works (2015) reconoce el impacto positivo en el salario al incluir conocimientos de Ciencia de Datos.

Objetivos
Los planes de formación universitaria reglada difícilmente reaccionan a oportunidades laborales emergentes. Además, se tiende a delimitar fronteras que dificultan el desarrollo de especialidades híbridas. Este curso pretende iniciar al alumno en el campo de Ciencia de Datos, sirviendo así de puente entre diversas disciplinas y ayudando a completar la formación universitaria con una orientación eminentemente práctica. El curso se compone de 30 horas lectivas presenciales repartidas en 15 horas de conceptos teóricos y fundamentos y otras 15 horas de prácticas con software especializado y datos de casos reales.
La teoría incluye visualización de datos, técnicas de clasificación básicas (árboles de decisión, redes neuronales…) y avanzadas (máquinas de soporte vectorial, ensemble learning, deep learning…), preprocesado (eliminación de ruido, imputación de valores perdidos, reducción de datos…), aprendizaje no supervisado (agrupamiento y reglas de asociación), aprendizaje incremental y minería de flujo de datos, big data y sus paradigmas y, finalmente, experiencias reales de Ciencia de Datos en la empresa. La práctica introduce al alumno en herramientas software tales como KNIME y R y arquitecturas como Hadoop y Spark. También se adquirirá experiencia en la plataforma Kaggle para competiciones en problemas reales.

Sábado, 4 de febrero de 2017

08:45-09:15 Presentación del curso
09:15-10:15 Ciencia de Datos, analítica avanzada y big data
Jorge Casillas td>
10:15-11:15 Análisis exploratorio de datos: visualización
Jorge Casillas td>
11:15-11:45 Descanso
11:45-13:45 Fundamentos de clasificación: árboles de decisión, lazy, RNA, bayesianos, evaluación
S. García td>

Sábado, 11 de febrero de 2017

10:00-12:00 KNIME: predicción fundamental
Jesús Alcalá td>
12:00-12:30 Descanso
12:30-13:30 KNIME: predicción fundamental
Jesús Alcalá td>

Sábado, 18 de febrero de 2017

09:45-11:45 Preprocesamiento: selección y procesado de instancias y características, tratamiento del ruido
Salvador García td>
11:45-12:00 Descanso
12:00-14:00 KNIME: predicción fundamental
Jesús Alcalá td>

Sábado, 25 de febrero de 2017

08:45-11:15 Clasificación avanzada: SVM, ensemble learning, problemas no balanceados, deep learning
Alberto Fernández td>
11:15-11:45 Descanso
11:45-13:45 R para Ciencia de Datos (ggplo2, caret, rattle, neuralnet, e1071, randomForest, gbm, h2o, autoencoder, SAENET…): Visualización y predicción avanzada.
Jorge Guanín td>

Sábado, 04 de febrero de 2017

10:00-12:00 Segmentación y relaciones: clustering y reglas de asociación
Jorge Casillas td>
12:00-12:30 Descanso
12:30-13:30 Aprendizaje incremental y data stream mining.
Jorge Casillas td>

Sábado, 11 de febrero de 2017

10:00-12:00 R para Ciencia de Datos (ggplo2, caret, rattle, neuralnet, e1071, randomForest, gbm, h2o, autoencoder, SAENET…): visualización y predicción avanzada.
Jorge Guanín td>
12:00-12:30 Descanso
12:30-13:30 R para Ciencia de Datos (ggplo2, caret, rattle, neuralnet, e1071, randomForest, gbm, h2o, autoencoder, SAENET…): visualización y predicción avanzada.
Jorge Guanín td>

Sábado, 18 de febrero de 2017

09:45-11:15 Big data: fundamentos y paradigmas.
Alberto Fernández td>
11:15-11:30 Descanso
11:30-14:00 Hadoop + Mahout, Spark + MLLib: big data.
Sara del Río
Sergio Ramírez td>

Sábado, 25 de febrero de 2017

09:00-11:30 Hadoop + Mahout, Spark + MLLib: big data.
Sara del Río
Sergio Ramírez td>
11:30-12:00 Descanso
12:00-12:30 Kaggle
12:30-14:00 Ciencia de Datos en acción: experiencias de empresa
invitado/a td>