Bioinformática de muestras biológicas: BioEstadística univariable y multivariable aplicada a resultados con muestras de secuenciación masiva (VI ed.)
Modalidad de celebración:
Modalidad virtual síncrona, usando la plataforma Google Meet por videoconferencia. (La dirección del curso contactará con ustedes por correo electrónico con la debida antelación para facilitarles la forma de conexión, así como las directrices que consideren necesarias para el correcto seguimiento del curso.)
Requerimientos:
Este curso está destinado a los alumnos cursando cursos del Grado de Biología, Bioquímica, Biotecnología, Ciencias Ambientales, Farmacia, Química y Medicina entre otros muchos y alumnos del Máster y de Doctorado con conocimientos básicos de R pero no de Excel.
Dirección:
Mohamed Larbi Merroun
Profesor Titular de Universidad
Departamento de Microbiología
Profesor del curso:
Ramiro Vílchez Vargas
Investigador Contratado Doctor.
Universitäsklinikum Magdeburg, Alemania
Posibilidad de reconocimiento de créditos
Reconocimiento de créditos ECTS OPTATIVOS en los Grados (hasta el momento)
1,2 créditos ECTS OPTATIVOS en la Facultad de Farmacia para Todos los Grados adscritos
El reciente desarrollo de técnicas de secuenciación masiva para el estudio taxonómico, basado en el gen 16S rRNA, de muestras medioambientales conlleva que se genere una cantidad considerable cantidad de datos, los cuales han de ser informáticamente analizados.
Los estudiantes tendrán la oportunidad de analizar ellos mismos datos crudos de secuenciación masiva. Dichas muestras provienen de biopsias de diferentes regiones del tracto digestivo humano, saliva y heces de un grupo de 25 pacientes (8 muestras por paciente).
El análisis de datos se realizará usando plataformas de anotación taxonómica, programas de informática y programas de estadística, los cuales están disponibles online o instalados bien en el ordenador personal o en un servidor local, en función de la memoria requerida para el análisis.
Todas estas herramientas rara vez están reflejadas en los programas didácticos de Biología, Bioquímica, Biotecnología, Ciencias Ambientales, Farmacia, Química, etc.. o en Programas de Master o de Doctorado, incluso a nivel Europeo. Por lo tanto, los estudiantes necesitan cursos complementarios que implementen interdisciplinariamente su conocimientos en la materia.
Por ello, el objetivo principal de este curso es dotar a los estudiantes de conocimientos complementarios a sus respectivos estudios universitarios para que sean capaces de analizar los datos derivados de la secuenciación masiva.
El curso consta de un total de 30 horas, distribuidas en seis horas durante cinco días consecutivos. No se requieren conocimientos previos ni de estadística ni de bioinformática y los conocimientos sobre Excel se explicarán sobre la marcha, aunque se aconseja estar familiarizado con Excel. No obstante, la semana antes del curso (una vez cerrado el periodo de matriculación) se mandarán ejercicios para homogeneizar el nivel de los estudiantes antes del comienzo del curso. Se recomienda fuertemente que cada estudiante tenga su propio ordenador portátil personal con programas estándar instalados (no se acepta plataforma OpenAccess para el Excel). Los estudiantes tienen que estar altamente motivados e involucrados en entablar “brain storming” durante la duración del curso. Nivel básico de inglés es recomendable aunque las clases se impartirán en español (English also possible).
El curso será online usando la plataforma google meet con videoconferencia. Al ser el curso online en vez de presencial habrá que ajustar muchas cosas, tanto el alumnado como el profesor. Por parte del profesor (Ramiro Vilchez-Vargas) el temario que siempre se ha impartido presencialmente se va a seguir impartiendo. La duración del curso está en principio en cinco días, del lunes 5 de Abril al viernes 9 de Abril. Si el temario no se pudiera terminar en esos cinco días por razones de conexión o cualquier otra razón, se aumentarán los días a un máximo de 3 días más, terminando el curso como máximo el 14 de Abril. Las tutorías individuales o por grupos reducidos serán por video conferencia cada día antes del curso de 8h a 15 h (horario abierto). Por correo electrónico se podrá contactar con el profesor en cualquier momento.
Resumidamente, el primer día se hará una introducción del curso incluyendo la importancia del diseño experimental en el resultado final, se revisaran todos los programas que se utilizarán en los siguientes cuatro días, y se empezará a analizar los datos brutos que se enviarán a los estudiantes con antelación. El segundo día se hará la anotación taxonómica de las secuencias y se agruparán por fila, clase, orden, familia, genero y filotipo. Se harán las rectas de rarefacción, se normalizará la profundidad de secuenciación al mínimo de secuencias y se elaborarán los “heapmaps” de las muestras. Se obtendrán los índices medio ambientales (Richnness, Evenness, Shannon y Pielou índices) y se elaborarán las gráficas correspondientes. El tercer día se hará el agrupamiento (clustering) de muestras y se calcularán los coeficientes de correlación. En paralelo, se realizarán grupos de trabajo (cuatro estudiantes máximo por grupo). Cada grupo analizará un sub-grupo de secuencias y los resultados se expondrán a la clase durante la duración del curso. El cuarto día, se realizarán los cálculos requeridos para el estudio de co-ocurrencias de filotipos y se harán los gráficos correspondientes. El quinto día, cada estudiante presentará una presentación de 15 minutos por video conferencia con los resultados que ha ido obteniendo durante la semana.
En resumen, en el curso se enseñarán a anotar taxonómicamente, hacer la rectas de rarefacción, elaborar dendogramas usando diferentes algoritmos, realizar PCoa, NMDS, PCA y CA, ANOSIM, PERMANOVA, calcular los índices medioambientales, Heatmaps, SIMPER, test de Wilcoxon, Pearson, con sus correspondientes FDR (False Discovery rates, para corregir los valores de P), así como a realizar “Community Network”.
a) Aprender a elaborar el diseño experimental adecuado para alcanzar el objetivo propuesto.
b) Aprender a encontrar en internet aquellas plataformas y programas informáticos que se usan en la actualidad en el análisis de datos derivados de la secuenciación masiva.
c) Aprender a manejar programas bioinformáticos de análisis de diversidad y actividad microbiana.
d) Aprender a elaborar las gráficas correspondientes a los resultados obtenidos después del análisis de datos.
a) Taller de trabajo. Cada alumno tendrá su propio ordenador, aunque recomendable dos ordenadores, uno para la videoconferencia y otro para hacer los ejercicios.
b) Exposiciones por parte de los alumnos (15 min max).
Se propone un sistema de evaluación en el que se valorará:
Participación activa durante el curso, interviniendo en el desarrollo del mismo.
Al ser el curso online se realizará una evaluación continua valorando la participación de cada uno de los estudiantes.
Cualificación personal o empleos a los que da acceso:
El conocimiento de bioinformática y bioestadística aplicadas a campos de conocimiento relacionados con salud es altamente demandado en la actualidad.
Idiomas utilizados:
Español and English
15:00-21:00 | Instalación de todos los programas que se usarán durante el curso Cómo saber lo que hay que hacer para escribir un artículo científico?: diseño experimental. Visualización de los datos crudos obtenidos después de la secuenciación de muestras medioambientales Ramiro Vílchez Vargas Investigador Contratado Doctor. Universitäsklinikum Magdeburg, Alemania |
15:00-21:00 | Análisis de resultados I: Anotación taxonómica, Rarefaction curves, normalization and heatmaps Ramiro Vílchez Vargas |
15:00-21:00 | Análisis de resultados II: Bray-Curtis clustering, PCA, PCoA, nMDS Ramiro Vílchez Vargas |
15:00-21:00 | Análisis de resultados III: Co-occurrence analysis Ramiro Vílchez Vargas |
15:00-21:00 | Examen: Cada grupo expondrá (15 min max) los resultados obtenidos que han ido analizando durante el curso. Dudas y sugerencias. Mesa redonda Ramiro Vílchez Vargas |