Bioinformática de muestras biológicas: BioEstadística univariable y multivariable aplicada a resultados con muestras de secuenciación masiva
Bioinformática de muestras biológicas: BioEstadística univariable y multivariable aplicada a resultados con muestras de secuenciación masiva.
Dirección:
Mohamed Larbi Merroun
Profesor Titular, Departamento de Microbiología, Universidad de Granada
Profesor del curso:
Ramiro Vílchez Vargas
Investigador Contratado Doctor.
Universitäsklinikum Magdeburg, Alemania
Colabora:
Facultad de Ciencias.
Fecha:
Del 18 Febrero 2019 al 22 Febrero 2019
Lugar de realización:
Lunes y martes: aula 004 del Aulario de Informática de la Facultad de Ciencias.
Miércoles, jueves y viernes: aula OS1 del Aulario de Informática de la Facultad de Ciencias.
Requerimientos del curso:
Este curso está destinado a los alumnos del 4º curso del Grado de Biología, Bioquímica, Biotecnología, Ciencias Ambientales, Farmacia, Química, Medicina, Biomedicina y alumnos del Master y de Doctorado
Reconocimiento de créditos ECTS OPTATIVOS en los Grados
1,5 créditos ECTS OPTATIVOS en todos los Grados adscritos a la Facultad de Farmacia.
1 créditos ECTS OPTATIVOS en todos los grados adscritos a la Facultad de ciencias
Este curso podrá ser convalidado por créditos de libre configuración en las titulaciones a extinguir
Introducción al curso
El reciente desarrollo de técnicas de secuenciación masiva para el estudio taxonómico, basado en el gen 16S rRNA, de muestras medioambientales conlleva que se genere una cantidad considerable cantidad de datos, los cuales han de ser informáticamente analizados.
El análisis de datos se realiza usando plataformas de anotación taxonómica, programas de informática y programas de estadística, los cuales están disponibles online o instalados bien en el ordenador personal o en un servidor local, en función de la memoria requerida para el análisis.
Todas estas herramientas rara vez están reflejadas en los programas didácticos de Biología, Bioquímica, Biotecnología, Ciencias Ambientales, Farmacia, Química, o en Programas de Master o de Doctorado, incluso a nivel Europeo. Por lo tanto, los estudiantes necesitan cursos complementarios que implementen interdisciplinariamente su conocimientos en la materia.
Por ello, el objetivo principal de este curso es dotar a los estudiantes de conocimientos complementarios a sus respectivos estudios universitarios para que sean capaces de analizar los datos derivados de la secuenciación masiva.
El curso consta de un total de 30 horas, distribuidas en cinco horas durante cinco días consecutivos. No se requieren conocimientos previos ni de estadística ni de bioinformática y los conocimientos sobre Excel se explicarán sobre la marcha. Sin embargo, se recomienda fuertemente que cada estudiante tenga su propio ordenador portátil personal con programas estándar instalados (no se acepta plataforma OpenAccess para el Excel). Los estudiantes tienen que estar altamente motivados e involucrados en entablar “brain storming” durante la duración del curso. Nivel básico de inglés es recomendable aunque las clases se impartirán en español (English also possible).
Resumidamente, el primer día se hará una introducción del curso incluyendo la importancia del diseño experimental en el resultado final, se revisaran todos los programas que se utilizarán en los siguientes cuatro días, y se empezará a analizar los datos brutos que se enviarán a los estudiantes con antelación. El segundo día se hará la anotación taxonómica de las secuencias y se agruparán por fila, clase, orden, familia, genero y filotipo. Se harán las rectas de rarefacción, se normalizará la profundidad de secuenciación al mínimo de secuencias y se elaborarán los “heapmaps” de las muestras. Se obtendrán los índices medio ambientales (Richnness, Evenness, Shannon y Pielou índices) y se elaborarán las gráficas correspondientes. El tercer día se hará el agrupamiento (clustering) de muestras y se calcularán los coeficientes de correlación. En paralelo, se realizarán grupos de trabajo (cuatro estudiantes máximo por grupo). Cada grupo analizará un sub-grupo de secuencias y los resultados se expondrán a la clase durante la duración del curso. El cuarto día, se realizarán los cálculos requeridos para el estudio de co-ocurrencias de filotipos y se harán los gráficos correspondientes. El quinto día, se dedicará a las exposiciones de los grupos, dudas, preguntas y sugerencias.
En resumen, en el curso se enseñarán a anotar taxonómicamente, hacer la rectas de rarefacción, elaborar dendogramas usando diferentes algoritmos, realizar PCoa, NMDS, PCA y CA, ANOSIM, PERMANOVA, calcular los índices medioambientales, Heatmaps, SIMPER, test de Wilcoxon y Pearson, así como a realizar “Communities Network”
Competencias de los alumnos:
- Aprender a elaborar el diseño experimental adecuado para alcanzar el objetivo propuesto.
- Aprender a encontrar en internet aquellas plataformas y programas informáticos que se usan en la actualidad en el análisis de datos derivados de la secuenciación masiva.
- Aprender a manejar programas bioinformáticos de análisis de diversidad y actividad microbiana.
- Aprender a elaborar las gráficas correspondientes a los resultados obtenidos después del análisis de datos.
Metodología:
Taller de trabajo. Cada alumno tendrá su propio ordenador aunque se recomienda que cada alumno se traiga su propio portátil (al ser administrador se pueden instalar programas).
Exposiciones por parte de los alumnos (20 min max).
Evaluación
Se propone un sistema de evaluación en el que se valorará:
Participación activa durante el curso, interviniendo en el desarrollo del mismo.
Asistencia a las clases: 80%. Al ser un Taller de trabajo la asistencia debe ser obligatoria.
Examen oral (durante la exposición de los grupos de trabajo): 40%
15:00-21:00 | Instalación de todos los programas que se usarán durante el curso Cómo saber lo que hay que hacer para escribir un artículo científico?: diseño experimental. Visualización de los datos crudos obtenidos después de la secuenciación de muestras medioambientales. Ramiro Vílchez Vargas Investigador Contratado Doctor. Universitäsklinikum Magdeburg, Alemania |
15:00-21:00 | Análisis de resultados I: Anotación taxonómica, Rarefaction curves, normalization and heatmaps. Ramiro Vílchez Vargas |
Miércoles 20 de febrero de 2019
15:00-21:00 | Análisis de resultados II: Bray-Curtis clustering, PCA, PCoA, nMDS. Ramiro Vílchez Vargas |
15:00-21:00 | Análisis de resultados III: Co-occurrence analysis. Ramiro Vílchez Vargas |
15:00-21:00 | Examen: Cada grupo expondrá (20 min max) los resultados obtenidos que han ido analizando durante el curso.
Dudas y sugerencias. Mesa redonda. |