Curso

Bioinformática de muestras biológicas: BioEstadística univariable y multivariable aplicada a resultados con muestras de secuenciación masiva

El curso
Programa

Código: 20GR60 Online

13/07/2020 al 17/07/2020

Requerimientos:
Este curso está destinado a los alumnos cursando cursos del Grado de Biología, Bioquímica, Biotecnología, Ciencias Ambientales, Farmacia, Química y Medicina entre otros muchos y alumnos del Máster y de Doctorado con conocimientos básicos de R y de Excel.

Dirección:
Mohamed Larbi Merroun
Profesor Titular de Universidad
Departamento de Microbiología

Reconocimiento de créditos
Reconocimiento de 1 crédito ECTS OPTATIVOS para el Grado en Biología
Reconocimiento de 1 crédito ECTS OPTATIVOS para el Grado en Estadística

Este curso podrá ser convalidado por créditos de libre configuración en las titulaciones a extinguir

Justificación del curso:

El reciente desarrollo de técnicas de secuenciación masiva para el estudio taxonómico, basado en el gen 16S rRNA, de muestras medioambientales conlleva que se genere una cantidad considerable cantidad de datos, los cuales han de ser informáticamente analizados.
Los estudiantes tendrán la oportunidad de analizar ellos mismos datos crudos de secuenciación masiva. Dichas muestras provienen de biopsias de diferentes regiones del tracto digestivo humano, saliva y heces de un grupo de 25 pacientes (8 muestras por paciente).

El análisis de datos se realizará usando plataformas de anotación taxonómica, programas de informática y programas de estadística, los cuales están disponibles online o instalados bien en el ordenador personal o en un servidor local, en función de la memoria requerida para el análisis.

Todas estas herramientas rara vez están reflejadas en los programas didácticos de Biología, Bioquímica, Biotecnología, Ciencias Ambientales, Farmacia, Química, etc.. o en Programas de Master o de Doctorado, incluso a nivel Europeo. Por lo tanto, los estudiantes necesitan cursos complementarios que implementen interdisciplinariamente su conocimientos en la materia.

Por ello, el objetivo principal de este curso es dotar a los estudiantes de conocimientos complementarios a sus respectivos estudios universitarios para que sean capaces de analizar los datos derivados de la secuenciación masiva.

El curso consta de un total de 30 horas, distribuidas en seis horas durante cinco días consecutivos. No se requieren conocimientos previos ni de estadística ni de bioinformática y los conocimientos sobre Excel se explicarán sobre la marcha, aunque se aconseja estar familiarizado con Excel. Sin embargo, se recomienda fuertemente que cada estudiante tenga su propio ordenador portátil personal con programas estándar instalados (no se acepta plataforma OpenAccess para el Excel). Los estudiantes tienen que estar altamente motivados e involucrados en entablar “brain storming” durante la duración del curso. Nivel básico de inglés es recomendable aunque las clases se impartirán en español (English also possible).

El curso será online usando la plataforma google meet con videoconferencia. Como esta es la primera vez que se imparte el curso online en vez de presencial habrá que ajustar muchas cosas, tanto el alumnado como el profesor. Por parte del profesor (Ramiro Vilchez-Vargas) el temario que de siempre se ha impartido se va a seguir impartiendo. La duración del curso está en principio en cinco días, del lunes 25 de Mayo al viernes 29 de Mayo. Si el temario no se pudiera terminar en esos cinco días por razones de conexión o cualquier otra razón, se aumentaran los días a un máximo de 3 días más, terminando el curso como máximo el 3 de Junio. Las tutorías serán por video conferencia cada día antes de la videoconferencia de 14 a 15 h. Por correo electrónico se podrá contactar con el profesor en cualquier momento.

Resumidamente, el primer día se hará una introducción del curso incluyendo la importancia del diseño experimental en el resultado final, se revisaran todos los programas que se utilizarán en los siguientes cuatro días, y se empezará a analizar los datos brutos que se enviarán a los estudiantes con antelación. El segundo día se hará la anotación taxonómica de las secuencias y se agruparán por fila, clase, orden, familia, genero y filotipo. Se harán las rectas de rarefacción, se normalizará la profundidad de secuenciación al mínimo de secuencias y se elaborarán los “heapmaps” de las muestras. Se obtendrán los índices medio ambientales (Richnness, Evenness, Shannon y Pielou índices) y se elaborarán las gráficas correspondientes. El tercer día se hará el agrupamiento (clustering) de muestras y se calcularán los coeficientes de correlación. En paralelo, se realizarán grupos de trabajo (cuatro estudiantes máximo por grupo). Cada grupo analizará un sub-grupo de secuencias y los resultados se expondrán a la clase durante la duración del curso. El cuarto día, se realizarán los cálculos requeridos para el estudio de co-ocurrencias de filotipos y se harán los gráficos correspondientes. El quinto día, cada estudiante presentará una presentación de 15 minutos por video conferencia con los resultados que ha ido obteniendo durante la semana.

En resumen, en el curso se enseñarán a anotar taxonómicamente, hacer la rectas de rarefacción, elaborar dendogramas usando diferentes algoritmos, realizar PCoa, NMDS, PCA y CA, ANOSIM, PERMANOVA, calcular los índices medioambientales, Heatmaps, SIMPER, test de Wilcoxon y Pearson, así como a realizar “Communities Network”.

Competencias de los alumnos:

a) Aprender a elaborar el diseño experimental adecuado para alcanzar el objetivo propuesto.
b) Aprender a encontrar en internet aquellas plataformas y programas informáticos que se usan en la actualidad en el análisis de datos derivados de la secuenciación masiva.
c) Aprender a manejar programas bioinformáticos de análisis de diversidad y actividad microbiana.
d) Aprender a elaborar las gráficas correspondientes a los resultados obtenidos después del análisis de datos.

Metodología:

a) Taller de trabajo. Cada alumno tendrá su propio ordenador, aunque recomendable dos ordenadores, uno para la videoconferencia y otro para hacer los ejercicios.
b) Exposiciones por parte de los alumnos (15 min max).

Evaluación

Se propone un sistema de evaluación en el que se valorará:
Participación activa durante el curso, interviniendo en el desarrollo del mismo.
Al ser el curso online se realizará una evaluación continua valorando la participación de cada uno de los estudiantes.

Cualificación personal o empleos a los que da acceso:
El conocimiento de bioinformática y bioestadística aplicadas a campos de conocimiento relacionados con salud es altamente demandado en la actualidad.

Idiomas utilizados:
Español and English

Lunes, 13 de julio de 2020

15:00-21:00

Instalación de todos los programas que se usarán durante el curso
Cómo saber lo que hay que hacer para escribir un artículo científico?: diseño experimental. Visualización de los datos crudos obtenidos después de la secuenciación de muestras medioambientales
Ramiro Vílchez Vargas
Investigador Contratado Doctor.
Universitäsklinikum Magdeburg, Alemania

Martes, 14 de julio de 2020

15:00-21:00

Análisis de resultados I: Anotación taxonómica, Rarefaction curves, normalization and heatmaps
Ramiro Vílchez Vargas

Miércoles, 15 de julio de 2020

15:00-21:00

Análisis de resultados II: Bray-Curtis clustering, PCA, PCoA, nMDS
Ramiro Vílchez Vargas

Jueves, 16 de julio de 2020

15:00-21:00

Análisis de resultados III: Co-occurrence analysis
Ramiro Vílchez Vargas

Viernes, 17 de julio de 2020

15:00-21:00

Examen: Cada grupo expondrá (15 min max) los resultados obtenidos que han ido analizando durante el curso.
Dudas y sugerencias. Mesa redonda
Ramiro Vílchez Vargas

+ Google Calendar + Agregar a iCalendar

Bioinformática de muestras biológicas: BioEstadística univariable y multivariable aplicada a resultados con muestras de secuenciación masiva

¿Qué son las cookies?

Tipos de cookies

Cookies utilizadas en la web

Cómo modificar la configuración de las cookies