Upload
others
View
10
Download
0
Embed Size (px)
Citation preview
Análisis Bioinformático de Datos de Secuenciación Masiva de Siguiente Generación (NGS) Salud
Curso Internacional
Análisis Bioinformático de Datos de Secuenciación Masiva de Siguiente Generación (NGS) Salud
Presentación Este curso teórico práctico busca ofrecer un panorama amplio y detallado de las distintas aplicaciones, herramientas y flujos de análisis bioinformático de datos ómicos derivados de secuenciación masiva de última generación (Next Generation Sequencing). Este tipo de datos biológicos genómicos ha experimentado un marcado crecimiento en la última década, impactando todas las áreas de investigación en salud, genética, biología, ciencias agrícolas y pecuarias, ecología y biotecnología a nivel mundial, sin embargo, la capacidad de análisis y aprovechamiento de estos datos y de las aproximaciones genómicas derivadas siguen siendo una limitante para una mayor apropiación de estas nuevas oportunidades en investigación. El curso pretenderá familiarizar a los participantes con las principales metodologías computacionales para el análisis de datos NGS orientado a las distintas aplicaciones en genómica, metagenómica, trancriptómica o epigenómica con el fin de ofrecerles oportunidades de complementar sus investigaciones por medio de estas nuevas aproximaciones. El curso contará con instructores internacionales y nacionales invitados, todos ellos expertos formados o provenientes de instituciones de muy amplia trayectoria y reconocimiento en el área. Objetivo General Adquirir conocimientos y competencias en el uso de herramientas y flujos de trabajo para el análisis avanzado de datos ómicos de secuenciación de siguiente generación (NGS) y sus aplicaciones investigativas en ciencias biológicas o biomédicas. Objetivos Específicos
• Identificar las múltiples aproximaciones ómicas y aplicaciones derivadas del análisis de datos de secuenciación de alto rendimiento (NGS)
• Conocer y aprender a usar las herramientas y flujos de trabajos para el análisis de datos de secuenciación NGS apropiados para cada tipo de aproximación genómica
• Entender la significancia, ventajas y limitaciones de cada análisis específico en el contexto de flujos de trabajos ómicos más amplios o profundos
Dirigido a. Profesionales del área de ciencias biológicas o ciencias biomédicas, preferiblemente investigadores o estudiantes de posgrado que se encuentren realizando o planeen realizar investigaciones que requieran del análisis bioinformático de datos ómicos derivados de tecnologías de secuenciación de alto rendimiento o siguiente generación (NGS).
Análisis Bioinformático de Datos de Secuenciación Masiva de Siguiente Generación (NGS) Salud
Requisitos mínimos. • Ser profesional graduado* del área de ciencias biológicas, biomédicas o afines y
acreditar estar realizando o próximo a iniciar actividades de investigación en ciencias biológicas o biomédicas
• Buen dominio de inglés (conversación y lectura) • Diligenciar el Cuestionario de aplicación al curso.
* Excepcionalmente se podrán evaluar candidaturas de estudiantes de últimos semestres de pregrado que acrediten su participación en proyectos de investigación afines y justifiquen debidamente la necesidad de su participación.
Metodología Este curso teórico-‐práctico es de modalidad presencial y combinará conferencias, sesiones prácticas reales en computadores y discusiones en torno a las principales aplicaciones del análisis de datos NGS en ciencias ómicas. Las sesiones se impartirán tanto en idioma español como en inglés. Las conferencias darán cuenta de qué preguntas biológicas se pueden abordar y qué tipo de conocimiento biológico puede ser extraído a partir de los distintos datos NGS, presentando posibles vías a seguir para el análisis computacional de los mismos. Las sesiones prácticas (aproximadamente 67% de las horas presenciales) consistirán en ejercicios computacionales sobre datos reales que permitirán a los participantes familiarizarse con cada paso dentro del flujo de trabajo y bajo orientación constante de los instructores. El cupo limitado de participantes busca optimizar el aprovechamiento de las sesiones prácticas así como favorecer la interacción entre participantes y la discusión con los expertos nacionales e internacionales invitados, para lo cual se contará con numerosos espacios informales de discusión. Se entregará certificado de asistencia a los participantes que asistan mínimo al 80% de las sesiones programadas. Contenidos El curso constará de 8 módulos teórico prácticos, en los dos primeros se realizará una introducción al entorno Linux, así como una introducción al programa estadístico R y su módulo Bioconductor, que permitirán familiarizarse con las líneas de comando más usuales y necesarias para los seis módulos restantes.
Análisis Bioinformático de Datos de Secuenciación Masiva de Siguiente Generación (NGS) Salud
Módulo 1 Introducción a secuenciación de última generación -‐ Introducción a Linux
• Generalidades sobre secuenciación de última generación • Introducción a Linux y manejo de archivos – parsing (práctica)
Módulo 2 Introducción a R y a Bioconductor
• Introducción a R y a Bioconductor y su relevancia en análisis de datos ómicos • Introducción a comandos en R y Bioconductor (práctica)
Módulo 3 Manejo de datos NGS: control de calidad y filtrado
• Aspectos generales de los datos tipo NGS: Estructura, formato. • Sometimiento de datos NGS al ENA (EBI). • Manejo de archivos y análisis de control de calidad de datos NGS • Herramientas para filtering o trimming y formatos de salida
Módulo 4 Secuenciación y análisis de genomas
• Secuenciación de genoma empleando secuenciación de última generación: aspectos generales de flujos de trabajo, aplicaciones derivadas y retos.
• Ensamble de genomas • Anotación de genomas • Alineamientos de reads y análisis de polimorfismos a escala genómica • Análisis comparativo de genomas
Módulo 5 Metagenómica
• Introducción a la metagenómica • Flujo de trabajo metagenómica • Análisis de datos metagenómicos • Metagenómica comparativa
Análisis Bioinformático de Datos de Secuenciación Masiva de Siguiente Generación (NGS) Salud
Módulo 6 ChIP-‐Seq analysis (en inglés)
• Introduction to ChIP-‐seq and its relevance for epigenomics • ChIP-‐seq -‐ Sequence alignment • ChIP-‐seq -‐ peak calling and annotation • ChIP-‐seq -‐ motif analysis • ChIP-‐seq -‐ enrichment plots
Módulo 7 RNA-‐Seq analysis (en inglés)
• Introduction to RNA-‐seq • RNA-‐seq -‐ Sequence alignments -‐ Splice junction identification • RNA-‐seq -‐ transcriptome assembly • Differential expression analysis • RNA-‐seq -‐ Functional annotation • Advanced Differential expression analysis
Módulo 8 Redes Biológicas
• Introducción a la biología de Sistemas y a las redes biológicas • Análisis de coexpresión como herramienta para inferir conocimiento biológico • Redes de coexpresión y redes de interacción proteína/proteína: del análisis
topológico a la biología de sistemas Conferencistas Allan Orozco Profesor investigador de la Universidad de Costa Rica y Director de la Red Centroamericana de Bioinformática y Biocomputación. PhD Bionformática, Universidad Autónoma de Madrid (España). Es co-‐fundador de la Sociedad Iberoamericana de Bioinformática (SOIBIO) y del Máster de Bioinformática y Biología de Sistemas de la Universidad de Costa Rica; cuenta con una amplia trayectoria en docencia y consultoría en el área de Biología Computacional, Bioinformática y Nanotecnología.
Análisis Bioinformático de Datos de Secuenciación Masiva de Siguiente Generación (NGS) Salud
Nils Kölling Investigador Laboratorio Europeo de Biología Molecular -‐ Instituto Europeo de Bioinformática, EMBL-‐EBI, Cambridge (Reino Unido). PhD(c) Computational Biology Universidad de Cambridge. Desde el 2011, hace parte del equipo docente del EBI para capacitaciones en Bioinformática con énfasis en análisis NGS y transcriptómica; cuenta con amplia experiencia docente en áreas de biocomputación y programación Python/C/C++ en diferentes instituciones como el Max Planck Institute o la Universidad Jacobs de Bremen. Maria Xenophontos Investigadora Instituto Canbridge Stem Cell y Laboratorio Europeo de Biología Molecular -‐ Instituto Europeo de Bioinformática (EMBL-‐EBI), Cambridge (Reino Unido). Magíster en Bioinformática, Universidad de Edimburgh. PhD(c) Computational Biology Universidad de Cambridge. Desde el 2012, hace parte del equipo docente del EBI para capacitaciones en Bioinformática con énfasis en análisis NGS transcriptómica y epigenómica. Alejandro Caro Quintero Investigador Corpoica, Tibaitatá. PhD Georgia Institute of Technology (EEUU), Postdoc Georgia Tech y Universidad de Texas, Austin (EEUU). Sus intereses investigativos y áreas de experticia se han centrado en torno a preguntas de biología evolutiva y ecología microbiana usando aproximaciones de metagenómica, metatranscriptómica y genómica comparada en modelos biológicos y nichos ecológicos muy diversos. Mauricio Quimbaya Gómez. Profesor Investigador Departamento de Ciencias Naturales y Matemáticas, Facultad de Ingeniería, Pontificia Universidad Javeriana -‐ sede Cali. Biólogo con PhD en Biotecnología Universidad de Ghent-‐ en asocio con el Vlaams Instituut voor Biotechnologie (VIB), Ghent (Bélgica). Sus líneas de investigación hacen uso de aproximaciones de biología de sistemas y genómica comparada para el estudio de redes regulatorias del ciclo celular en diferentes modelos biológicos y su relación con cáncer. Alexander Herrera Castro. Profesor Departamento de Ingeniería de Sistemas, Facultad de Ingeniería de la Pontificia Universidad Javeriana. Magíster en Software libre, Ciencias de la Computación. Universitat Oberta de Catalunya (España). Es el coordinador del centro de alto rendimiento computacional ZINE de la Universidad javeriana. Experto en HPC y Cloud computing.
Análisis Bioinformático de Datos de Secuenciación Masiva de Siguiente Generación (NGS) Salud
Wilson Terán. Profesor Departamento de Biología y director del grupo de Biología de Plantas y Sistemas Productivos, Facultad de Ciencias, Pontificia Universidad Javeriana. Bioquímico y Magíster en Bioquímica, Universidad de Provence (Francia). PhD Bioquímica y Biología Molecular, Universidad de Granada, CSIC (España). Sus intereses investigativos se centran en preguntas relacionadas con aspectos de regulación génica de las respuestas biológicas a distintos tipos de estrés en diferentes modelos de plantas y bacterias, combinando estudios bioquímicos y moleculares con aproximaciones transcriptómicas y de minería de datos. Comité Organizador: Wilson Terán. Pontificia Universidad Javeriana [email protected] Gabriella Rustici. Postgraduate Bioinformatics Training Manager – Department of Genetics Universidad de Cambridge
Apoya: