47
Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC [email protected] http://www.uccor.edu.ar/modelo.php? param=3.8.5.15 Fac. de Ingeniería – UNC - 2010

Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC [email protected] Fac

Embed Size (px)

Citation preview

Page 1: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Tópicos en Bioinformática

Elmer A. Fernández (PhD, Bioing)[email protected]://www.uccor.edu.ar/modelo.php?param=3.8.5.15

Fac. de Ingeniería – UNC - 2010

Page 2: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Pregunta?

Qué es Bioinformática

Bioinformatics is the application of information technology to the field of molecular biology. Bioinformatics entails the creation and advancement of

databases, algorithms, computational and statistical techniques, and theory to solve formal and practical problems arising from the management and

analysis of biological data. …. It is the name given to these mathematical and computing approaches used to glean understanding of biological processes. Common activities in Bioinformatics include mapping and analyzing DNA and protein sequences, aligning different DNA and protein sequences to compare

them and creating and viewing 3-D models of protein structures.

Bioinformatics is that branch of life science,which deals with the study of application of information technology to the field of molecular biology.The primary goal of bioinformatics is to increase our understanding of biological processes. What sets it apart from other approaches, however, is its focus on developing and applying computationally intensive techniques (e.g., data mining, and machine learning algorithms) to achieve this goal. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution.

Page 3: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Qué es para mi?

Biología

Medicina

Agronomia BiologíaMolecular

….

….Informática

Bases de datos

Sistemas de Información

EstadísticaApnredizaje Automático

Tecnología

Modelos

Equipamiento

…..

Bioinformático

Bioingeniero

Page 4: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Un mejor modelo

Biología

Medicina

Agronomia BiologíaMolecular

….

….

Informática

Bases de datos

Sistemas de Información

EstadísticaApnredizaje Automático

Tecnología

Modelos

Equipamiento

…..

Page 5: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Con qué objetivo?

Page 6: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Bioinformático-Bioingeniero

No son antagónicos sino complementarios

Capacidades diferenciadasDeben actuar como nexo entre las

necesidades en el ámbito de la Biología y las tecnologías asistentes.

Page 7: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Porqué surge la bioinformática

Las planillas de MS Excel ya no alcanzan. Globalización de la información y de los recursos. Necesidades de cálculo intensivo Necesidades de modelado intensivo Contrastar por modelos lo observado en la

realidad Tecnologías de alto rendimiento, un nuevo

paradigma ….

Page 8: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Resumiendo…

reporte2mCE Dato

datito

Datum

DataPlanilla excel

Calculo

DATO

Variables

Atributos

Archivocongreso

presentación

Imagen

Perfil

Expresión génica

Datos

Base de datos

Servidor

Laboratorio

Data

ATRIBUTOS

Proteinas

DATOS

DATOS

DATITITO

Dato

Page 9: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Cuál es el rol fundamental del BioIn…loquesea

Instaurar un lenguaje común entre el mundo de la biología y el de la tecnología.

Ejemplos IA-EstadísticaProyecto Bélgica.Diseño stentUS-Latin American Cancer Research

Network

Page 10: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Cómo es el entorno de trabajo

MultidisciplinarBiólogos

Médicos

Bioingenieros

Estadísticos

Físicos

Matemáticos

Técnicos

Informáticos

Etc.

Page 11: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Algunos títulos

LIMSChemometricsBiometricsGenomicsProteomicsTechnologyBDData Mining

Page 12: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

LIMS

Laboratory Information Management Systems Administrar la información Biotecnológica Proveer herramientas de comunicación Proveer herramientas de análisis y búsqueda Conectar los distintos sistemas y equipos. Proveer capacidades de seguimiento Importante para las facilities ¿Capacidades?

Page 13: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Chemometrics

Modelado molecularInteracción de moléculas con el medioModelos molecularesLIMSNIRDesarrollo de Drogas

Page 14: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Biometrics

Diseño de experimentosModelos estadísticos en biologíaInferenciaTécnicas estadísticas para resumen y

visualización de datos.¿Capacidades?

Page 15: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Genomics

Secuenciamiento (Biosidus)Microarreglos de ADN (Biosidus, INTA,

Leloir, UBA) (ETC international, Agilent)OntologíasCurado de bases de datosTextMiningCáncer, etc..¿Capacidades?

Page 16: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Tecnologías asociadas:Microarreglos de ADN

Page 17: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Proteomics

Folding, predicción estructural Secuenciamiento Interacción con el agua Modelado 3D (Homologías) Ontologías Curado de bases de datos Vías Metabólicas M/Z Geles bidimensionales ¿Capacidades?

Page 18: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Tecnologías asociadas:MALDI-TOF

LIMS?

Page 19: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Tecnologías asociadas:Expresión diferencial de proteínas

Page 20: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Tecnologías asociadas:Modelado de moléculas

• Modelado

Page 21: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Bases de Datos

No existen en Argentina bases de datos preparadas para ámbitos de biología

Las bases de datos solo están pensadas con el propósito de almacenar

No hay consenso en Argentina Flexibilidad insuficiente (sharing) Estructuras inadecuadas (Data Mining) Curado ¿Capacidades?

Page 22: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Data Mining

Knowledge Discovery in Databases es el proceso no trivial de identificación de patrones sobre los datos. Estos deberán resultar ser válidos, novedosos, potencialmente útiles y entendibles.

Page 23: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Data Mining

Knowledge Discovery

Estadística

Computación avanzada Tecnologías

de Bases de datos

Reconocimiento de patrones

Visualización

Inteligencia Artificial

Sistemas de adquisición y Monitorización

Page 24: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Y casi al final…Ontologías

Page 25: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

La estrella del momento

Secuenciadores de “próxima” generación

• 454 Roche: Pirosecuenciador (Arg)• De novo sequencing• Metagenomica

• Solexa ILLUMINA

• Solid ABI

Page 26: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Next? Generation Sequencing

Page 27: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Nuestro grupo

Grupo de Minería de Bio-Datos

(BioData Mining)Dr. Elmer Fernández, Bioing. Cristobal Fresno

Universidad Católica de Córdoba

CONICETCampus-Camino Alta Gracia km 7 ½

5000 – Cba.

Page 28: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Con quien trabajamos?

Dra.Mónica Balzarini (Dpto. Biometria-UNC)

Dr. Osvaldo Podhajcer (Terapia Celular y Molecular- Inst. Leloir)

Dra. Andrea Llera (Terapia Celular y Molecular- Inst. Leloir)

Adivisor: Dr. Terence Speed (WHEI-Australia & UC Berkeley-USA)

Page 29: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac
Page 30: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Nuestro grupo en la UCC

http://sites.google.com/site/biologicaldatamininggroup/Home/

Page 31: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Historia en la UCC

• Comienzos en 2004• 2006 post-doc visitante @ islab,

Antwerp, Belgica• 2006-2008 Master en App. Stat.• 2009 candidato Doctorado

Page 32: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Líneas de interés en investigación

• KDD en ciencias biomédicas a través de técnicas estadístico-computacionales

• Aprendizaje Maquinal– Artificial Neural Networks– Support Vector Machines– Clustering

• Estadística– Generalized Linear Mixed Models– Partial Least Squares– Clustering

Page 33: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Líneas de interés en investigación

• Proceso Unificado de Análisis para DM en Bio-ciencias (PUA-DMB)– Administración de datos biológicos

– Desarrollo de técnicas basadas en aprendizaje computacional para Clustering and Classificación

– Desarrollo de estrategias estadísticas para análisis de datos bajo diferentes supuestos distribucionales con efectos aleatorios y estructuras de correlación

– Procesamiento de señales/datos Biomédicos

Page 34: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Historia en la UCC

• Comienzos en 2004• 2006 post-doc visitante @ islab,

Antwerp, Belgica• 2006-2008 Master en App. Stat.• 2009 candidato Doctorado

Page 35: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Líneas de interés en investigación

• KDD en ciencias biomédicas a través de técnicas estadístico-computacionales

• Aprendizaje Maquinal– Artificial Neural Networks– Support Vector Machines– Clustering

• Estadística– Generalized Linear Mixed Models– Partial Least Squares– Clustering

Page 36: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Líneas de interés en investigación

• Proceso Unificado de Análisis para DM en Bio-ciencias (PUA-DMB)– Administración de datos biológicos

– Desarrollo de técnicas basadas en aprendizaje computacional para Clustering and Classificación

– Desarrollo de estrategias estadísticas para análisis de datos bajo diferentes supuestos distribucionales con efectos aleatorios y estructuras de correlación

– Procesamiento de señales/datos Biomédicos

Page 37: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Líneas de interés en investigación

• Proceso Unificado de Análisis para DM en Bio-ciencias (PUA-DMB)– PUA-DMB es un entorno ordenado para el

análisis de estudios biológicos

PUA-DMB

HemodialisisControlCardiovascular

Genómica y Proteómica Funcional ……

Page 38: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

• PUA-DMB en Hemodialisis– Desarrollo de técnicas analíticas para

monitoreo molecular-antropométrico en pacientes en tratamiento:

• Diagnóstico de la eficiencia• Evaluación de biomarcadores• Caracterización de pacientes en pos de

tratamientos sujeto-específico

Líneas de interés en investigación

Page 39: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

• PUA-DMB en Control Cardiovascular– Abordaje estadístico del control

Cardiovascular mediante supuestos no-normales

– Estudios del balance en el sistema nervioso central

– Análisis del ECG para detección de apnea– Desórdenes eléctricos y Mechano-Electrical

Feedback.

Líneas de interés en investigación

Page 40: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

• PUA-DMB en Genómica y Proteómica Funcaional– Métodos estadísticos y de Aprendizaje

maquinal para análisis patrones de genes y proeínas

• DNA Microarray data analysis (INSPECTOR,SOM)– Agriculture, cancer, etc.

• Gel based protein analysis (2D-DIGE technology)

• Modelos estadísticos para análisis de invación celular.

Líneas de interés en investigación

Page 41: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

• Optimización y diagnóstico de clasificadores y regresores no-paramétricos (aprendizaje maquinal)– Selección de características

– Validación, evaluación y selección de modelos

– Aprendizaje Maquinal en contextos estadísticos:

– Comportamiento de técnicas computacionales de reconocimiento de patrones bajo hipótesis distribucionales conocidas.

Líneas de interés en investigación

Page 42: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

El mapa de colaboraciones

J. Lopez del Olmo (PhD)CNIC - Spain

M. Balzarini (PhD)Biometrics Dept. UNC

BDMGUCC

Functional Genomics and Proteomics

A. Llera (PhD)Moll. And Cell therapy Lab.Leloir Inst. - Argentina

Estudios moleculares y funcionales de la transición epitelio mesenquimal y su impacto en el aumento de la agresividad tumoral. PICT-2008

Statistical Models for protein pattern analysis. MinCyt –cba 2008

Somewhere in the world:Terry Speed

Page 43: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

El mapa de colaboraciones

P. Willshaw (PhD)School of Health SciencesSwansea Univ. - UK

R. Valtuille (Phys)Fresenius Medical CareArg.

M. Balzarini (PhD)Biometrics Dept. UNC

BDMGUCC

Hemodialysis

Page 44: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

El mapa de colaboraciones

P. Abry (PhD)Ecole Normal Superieur de Lyon - France

M. Balzarini (PhD)Biometrics Dept. UNC

BDMGUCC

Cardiovascular Control and Signal Processing

Page 45: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Experiencias en empresas/centros de I+D

• GALIX (Holter de ECG)• Fresenius Medical Care• Aeromedical (Stent Coronario)• INTA• INTI• UBA• Ledesma

Page 46: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Hasta la próxima

Make everything as simple as possible, but not simpler (A. Enstain)

Si uno hace lo que todo el mundo hace, obtiene lo que todo el mundo obtiene. (¿?)

El atroz encanto de ser argentinos, M. Aguinis

Page 47: Tópicos en Bioinformática Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar  Fac

Muchas Gracias