Genoma humano

Embed Size (px)

Citation preview

  • Genoma humano 1

    Genoma humanoEl genoma humano es el genoma del Homo sapiens, es decir, la secuencia de ADN contenida en 23 pares decromosomas en el ncleo de cada clula humana diploide.De los 23 pares, 22 son cromosomas autosmicos y un par determinante del sexo (dos cromosomas X en mujeres yuno X y uno Y en varones). El genoma haploide (es decir, con una sola representacin de cada par) tiene unalongitud total aproximada de 3200 millones de pares de bases de ADN (3200 Mb) que contienen unos 20.000-25.000genes (las estimaciones ms recientes apuntan a unos 20.500). De las 3200 Mb unas 2950 Mb corresponden aeucromatina y unas 250 Mb a heterocromatina. El Proyecto Genoma Humano produjo una secuencia de referenciadel genoma humano eucromtico, usado en todo el mundo en las ciencias biomdicas.La secuencia de ADN que conforma el genoma humano contiene codificada la informacin necesaria para laexpresin, altamente coordinada y adaptable al ambiente, del proteoma humano, es decir, del conjunto de lasprotenas del ser humano. Las protenas, y no el ADN, son las principales biomolculas efectoras; poseen funcionesestructurales, enzimticas, metablicas, reguladoras, sealizadoras..., organizndose en enormes redes funcionales deinteracciones. En definitiva, el proteoma fundamenta la particular morfologa y funcionalidad de cada clula.Asimismo, la organizacin estructural y funcional de las distintas clulas conforma cada tejido y cada rgano, y,finalmente, el organismo vivo en su conjunto. As, el genoma humano contiene la informacin bsica necesaria parael desarrollo fsico de un ser humano completo.El genoma humano presenta una densidad de genes muy inferior a la que inicialmente se haba predicho, con slo entorno al 1,5% de su longitud compuesta por exones codificantes de protenas. Un 70% est compuesto por ADNextragnico y un 30 % por secuencias relacionadas con genes. Del total de ADN extragnico, aproximadamente un70% corresponde a repeticiones dispersas, de manera que, ms o menos, la mitad del genoma humano corresponde asecuencias repetitivas de ADN. Por su parte, del total de ADN relacionado con genes se estima que el 95%corresponde a ADN no codificante: pseudogenes, fragmentos de genes, intrones o secuencias UTR, entre otros.En el genoma humano se detectan ms de 280.000 elementos reguladores, aproximadamente un total de 7Mb desecuencia, que se originaron por medio de inserciones de elementos mviles. Estas regiones reguladoras seconservan en elementos no exnicos (CNEEs),fueron nombrados como: SINE, LINE, LTR. Se sabe que al menosentre un 11% y un 20% de estas secuencias reguladoras de genes, que estn conservadas entre especies, fue formadopor elementos mviles.El proyecto genoma humano, que se inici en el ao 1990, tuvo como propsito descifrar el cdigo genticocontenido en los 23 pares de cromosomas, en su totalidad. En 2005 se dio por finalizado este estudio llegando asecuenciarse aproximadamente 28000 genes.La funcin de la gran mayora de las bases del genoma humano es desconocida. El Proyecto ENCODE (acrnimo deENCyclopedia Of DNA Elements) ha trazado regiones de transcripcin, asociacin a factores de transcripcin,estructura de la cromatina y modificacin de las histonas. Estos datos han permitido asignar funciones bioqumicaspara el 80% del genoma, principalmente, fuera de los exones codificantes de protenas. El proyecto ENCODEproporciona nuevos conocimientos sobre la organizacin y la regulacin de los genes y el genoma, y un recursoimportante para el estudio de la biologa humana y las enfermedades.

  • Genoma humano 2

    Contenido en genes y tamao del genoma de varios organismos[1]

    Especie Tamao delgenoma (Mb)

    Nmerode genes

    Candidatus Carsonella ruddii 0,15 182

    Streptococcus pneumoniae 2,2 2300

    Escherichia coli 4,6 4.400

    Saccharomyces cerevisiae 12 5.800

    Caenorhabditis elegans 97 19.000

    Arabidopsis thaliana 125 25.500

    Drosophila melanogaster (mosca) 180 13.700

    Oryza sativa (arroz) 466 45-55.000

    Mus musculus (ratn) 2500 29.000

    Homo sapiens (ser humano) 2900 27.000

    Componentes

    CromosomasEl genoma humano (como el de cualquier organismo eucariota) est formado por cromosomas, que son largassecuencias continuas de ADN altamente organizadas espacialmente (con ayuda de protenas histnicas y nohistnicas) para adoptar una forma ultracondensada en metafase. Son observables con microscopa pticaconvencional o de fluorescencia mediante tcnicas de citogentica y se ordenan formando un cariotipo.El cariotipo humano normal contiene un total de 23 pares de cromosomas distintos: 22 pares de autosomas ms 1 parde cromosomas sexuales que determinan el sexo del individuo. Los cromosomas 1-22 fueron numerados en ordendecreciente de tamao en base al cariotipo. Sin embargo, posteriormente pudo comprobarse que el cromosoma 22 esen realidad mayor que el 21.

  • Genoma humano 3

    Representacin grfica del cariotipo humano normal.(Imagen 1).

    Las clulas somticas de un organismo poseen en suncleo un total de 46 cromosomas (23 pares): unadotacin de 22 autosomas procedentes de cadaprogenitor y un par de cromosomas sexuales, uncromosoma X de la madre y un X o un Y del padre.(Ver imagen 1). Los gametos -vulos yespermatozoides- poseen una dotacin haploide de 23cromosomas.

    Cromosoma Genes Nmero de pares de bases Pares de bases secuenciados[2]

    1 4.220 247.199.719 224.999.719

    2 1.491 242.751.149 237.712.649

    3 1.550 199.446.827 194.704.827

    4 446 191.263.063 187.297.063

    5 609 180.837.866 177.702.766

    6 2.281 170.896.993 167.273.993

    7 2.135 158.821.424 154.952.424

    8 1.106 146.274.826 142.612.826

    9 1.920 140.442.298 120.312.298

    10 1.793 135.374.737 131.624.737

    11 379 134.452.384 131.130.853

    12 1.430 132.289.534 130.303.534

    13 924 114.127.980 95.559.980

    14 1.347 106.360.585 88.290.585

    15 921 100.338.915 81.341.915

    16 909 88.822.254 78.884.754

    17 1.672 78.654.742 77.800.220

    18 519 76.117.153 74.656.155

    19 1.555 63.806.651 55.785.651

    20 1.008 62.435.965 59.505.254

    21 578 46.944.323 34.171.998

    22 1.092 49.528.953 34.893.953

  • Genoma humano 4

    X (cromosoma sexual) 1.846 154.913.754 151.058.754

    Y (cromosoma sexual) 454 57.741.652 25.121.652

    Total 32.185 3.079.843.747 2.857.698.560

    ADN intragnico

    Genes

    Un gen es la unidad humana bsica de la herencia, y porta la informacin gentica necesaria para la sntesis de unaprotena (genes codificantes) o de un ARN no codificante (genes de ARN). Est formado por una secuenciapromotora, que regula su expresin, y una secuencia que se transcribe, compuesta a su vez por: secuencias UTR(regiones flanqueantes no traducidas), necesarias para la traduccin y la estabilidad del ARNm, exones (codificantes)e intrones, que son secuencias de ADN no traducidas situadas entre dos exones que sern eliminadas en elprocesamiento del ARNm (ayuste).

    Este diagrama esquemtico muestra un gen en relacin a su estructurafsica (doble hlice de ADN) y a un cromosoma (derecha). Los intronesson regiones frecuentemente encontradas en los genes de eucariotas, que

    se transcriben, pero son eliminadas en el procesamiento del ARN (ayuste)para producir un ARNm formado slo por exones, encargados de traduciruna protena. Este diagrama es en exceso simplificado ya que muestra ungen compuesto por unos 40 pares de bases cuando en realidad su tamao

    medio es de 20.000-30.000 pares de bases).

    Actualmente se estima que el genoma humanocontiene entre 20.000 y 25.000 genes codificantesde protenas, estimacin muy inferior a laspredicciones iniciales que hablaban de unos100.000 genes o ms. Esto implica que el genomahumano tiene menos del doble de genes queorganismos eucariotas mucho ms simples, comola mosca de la fruta o el nematodo Caenorhabditiselegans. Sin embargo, las clulas humanasrecurren ampliamente al splicing (ayuste)alternativo para producir varias protenas distintasa partir de un mismo gen, como consecuencia de locual el proteoma humano es ms amplio que el deotros organismos mucho ms simples. En laprctica, el genoma tan slo porta la informacinnecesaria para una expresin perfectamentecoordinada y regulada del conjunto de protenasque conforman el proteoma, siendo ste elencargado de ejecutar la mayor parte de lasfunciones celulares.

    Con base en los resultados iniciales arrojados porel proyecto ENCODE (acrnimo de ENCyclopedia Of DNA Elements), algunos autores han propuesto redefinir elconcepto actual de gen. Las observaciones ms recientes hacen difcilmente sostenible la visin tradicional de ungen, como una secuencia formada por las regiones UTRs, los exones y los intrones. Estudios detallados han halladoun nmero de secuencias de inicio de transcripcin por gen muy superior a las estimaciones iniciales, y algunas deestas secuencias se sitan en regiones muy alejadas de la traducida, por lo que los UTR 5' pueden abarcar secuenciaslargas dificultando la delimitacin del gen. Por otro lado, un mismo transcrito puede dar lugar a ARN madurostotalmente diferentes (ausencia total de solapamiento), debido a una gran utilizacin del splicing alternativo. De estemodo, un mismo transcrito primario puede dar lugar a protenas de secuencia y funcionalidad muy dispar. Enconsecuencia, algunos autores han propuesto una nueva definicin de gen,:[3][4] la unin de secuencias genmicas

    que codifican un conjunto coherente de productos funcionales, potencialmente solapantes. De este modo, se identifican como genes los genes ARN y los conjuntos de secuencias traducidas parcialmente solapantes (se

  • Genoma humano 5

    excluyen, as, las secuencias UTR y los intrones, que pasan a ser considerados como "regiones asociadas a genes",junto con los promotores). De acuerdo con esta definicin, un mismo transcrito primario que da lugar a dostranscritos secundarios (y dos protenas) no solapantes debe considerarse en realidad dos genes diferentes,independientemente de que estos presenten un solapamiento total o parcial de sus transcritos primarios.Las nuevas evidencias aportadas por ENCODE, segn las cuales las regiones UTR no son fcilmente delimitables yse extienden largas distancias, obligaran a reidentificar nuevamente los genes que en realidad componen el genomahumano. De acuerdo con la definicin tradicional (actualmente vigente), sera necesario identificar como un mismogen a todos aquellos que muestren un solapamiento parcial (incluyendo las regiones UTR y los intrones), con lo quea la luz de las nuevas observaciones, los genes incluiran mltiples protenas de secuencia y funcionalidad muydiversa. Colateralmente se reducira el nmero de genes que componen el genoma humano. La definicin propuesta,en cambio, se fundamenta en el producto funcional del gen, por lo que se mantiene una relacin ms coherente entreun gen y una funcin biolgica. Como consecuencia, con la adopcin de esta nueva definicin, el nmero de genesdel genoma humano aumentar significativamente.

    Genes de ARN

    Adems de los genes codificantes de protenas, el genoma humano contiene varios miles de genes ARN, cuyatranscripcin reproduce ARN de transferencia (ARNt), ARN ribosmico (ARNr), microARN (miARN), u otrosgenes ARN no codificantes. Los ARN ribosmico y de transferencia son esenciales en la constitucin de losribosomas y en la traduccin de las protenas. Por su parte, los microARN tienen gran importancia en la regulacinde la expresin gnica, estimndose que hasta un 20-30% de los genes del genoma humano puede estar regulado porel mecanismo de interferencia por miARN. Hasta el momento se han identificado ms de 300 genes de miARN y seestima que pueden existir unos 500-

    Distribucin de genes

    A continuacin se muestran algunos valores promedio del genoma humano. Cabe advertir, sin embargo, que laenorme heterogeneidad que presentan estas variables hace poco representativos a los valores promedio, aunquetienen valor orientativo.La densidad media de genes es de 1 gen cada 100 kb, con un tamao medio de 20-30 kb, y un nmero de exonespromedio de 7-8 por cada gen, con un tamao medio de 150 nucletidos. El tamao medio de un ARNm es de1,8-2,2 kb, incluyendo las regiones UTR (regiones no traducidas flanqueantes), siendo la longitud media de la regincodificante de 1,4 kb.

    Isocoros. Frecuencia y riqueza en G+C y genes, en el genoma humano.

    El genoma humano se caracteriza porpresentar una gran heterogeneidad ensu secuencia. En particular, la riquezaen bases de guanina (G) y citosina (C)frente a las de adenina (A) y timina (T)se distribuye heterogneamente, conregiones muy ricas en G+Cflanqueadas por regiones muy pobres,siendo el contenido medio de G+C del41%, menor al tericamente esperado(50%). Dicha heterogeneidad esta correlacionada con la riqueza en genes, de manera que los genes tienden aconcentrarse en las regiones ms ricas en G+C. Este hecho era conocido ya desde hace aos gracias a la separacinmediante centrifugacin en gradiente de densidad de regiones ricas en G+C (que recibieron el nombre de iscoros H;del ingls High) y regiones ricas en A+T (iscoros L; del ingls Low).

  • Genoma humano 6

    Secuencias reguladoras

    El genoma tiene diversos sistemas de regulacin de la expresin gnica, basados en la regulacin de la unin defactores de transcripcin a las secuencias promotoras, en mecanismos de modificacin epigentica (metilacin delADN o metilacin-acetilacin de histonas) o en el control de la accesibilidad a los promotores determinada por elgrado de condensacin de la cromatina; todos ellos muy interrelacionados. Adems hay otros sistemas de regulacina nivel del procesamiento, estabilidad y traduccin del ARNm, entre otros. Por lo tanto, la expresin gnica estintensamente regulada, lo cual permite desarrollar los mltiples fenotipos que caracterizan los distintos tiposcelulares de un organismo eucariota multicelular, al mismo tiempo que dota a la clula de la plasticidad necesariapara adaptarse a un medio cambiante. No obstante, toda la informacin necesaria para la regulacin de la expresingnica, en funcin del ambiente celular, est codificada en la secuencia de ADN al igual que lo estn los genes.Las secuencias reguladoras son tpicamente secuencias cortas presentes en las proximidades o en el interior(frecuentemente en intrones) de los genes. En la actualidad, el conocimiento sistemtico de estas secuencias y decmo actan en complejas redes de regulacin gnica, sensibles a seales exgenas, es muy escaso y estcomenzando a desarrollarse mediante estudios de genmica comparada, bioinformtica y biologa de sistemas. Laidentificacin de secuencias reguladoras se basa en parte en la bsqueda de regiones no codificantes evolutivamenteconservadas.[5] Por ejemplo, la divergencia evolutiva entre el ratn y el ser humano ocurri hace 70-90 millones deaos. Mediante estudios de genmica comparada, alineando secuencias de ambos genomas pueden identificarseregiones con alto grado de coincidencia, muchas correspondientes a genes y otras a secuencias no codificantes deprotenas pero de gran importancia funcional, dado que han estado sometidas a presin selectiva.

    Elementos ultraconservados

    Reciben este nombre regiones que han mostrado una constancia evolutiva casi total, mayor incluso que lassecuencias codificantes de protenas, mediante estudios de genmica comparada. Estas secuencias generalmente sesolapan con intrones de genes implicados en la regulacin de la transcripcin o en el desarrollo embrionario y conexones de genes relacionados con el procesamiento del ARN. Su funcin es generalmente poco conocida, peroprobablemente de extrema importancia dado su nivel de conservacin evolutiva, tal y como se ha expuesto en elpunto anterior.En la actualidad se han encontrado unos 500 segmentos de un tamao mayor a 200 pares de bases totalmenteconservados (100% de coincidencia) entre los genomas de humano, ratn y rata, y casi totalmente conservados enperro (99%) y pollo (95%).

    Pseudogenes

    En el genoma humano se han encontrado asimismo unos 19.000 pseudogenes, que son versiones completas oparciales de genes que han acumulado diversas mutaciones y que generalmente no se transcriben. Se clasifican enpseudogenes no procesados (~30%) y pseudogenes procesados (~70%) Los pseudogenes no procesados son copias de genes generalmente originadas por duplicacin, que no se

    transcriben por carecer de una secuencia promotora y haber acumulado mltiples mutaciones, algunas de lascuales sin sentido (lo que origina codones de parada prematuros). Se caracterizan por poseer tanto exones comointrones.

    Los pseudogenes procesados, por el contrario, son copias de ARN mensajero retrotranscritas e insertadas en elgenoma. En consecuencia carecen de intrones y de secuencia promotora.

  • Genoma humano 7

    ADN intergnicoLas regiones intergnicas o extragnicas comprenden la mayor parte de la secuencia del genoma humano, y sufuncin es generalmente desconocida. Buena parte de estas regiones est compuesta por elementos repetitivos,clasificables como repeticiones en tndem o repeticiones dispersas, aunque el resto de la secuencia no responde a unpatrn definido y clasificable. Gran parte del ADN intergnico puede ser un artefacto evolutivo sin una funcindeterminada en el genoma actual, por lo que tradicionalmente estas regiones han sido denominadas ADN "basura"(Junk DNA), denominacin que incluye tambin las secuencias intrnicas y pseudogenes. No obstante, estadenominacin no es la ms acertada dado el papel regulador conocido de muchas de estas secuencias. Adems elnotable grado de conservacin evolutiva de algunas de estas secuencias parece indicar que poseen otras funcionesesenciales an desconocidas o poco conocidas. Por lo tanto, algunos prefieren denominarlo "ADN no codificante"(aunque el llamado "ADN basura" incluye tambin transposones codificantes) o "ADN repetitivo". Algunas de estasregiones constituyen en realidad genes precursores para la sntesis de microARN (reguladores de la expresin gnicay del silenciamiento gnico).

    Frecuencia de las diversas regiones intergnicas e intragnicas del cromosoma 22.Adaptado de: Dunham, I., et al., 1999. The DNA sequence of human chromosome

    22, Nature 402(6761):489495.

    Estudios recientes enmarcados en elproyecto ENCODE han obtenido resultadossorprendentes, que exigen la reformulacinde nuestra visin de la organizacin y ladinmica del genoma humano. Segn estosestudios, el 15% de la secuencia del genomahumano se transcribe a ARN maduros, yhasta el 90% se transcribe al menos atranscritos inmaduros en algn tejido: As,una gran parte del genoma humano codificagenes de ARN funcionales. Esto escoherente con la tendencia de la literaturacientfica reciente a asignar una importanciacreciente al ARN en la regulacin gnica.Asimismo, estudios detallados hanidentificado un nmero mucho mayor desecuencias de inicio de transcripcin porgen, algunas muy alejadas de la reginprxima a la traducida. Como consecuencia,actualmente resulta ms complicado definiruna regin del genoma como gnica ointergnica, dado que los genes y lassecuencias relacionadas con los genes seextienden en las regiones habitualmenteconsideradas intergnicas.

    ADN repetido en tndem

    Son repeticiones que se ordenan de manera consecutiva, de modo que secuencias idnticas, o casi, se disponen unasdetrs de otras.

  • Genoma humano 8

    Satlites

    El conjunto de repeticiones en tndem de tipo satlite comprende un total de 250 Mb del genoma humano. Sonsecuencias de entre 5 y varios cientos de nucletidos que se repiten en tndem miles de veces generando regionesrepetidas con tamaos que oscilan entre 100 kb (100.000 nucletidos) hasta varias megabases.Reciben su nombre de las observaciones iniciales de centrifugaciones en gradiente de densidad del ADN genmicofragmentado, que reportaban una banda principal correspondiente a la mayor parte del genoma y tres bandas satlitede menor densidad. Esto se debe a que las secuencias satlite tienen una riqueza en nucletidos A+T superior a lamedia del genoma y en consecuencia son menos densas.Hay principalmente 6 tipos de repeticiones de ADN satlite[]

    1. Satlite 1: secuencia bsica de 42 nucletidos. Situado en los centrmeros de los cromosomas 3 y 4 y el brazocorto de los cromosomas acrocntricos (en posicin distal respecto al cluster codificante de ARNr).

    2. Satlite 2: la secuencia bsica es ATTCCATTCG. Presente en las proximidades de los centrmeros de loscromosomas 2 y 10, y en la constriccin secundaria de 1 y 16.

    3. Satlite 3: la secuencia bsica es ATTCC. Presente en la constriccin secundaria de los cromosomas 9 e Y, y enposicin proximal respecto al cluster de ADNr del brazo corto de los cromosomas acrocntricos.

    4.4. Satlite alfa: secuencia bsica de 171 nucletidos. Forma parte del ADN de los centrmeros cromosmicos.5.5. Satlite beta: secuencia bsica de 68 nucletidos. Aparece en torno al centrmero en los cromosomas

    acrocntricos y en la constriccin secundaria del cromosoma 1.6.6. Satlite gamma: secuencia bsica de 220 nucletidos. Prximo al centrmero de los cromosomas 8 y X.

    Minisatlites

    Estn compuestas por una unidad bsica de secuencia de 6-25 nucletidos que se repite en tndem generandosecuencias de entre 100 y 20.000 pares de bases. Se estima que el genoma humano contiene unos 30.000minisatlites.Diversos estudios han relacionado los minisatlites con procesos de regulacin de la expresin gnica, como elcontrol del nivel de transcripcin, el ayuste (splicing) alternativo o la impronta (imprinting). Asimismo, se hanasociado con puntos de fragilidad cromosmica dado que se sitan prximos a lugares preferentes de roturacromosmica, translocacin gentica y recombinacin meitica. Por ltimo, algunos minisatlites humanos (~10%)son hipermutables, presentando una tasa media de mutacin entre el 0.5% y el 20% en las clulas de la lneagerminal, siendo as las regiones ms inestables del genoma humano conocidas hasta la fecha.En el genoma humano, aproximadamente el 90% de los minisatlites se sitan en los telmeros de los cromosomas.La secuencia bsica de seis nucletidos TTAGGG se repite miles de veces en tndem, generando regiones de 5-20kb que conforman los telmeros.Algunos minisatlites por su gran inestabilidad presentan una notable variabilidad entre individuos distintos. Seconsideran polimorfismos multiallicos, dado que pueden presentarse en un nmero de repeticiones muy variable, yse denominan VNTR (acrnimo de Variable number tandem repeat). Son marcadores muy utilizados en genticaforense, ya que permiten establecer una huella gentica caracterstica de cada individuo, y son identificablesmediante Southern blot e hibridacin.

  • Genoma humano 9

    Microsatlites

    Estn compuestos por secuencias bsicas de 2-4 nucletidos, cuya repeticin en tndem origina frecuentementesecuencias de menos de 150 nucletidos. Algunos ejemplos importantes son el dinucletido CA y el trinucletidoCAG.Los microsatlites son tambin polimorfismos multiallicos, denominados STR (acrnimo de Short TandemRepeats) y pueden identificarse mediante PCR, de modo rpido y sencillo. Se estima que el genoma humanocontiene unos 200.000 microsatlites, que se distribuyen ms o menos homogneamente, al contrario que losminisatlites, lo que los hace ms informativos como marcadores.

    ADN repetido disperso

    Son secuencias de ADN que se repiten de modo disperso por todo el genoma, constituyendo el 45% del genomahumano. Los elementos cuantitativamente ms importantes son los LINEs y SINEs, que se distinguen por el tamaode la unidad repetida.Estas secuencias tienen la potencialidad de autopropagarse al transcribirse a una ARNm intermediario,retrotranscribirse e insertarse en otro punto del genoma. Este fenmeno se produce con una baja frecuencia,estimndose que 1 de cada 100-200 neonatos portan una insercin nueva de un Alu o un L1, que pueden resultarpatognicos por mutagnesis insercional, por desregulacin de la expresin de genes prximos (por los propiospromotores de los SINE y LINE) o por recombinacin ilegtima entre dos copias idnticas de distinta localizacincromosmica (recombinacin intra o intercromosmica), especialmente entre elementos Alu.

    Frecuencias y tipos de repeticiones dispersas en el genoma de varios organismos

    Tipo repeticin Homosapiens

    Drosophilamelanogaster

    Caenorhabditiselegans

    Arabidopsisthaliana

    LINE,SINE 33,4% 0,7% 0,4% 0,5%

    LTR/HERV 8,1% 1,5% 0% 4,8%

    Transposones ADN 2,8% 0,7% 5,3% 5,1%

    Total 44,4% 3,1% 6,5% 10,4%

    SINE

    Acrnimo del ingls Short Interspersed Nuclear Elements (Elementos nucleares dispersos cortos). Son secuenciascortas, generalmente de unos pocos cientos de bases, que aparecen repetidas miles de veces en el genoma humano.Suponen el 13% del genoma humano, un 10% debido exclusivamente a la familia de elementos Alu (caractersticade primates).Los elementos Alu son secuencias de 250-280 nucletidos presentes en 1.500.000 de copias dispersas por todo elgenoma. Estructuralmente son dmeros casi idnticos, excepto que la segunda unidad contiene un inserto de 32nucletidos, siendo mayor que la primera. En cuanto a su secuencia, tienen una considerable riqueza en G+C (56%),por lo que predominan en las bandas R, y ambos monmeros presentan una cola poliA (secuencia de adeninas)vestigio de su origen de ARNm. Adems poseen un promotor de la ARN polimerasa III para transcribirse. Seconsideran retrotransposones no autnomos, ya que dependen para propagarse de la retrotranscripcin de su ARNmpor una retrotranscriptasa presente en el medio.

  • Genoma humano 10

    LINE

    Esquema simplificado del mecanismo de retrotransposicin de un elemento LINEy un SINE. Un elemento LINE es transcrito produciendo un ARNm que sale delncleo celular. En el citoplasma se traduce en sus dos marcos de lectura abiertos,

    que no se superponen, generan ambas protenas (vase el texto), que parasimplificar se han representado como ORF1p y ORF2p. Ambas permiten

    retrotranscribir el ARNm del LINE y de otros retrotransposones no autnomos,como SINEs y pseudogenes procesados. Durante la retrotranscripcin la nueva

    secuencia de ADN se integra en otro punto del genoma.

    Acrnimo del ingls Long InterspersedNuclear Elements (Elementos nuclearesdispersos largos). Constituyen el 20% delgenoma humano, contiene unos100.000-500.000 copias deretrotransposones L1 que es la familia demayor importancia cuantitativa, es unasecuencia de 6 kb repetida unas 800.000veces de modo disperso por todo el genoma,aunque la gran mayora de las copias esincompleta al presentar el extremo 5'truncado por una retrotranscripcinincompleta. As, se estima que hay unas5.000 copias completas de L1, slo 90 de lascuales son activas, estando el resto inhibidaspor metilacin de su promotor.

    Su riqueza en G+C es del 42%, prxima a lamedia del genoma (41%) y se localizanpreferentemente en las bandas G de loscromosomas. Poseen adems un promotorde la ARN polimerasa II.Los elementos LINE completos soncodificantes. En concreto LINE-1 codificados protenas:1. Protena de unin a ARN

    (RNA-binding protein): codificada porel marco de lectura abierto 1 (ORF1, acrnimo del ingls Open reading Frame 1)

    2.2. Enzima con actividad retrotranscriptasa y endonucleasa: codificada por el ORF2. Ambas protenas son necesariaspara la retrotransposicin.

    Estos elementos mviles estn flanqueados por 2 regiones no codificantes, denominados como 5UTR y 3UTR.Por lo tanto, se consideran retrotransopsones autnomos, ya que codifican las protenas que necesitan parapropagarse. La ARN polimerasa II presente en el medio transcribe el LINE, y este ARNm se traduce en ambosmarcos de lectura produciendo una retrotranscriptasa que acta sobre el ARNm generando una copia de ADN delLINE, potencialmente capaz de insertarse en el genoma. Asimismo estas protenas pueden ser utilizadas porpseudogenes procesados o elementos SINE para su propagacin.La transcripcin se inicia en un promotor interno del extremo 5UTR. La endonucleasa de L1 genera una mella enuna nica cadena del ADN genmico, en una secuencia consenso 5TTTTT/A3.Diversos estudios han mostrado que las secuencias LINE pueden tener importancia en la regulacin de la expresingnica, habindose comprobado que los genes prximos a LINE presentan un nivel de expresin inferior. Esto esespecialmente relevante porque aproximadamente el 80% de los genes del genoma humano contiene algn elementoL1 en sus intrones.Se ha visto que la insercin aleatoria de L1 activos en el genoma humano ha dado lugar a enfermedades genticas, yaque interfiere en la expresin normal. Tambin se observa una predileccin de L1 por regiones ricas en AT.

  • Genoma humano 11

    HERV

    Acrnimo de Human endogenous retrovirus (retrovirus endgenos humanos). Los retrovirus son virus cuyo genomaest compuesto por ARN, capaces de retrotranscribirse e integrar su genoma en el de la clula infectada. As, losHERV son copias parciales del genoma de retrovirus integrados en el genoma humano a lo largo de la evolucin delos vertebrados, vestigios de antiguas infecciones retrovirales que afectaron a clulas de la lnea germinal. Algunasestimaciones establecen que hay unas 98.000[6] secuencias HERV, mientras que otras afirman que son ms de400.000. En cualquier caso, se acepta que en torno al 5-8% del genoma humano est constituido por genomasantiguamente virales. El tamao de un genoma retroviral completo es de en torno a 6-11 kb, pero la mayora de losHERV son copias incompletas.A lo largo de la evolucin estas secuencias sin inters para el genoma hospedador han ido acumulando mutacionessin sentido y deleciones que los han inactivado. Aunque la mayora de las HERV tienen millones de aos deantigedad, al menos una familia de retrovirus se integr durante la divergencia evolutiva de humanos y chimpancs,la familia HERV-K(HML2), que supone en torno al 1% de los HERV.

    Transposones de ADN

    Bajo la denominacin de transposones a veces se incluyen los retrotransposones, tales como los pseudogenesprocesados, los SINEs y los LINEs. En tal caso se habla de transposones de clase I para hacer referencia a losretrotransposones, y de clase II para referirse a transposones de ADN, a los que se dedica el presente apartado.Los transposones de ADN completos poseen la potencialidad de autopropagarse sin un intermediario de ARNmseguido de retrotranscripcin. Un transposn contiene el gen de una enzima transposasa, flanqueado por repeticionesinvertidas. Su mecanismo de transposicin se basa en cortar y pegar, moviendo su secuencia a otra localizacindistinta del genoma. Los distintos tipos de transposasas actan de modo diferente, habiendo algunas capaces deunirse a cualquier parte del genoma mientras que otras se unen a secuencias diana especficas. La transposasacodificada por el propio transposn lo extrae realizando dos cortes flanqueantes en la hebra de ADN, generandoextremos cohesivos, y lo inserta en la secuencia diana en otro punto del genoma. Una ADN polimerasa rellena loshuecos generados por los extremos cohesivos y una ADN ligasa restablece los enlaces fosfodister, recuperando lacontinuidad de la secuencia de ADN. Esto conlleva una duplicacin de la secuencia diana en torno al transposn, ensu nueva localizacin.Se estima que el genoma humano contiene unas 300.000 copias de elementos repetidos dispersos originados portransposones de ADN, constituyendo un 3% del genoma. Hay mltiples familias, de las que cabe destacar por suimportancia patognica por la generacin de reordenaciones cromosmicas los elementos mariner, as como lasfamilias MER1 y MER2.

    VariabilidadSi bien dos seres humanos del mismo sexo comparten un porcentaje elevadsimo (en torno al 99,9%) de su secuenciade ADN, lo que nos permite trabajar con una nica secuencia de referencia, pequeas variaciones genmicasfundamentan buena parte de la variabilidad fenotpica interindividual. Una variacin en el genoma, por sustitucin,delecin o insercin, se denomina polimorfismo o alelo gentico. No todo polimorfismo gentico provoca unaalteracin en la secuencia de una protena o de su nivel de expresin, es decir, muchos son silenciosos y carecen deexpresin fenotpica.

  • Genoma humano 12

    SNPsLa principal fuente de variabilidad en los genomas de dos seres humanos procede de las variaciones en un slonucletido, conocidas como SNPs (Single nucleotide polimorphisms), en las cuales se han centrado la mayor partede los estudios. Dada su importancia, en la actualidad existe un proyecto internacional (International HapMapProject) para catalogar a gran escala los SNPs del genoma humano. En este contexto, la denominacin de SNPfrecuentemente se restringe a aquellos polimorfismos de un slo nucletido en los que el alelo menos frecuenteaparece en al menos el 1% de la poblacin.Los SNP son marcadores tetrallicos, dado que en teora en una posicin puede haber cuatro nucletidos distintos,cada uno de los cuales identificara un alelo; sin embargo, en la prctica suelen presentar slo dos alelos en lapoblacin. Se estima que la frecuencia de SNPs en el genoma humano es de un SNP cada 500-100 pares de bases, delos que una parte relevante son polimorfismos codificantes, que causan la sustitucin de un aminocido por otro enuna protena.Gracias a su abundancia y a que presentan una distribucin aproximadamente uniforme en el genoma, han tenidogran utilidad como marcadores para los mapas de ligamiento, herramienta fundamental del Proyecto GenomaHumano. Adems son fcilmente detectables a gran escala mediante el empleo de chips de ADN (comnmenteconocidos como microarrays).

    Variacin estructuralEste tipo de variaciones se refiere a duplicaciones, inversiones, inserciones o variantes en el nmero de copias desegmentos grandes del genoma (por lo general de 1000 nuclotidos o ms). Estas variantes implican a una granproporcin del genoma, por lo que se piensa que son, al menos, tan importantes como los SNPs.Variacin estructural es el trmino general para abarcar un grupo de alteraciones genmicas que implican segmentosde ADN mayores de 1Kb. La variacin estructural puede ser cuantitativa (variante en nmero de copia, quecomprende: deleciones, inserciones y duplicaciones), posicional (translocaciones) y orientacional (inversiones).A pesar de que este campo de estudio es relativamente nuevo (los primeros estudios a gran escala se publicaron enlos aos 2004 y 2005), ha tenido un gran auge, hasta el punto de que se ha creado un nuevo proyecto para estudiareste tipo de variantes en los mismos individuos en los que se bas el Proyecto HapMap.Aunque an quedan dudas acerca de las causas de este tipo de variantes, cada vez existe ms evidencia a favor deque es un fenmeno recurrente que todava continua moldeando y creando nuevas variantes del genoma.Este tipo de variaciones han potenciado la idea de que el genoma humano no es una entidad esttica, sino que seencuentra en constante cambio y evolucin.

    Enfermedades genticasLa alteracin de la secuencia de ADN que constituye el genoma humano puede causar la expresin anormal de uno oms genes, originando un fenotipo patolgico. Las enfermedades genticas pueden estar causadas por mutacin de lasecuencia de ADN, con afectacin de la secuencia codificante (produciendo protenas incorrectas) o de secuenciasreguladoras (alterando el nivel de expresin de un gen), o por alteraciones cromosmicas, numricas o estructurales.La alteracin del genoma de las clulas germinales de un individuo se transmite frecuentemente a su descendencia.Actualmente el nmero de enfermedades genticas conocidas es aproximadamente de 4.000, siendo la ms comn lafibrosis qustica.El estudio de las enfermedades genticas frecuentemente se ha englobado dentro de la gentica de poblaciones. Losresultados del Proyecto Genoma Humano son de gran importancia para la identificacin de nuevas enfermedadesgenticas y para el desarrollo de nuevos y mejores sistemas de diagnstico gentico, as como para la investigacinen nuevos tratamientos, incluida la terapia gnica.

  • Genoma humano 13

    MutacionesLas mutaciones gnicas pueden ser: Sustituciones (cambios de un nucletido por otro): Las sustituciones se denominan transiciones si suponen un

    cambio entre bases del mismo tipo qumico, o transversiones si son un cambio purina (A, G)pirimidina (C, T) opirimidinapurina.

    Deleciones o inserciones: son respectivamente la eliminacin o adicin de una determinada secuencia denucletidos, de longitud variable. Las grandes deleciones pueden afectar incluso a varios genes, hasta el punto deser apreciables a nivel cromosmico con tcnicas de citogentica. Inserciones o deleciones de unas pocas pares debases en una secuencia codificante pueden provocar desplazamiento del marco de lectura (frameshift), de modoque la secuencia de nucletidos del ARNm se lee de manera incorrecta.

    Las mutaciones gnica pueden afectar a: ADN codificante: Si el cambio en un nucletido provoca en cambio de un aminocido de la protena la mutacin

    se denomina no sinnima. En caso contrario se denominan sinnimas o silenciosas (posible porque el cdigogentico es degenerado). Las mutaciones no sinnimas asimismo se clasifican en mutaciones con cambio desentido (missense) si provocan el cambio de un aminocido por otro, mutaciones sin sentido (non-sense) sicambian un codn codificante por un codn de parada (TAA, TAG, TGA) o con ganancia de sentido si sucede ala inversa.

    ADN no codificante: Pueden afectar a secuencias reguladoras, promotoras o implicadas en el ayuste (splicing).Estas ltimas pueden causar un errneo procesamiento del ARNm, con consecuencias diversas en la expresin dela protena codificada por ese gen.

    Trastornos monognicos

    Son enfermedades genticas causadas por mutacin en un slo gen, que presentan una herencia de tipo mendeliano,fcilmente predecible. En la tabla se resumen los principales patrones de herencia que pueden mostrar, suscaractersticas y algunos ejemplos.

    Patrnhereditario

    Descripcin Ejemplos

    Autosmicodominante

    Enfermedades que se manifiestan en individuos heterocigticos. Es suficiente con una mutacin enuna de las dos copias (recurdese que cada individuo posee un par de cada cromosoma) de un gen paraque se manifieste la enfermedad. Los individuos enfermos generalmente tienen uno de sus dosprogenitores enfermos. La probabilidad de tener descendencia afectada es del 50% dado que cadaprogenitor aporta uno de los cromosomas de cada par. Frecuentemente corresponden a mutaciones conganancia de funcin (de modo que el alelo mutado no es inactivo sino que posee una nueva funcinque provoca el desarrollo de la enfermedad) o por prdida de funcin del alelo mutado con efecto dedosis gnica tambin conocido como haploinsuficiencia. Frecuentemente son enfermedades con bajapenetrancia, es decir, slo una parte de los individuos que portan la mutacin desarrollan laenfermedad.

    Enfermedad de Huntington,Neurofibromatosis 1,Sndrome de Marfan,Cncer colorrectalhereditario no polipsico

    Autosmicorecesivo

    La enfermedad slo se manifiesta en individuos homocigticos recesivos, es decir, aquellos en los queambas copias de un gen estn mutadas. Son mutaciones que causan prdida de funcin, de modo quela causa de la enfermedad es la ausencia de la accin de un gen. La mutacin slo en una de las doscopias es compensada por la existencia de la otra (cuando una sola copia no es suficiente se originahaploinsuficiencia, con herencia autosmica dominante). Habitualmente un individuo enfermo tieneambos progenitores sanos pero portadores de la mutacin (genotipo heterocigtico: Aa). En tal caso un25% de la descendencia estar afectada.

    Fibrosis qustica, Anemiafalciforme, Enfermedad deTay-Sachs, Atrofiamuscular espinal

  • Genoma humano 14

    Dominanteligado al X

    Las enfermedades dominantes ligadas al cromosoma X estn causadas por mutaciones en dichocromosoma, y presentan un patrn hereditario especial. Slo unas pocas enfermedades hereditariaspresentan este patrn. Las mujeres tienen mayor prevalencia de la enfermedad que los hombres, dadoque reciben un cromosoma X de su madre y otro de su padre, cualquiera de los cuales puede portar lamutacin. Los varones en cambio siempre reciben el cromosoma Y de su padre. As, un varnenfermo (xY) tendr todos sus hijos varones sanos (XY) y todas las hijas enfermas (Xx), mientras queuna mujer enferma (Xx) tendr un 50% de su descendencia enferma, independientemente del sexo.Algunas de estas enfermedades son letales en varones (xY), de modo que slo existen mujeresenfermas (y varones con Sndrome de Klinefelter, XxY).

    Hipofosfatemia, Sndromede Aicardi

    Recesivoligado al X

    Las enfermedades recesivas ligadas al X tambin estn causadas por mutaciones en el cromosoma X.Los varones estn ms frecuentemente afectados. Un varn portador siempre ser enfermo (xY) dadoque slo posee un cromosoma X, que est mutado. Su descendencia sern varones sanos (XY) e hijasportadoras (Xx). Una mujer portadora, tendr una descendencia compuesta por un 50% de hijasportadoras y un 50% de varones enfermos.

    Hemofilia A, Distrofiamuscular de Duchenne,Daltonismo, Distrofiamuscular Alopeciaandrognica

    Ligado a Y Son enfermedades causadas por mutacin en el cromosoma Y. En consecuencia, slo puedemanifestarse en varones, cuya descendencia ser del 100% de hijas sanas y el 100% de hijos varonesenfermos. Dadas las funciones del cromosoma Y, frecuentemente estas enfermedades slo causaninfertilidad, que a menudo puede ser superada teraputicamente.

    Infertilidad masculinahereditaria

    Mitocondrial Enfermedades causadas por mutacin en genes del genoma mitocondrial. Dadas la particularidades dedicho genoma, su transmisin es matrilineal (el genoma mitocondrial se transfiere de madres a hijos).La gravedad de una mutacin depende del porcentaje de genomas afectados en la poblacin demitocondrias, fenmeno denominado heteroplasmia (en contraste con heterocigosis), que vara porsegregacin mittica asimtrica.

    Neuropata pticahereditaria de Leber(LHON)

    Trastornos polignicos y multifactoriales

    Otras alteraciones genticas pueden ser mucho ms complejas en su asociacin con un fenotipo patolgico. Son lasenfermedades multifactoriales o polignicas, es decir, aquellas que estn causadas por la combinacin de mltiplesalelos genotpicos y de factores exgenos, tales como el ambiente o el estilo de vida. En consecuencia no presentanun patrn hereditario claro, y la diversidad de factores etiolgicos y de riesgo dificulta la estimacin del riesgo, eldiagnstico y el tratamiento.Algunos ejemplos de enfermedades multifactoriales con etiologa parcialmente gentica son: autismo enfermedad cardiovascular hipertensin diabetes obesidad cncer

    Alteraciones cromosmicasLas alteraciones genticas pueden producirse tambin a escala cromosmica (cromosomopatas), causando severostrastornos que afectan a mltiples genes y que en muchas ocasiones son letales provocando abortos prematuros.Frecuentemente estn provocadas por un error durante la divisin celular, que sin embargo no impide su conclusin.Las alteraciones cromosmicas reflejan una anormalidad en el nmero o en la estructura de los cromosomas, por loque se clasifican en numricas y estructurales. Provocan fenotipos muy diversos, pero frecuentemente presentanunos rasgos comunes: Retraso mental y retraso del desarrollo. Alteraciones faciales y anomalas en cabeza y cuello. Malformaciones congnitas, con afectacin preferente de extremidades, corazn, etc.

  • Genoma humano 15

    Numricas

    Frecuencias de aneuploidas por cada 1000 nacidos vivos.

    Aneuploida Frecuencia(/1000)

    Sndrome

    Trisoma 21 1,5 de Down

    Trisoma 18 0,12 de Edwards

    Trisoma 13 0,07 de Patau

    Monosoma X 0,4 de Turner

    XXY 1,5 de Klinefelter

    XYY 1,5 del XYY

    Es una alteracin del nmero normal de cromosomas de un individuo, que normalmente presenta 23 pares decromosomas (46 en total), siendo cada dotacin cromosmica de un progenitor (diploida). Si la alteracin afecta aun slo par de cromosomas se habla de aneuploida, de manera que puede haber un slo cromosoma (monosoma) oms de dos (trisoma, tetrasoma...). Un ejemplo de gran prevalencia es la trisoma 21, responsable del Sndrome deDown. Si por el contrario la alteracin afecta a todos los cromosomas se habla de euploidas, de manera que en teorael individuo tiene una sola dotacin cromosmica (haploida, 23 cromosomas en total) o ms de dos dotaciones(triploida: 69 cromosomas; tetraploida: 92 cromosomas...). En la prctica las euploidas causan letalidadembronaria (abortos) siendo muy pocos los nacidos vivos, y fallecen muy tempranamente. Las aneuploidas sonmayoritariamente letales, salvo las trisomas de los cromosomas 13, 18, 21, X e Y (XXY, XYY), y la monosoma delcromosoma X. En la tabla se muestran las frecuencias de nacidos vivos con estas alteraciones.

    Estructurales

    Se denominan as las alteraciones en la estructura de los cromosomas, tales como las grandes deleciones oinserciones, reordenaciones del material gentico entre cromosomas... detectables mediante tcnicas de citogentica. Deleciones: eliminacin de una porcin del genoma. Algunos trastornos conocidos son el Sndrome de

    Wolf-Hirschhorn por delecin parcial del brazo corto del cromosoma 4 (4p), y el Sndrome de Jacobsen odelecin 11q terminal.

    Duplicaciones: una regin considerable de un cromosoma se duplica. Un ejemplo es la enfermedad deCharcot-Marie-Tooth tipo 1A, que puede ser causada por duplicacin del gen codificante de la protena mielnicaperifrica 22 (PMP22) en el cromosoma 17.

    Translocaciones: cuando una porcin de un cromosoma se transfiere a otro cromosoma. Hay dos tipos principalesde translocaciones: la translocacin recproca, en la que se intercambian segmentos de dos cromosomas distintos,y la translocacin Robertsoniana, en la que dos cromosomas acrocntricos (13, 14, 15, 21, 22) se fusionan por suscentrmeros (fusin cntrica).

    Inversiones: una parte del genoma se rompe y se reorienta en direccin opuesta antes de reasociarse, con lo quedicha secuencia aparece invertida. Pueden ser paracntricas (si afectan slo a una brazo) o pericntricas (si lasecuencia invertida incluye el centrmero).

    Cromosomas en anillos: una porcin del genoma se rompe y forma un anillo por circularizacin. Esto puedeocurrir con prdida de material o sin prdida de material.

    Isocromosomas: cromosomas simtricos, con sus dos brazo idnticos por delecin de uno de los brazos yduplicacin del otro. El ms habitual es el isocromosoma X, en el que se pierde el brazo corto del cromosoma X,originando fenotipos de Sndrome de Turner.

  • Genoma humano 16

    Los sndromes de inestabilidad cromosmica son un grupo de trastornos caracterizados por una gran inestabilidad delos cromosomas, que sufren con gran frecuencia alteraciones estructurales. Estn asociados con un aumento de lamalignidad de neoplasias.

    EvolucinLos estudios de genmica comparada se basan en comparacin de secuencias genmicas a gran escala, generalmentemediante herramientas bioinformticas. Dichos estudios permiten ahondar en el conocimiento de aspectos evolutivosde escala temporal y espacial muy diversa, desde el estudio de la evolucin de los primeros seres vivos hace miles demillones de aos o las radiaciones filogenticas en mamferos, hasta el estudio de las migraciones de seres humanosen los ltimos 100.000 aos, que explican la actual distribucin de las distintas razas humanas.

    Genmica comparada entre distintas especiesLos estudios de genmica comparada con genomas de mamferos sugieren que aproximadamente el 5% del genomahumano se ha conservado evolutivamente en los ltimos 200 millones de aos; lo cual incluye la gran mayora de losgenes y secuencias reguladoras. Sin embargo, los genes y las secuencias reguladoras actualmente conocidas suponenslo el 2% del genoma, lo que sugiere que la mayor parte de la secuencia genmica con gran importancia funcionales desconocida. Un porcentaje importante de los genes humanos presenta un alto grado de conservacin evolutiva.La similitud entre el genoma humano y el del chimpanc (Pan troglodytes) es del 98,77%. En promedio, unaprotena humana se diferencia de su ortloga de chimpanc en tan slo dos aminocidos, y casi un tercio de los genestiene la misma secuencia. Una diferencia importante entre los dos genomas es el cromosoma 2 humano, que es elproducto de una fusin entre los cromosomas 12 y 13 del chimpanc[7]

    Otra conclusin de la comparacin del genoma de distintos primates es la notable prdida de genes de receptoresolfativos que se ha producido paralelamente al desarrollo de la visin en color (tricrmica) durante la evolucin deprimates.[8]

  • Genoma humano 17

    Genmica comparada entre genomas humanos

    Mapa de las migraciones humanas creado a partir de genmica comparada con losgenomas mitocondriales de individuos actuales. Los nmeros de la leyenda representanmiles de aos antes del presente. La lnea azul rayada delimita el rea cubierta de hielo o

    de tundra durante la ltima glaciacin. Las letras englobadas por crculos indican loshalogrupos de ADN mitocondrial; los halogrupos se usan para definir subpoblaciones

    genticas, que frecuentemente tienen una correlacin geogrfica. Los principaleshalogrupos de ADNmt son: frica: L, L1, L2, L3. Oriente prximo: J, N. Europa

    meridional: J, K. Europa (general): H, V. Europa septentrional: T, U, X. Asia: A, B, C, D,E, F, G (en el dibujo: M est compuesta por C, D, E, y G). Nativos Americanos: A, B, C,

    D y a menudo X. Vase el artculo: Haplogrupos de ADN mitocondrial humano.

    Durante dcadas las nicas evidenciasque permitan profundizar en elconocimiento del origen y la expansindel Homo sapiens han sido los escasoshallazgos arqueolgicos. Sin embargo,en la actualidad, los estudios degenmica comparada a partir degenomas de individuos actuales detodo el mundo, estn aportandoinformacin muy relevante. Sufundamento bsico consiste enidentificar un polimorfismo, unamutacin, que se asume que se originen un individuo de una poblacinancestral, y que ha heredado toda sudescendencia hasta la actualidad.Adems, dado que las mutacionesparecen producirse a un ritmoconstante, puede estimarse laantigedad de una determinadamutacin en base al tamao delhaplotipo en el que se sita, es decir, eltamao de la secuencia conservada queflanquea la mutacin. Estametodologa se ve complicada por el fenmeno de recombinacin entre los pares de cromosomas de un individuo,procedentes de sus dos progenitores. Sin embargo, hay dos regiones en las que no existe dicho inconveniente porquepresentan una herencia uniparental: el genoma mitocondrial (de herencia matrilineal), y el cromosoma Y (deherencia patrilineal).

    En las ltimas dcadas, los estudios de genmica comparada basada en el genoma mitocondrial, y en menor medidaen el cromosoma Y, han reportado conclusiones de gran inters. En diversos estudios se ha trazado la filogenia deestas secuencias, estimndose que todos los seres humanos actuales comparten un antepasado femenino comn quevivi en frica hace unos 150.000 aos. Por su parte, por razones an poco conocidas, la mayor convergencia delADN del cromosoma Y establece que el antepasado masculino comn ms reciente data de hace unos 60.000 aos.Estos individuos han sido bautizados como Eva mitocondrial e Y-cromosoma Adan.

    La mayor diversidad de marcadores genticos y en consecuencia, los haplotipos de menor longitud, se han hallado en frica. Todo el resto de la poblacin mundial presenta slo una pequea parte de estos marcadores, de modo que la composicin genmica del resto de la poblacin humana actual es slo un subconjunto de la que puede apreciarse en frica. Esto induce a afirmar que un pequeo grupo de seres humanos (quiz en torno a un millar) emigr del continente africano hacia las costas de Asia occidental, hace unos 50.000-70.000 aos, segn estudios basados en el genoma mitocondrial. Hace unos 50.000 aos alcanzaron Australia y hace en torno a 40.000-30.000 aos otras subpoblaciones colonizaron Europa occidental y el centro de Asia. Asimismo, se estima que hace 20.000-15.000 aos alcanzaron el continente americano a travs del estrecho de Bering (el nivel del mar era menor durante la ltima glaciacin, o glaciacin de Wrm o Wisconsin), poblando Sudamrica hace unos 15.000-12.000 aos. No obstante, estos datos slo son estimaciones, y la metodologa presenta ciertas limitaciones. En la actualidad, la tendencia es

  • Genoma humano 18

    combinar los estudios de genmica comparada basados en el ADN mitocondrial con anlisis de la secuencia delcromosoma Y.

    Genoma mitocondrialEs el genoma propio de las mitocondrias de clulas eucariotas. La mitocondria es un orgnulo subcelular esencial enel metabolismo aerobio u oxidativo de las clulas eucariotas. Su origen es endosimbionte, es decir, antiguamentefueron organismos procariotas independientes captados por una clula eucariota ancestral, con la que desarrollaronuna relacin simbitica. Las caractersticas de su genoma, por tanto, son muy semejantes a las de un organismoprocariota actual, y su cdigo gentico es ligeramente distinto al considerado universal. Para adaptarse al nichointracelular y aumentar su tasa de replicacin, el genoma mitocondrial se ha ido reduciendo sustancialmente a lolargo de su coevolucin, presentando en la actualidad un tamao de 16.569 pares de bases. As, la gran mayora delas protenas localizadas en las mitocondrias (~1500 en mamferos) estn codificadas por el genoma nuclear (al quehacen referencia todos los apartados anteriores), de modo que muchos de estos genes fueron transferidos de lamitocondria al ncleo celular durante la coevolucin de la clula eucariota. En la mayora de mamferos, slo lahembra transmite al zigoto sus mitocondrias, por lo que presentan, como ya se ha dicho, un patrn hereditariomatrilineal. En general una clula humana media contiene 100-10.000 copias del genoma mitocondrial por cadaclula, a razn de unas 2-10 molculas de ADN por mitocondria.

    Diagrama simplificado del genoma mitocondrial. Pueden apreciarse los 37 genes y lasecuencia origen de replicacin no codificante. En este esquema no se seala la cadena

    ligera y la pesada.

    El genoma mitocondrial posee 37genes: 13 genes codificantes de protenas:

    codifican 13 polipptidos queforman parte de los complejosmultienzimticos de la fosforilacinoxidativa (sistema OXPHOS). Son7 subunidades del Complejo I(NADH deshidrogenasa), unasubunidad del complejo III(citocromo b), 3 subunidades delComplejo IV (citocromo oxidasa) y2 subunidades del Complejo V(ATPsintasa).

    2 genes ARNr, que codifican lasdos subunidades del ARNribosmico de la matrizmitocondrial.

    22 genes ARNt, que codifican los 22 ARN transferentes necesarios para la sntesis proteica en la matrizmitocondrial.

    Al contrario de lo que suceda con el genoma nuclear, donde slo el 1,5% era codificante, en el genoma mitocondrialel 97% corresponde a secuencias codificantes. Es una nica molcula de ADN doble hebra circular. Una de lashemihebras recibe el nombre de cadena pesada o cadena H, y contiene 28 de los 37 genes (2 ARNr, 14 ARNt y 12polipptidos). La hemihebra complementaria (cadena ligera o L) codifica los 9 genes restantes. En ambas cadenas,los genes de los ARNt aparecen distribuidos entre dos genes ARNr o codificantes de protenas, lo cual es de granimportancia para el procesamiento del ARN mitocondrial.

  • Genoma humano 19

    Referencias[1] Watson, JD, Baker TA, Bell SP, Gann A, Levine M, Losick R. (2004). Ch9-10, Molecular Biology of the Gene, 5th ed., Peason Benjamin

    Cummings; CSHL Press.[2] Sequenced percentages are based on fraction of euchromatin portion, as the Human Genome Project goals called for determination of only the

    euchromatic portion of the genome. Telomeres, centromeres, and other heterochromatic regions have been left undetermined, as have a smallnumber of unclonable gaps. See http:/ / www. ncbi. nlm. nih. gov/ genome/ seq/ for more information on the Human Genome Project.

    [3] (http:/ / www. genome. org/ cgi/ content/ abstract/ 17/ 6/ 669) Versin completa accesible gratuitamente.[4] http:/ / www. unav. es/ genetica/ GH/ cap5. html Pgina web con recientes actualizaciones del libro del Dr. Novo. Incluye un video en

    castellano sobre la redefinicin del concepto de gen (http:/ / www. unav. es/ genetica/ GH/ refs5/ encode. avi).[5] Summary (http:/ / www. lbl. gov/ Science-Articles/ Archive/ mouse-dna-model. html)[6] Robert Belshaw, (2004). "Long-term reinfection of the human genome by endogenous retroviruses" (http:/ / www. pubmedcentral. com/

    articlerender. fcgi?artid=387345) Proc Natl Acad Sci U S A. 2004 April 6; 101(14): 48944899[7] "Human chromosome 2 resulted from a fusion of two ancestral chromosomes that remained separate in the chimpanzee lineage"

    "Large-scale sequencing of the chimpanzee genome is now imminent."[8][8] "Our findings suggest that the deterioration of the olfactory repertoire occurred concomitant with the acquisition of full trichromatic color

    vision in primates."

    Enlaces externos

    En espaolAsociaciones, sociedades e institutos

    Asociacin Espaola de Gentica Humana (http:/ / www. aegh. org/ ) Instituto de Gentica Humana (Universidad Javeriana, Fac. Medicina) (http:/ / www. javeriana. edu. co/ Genetica/

    html/ index. html)Artculos El genoma humano, una revolucin decepcionante (http:/ / mqciencia. wordpress. com/ 2011/ 02/ 08/

    genoma-humano-una-revolucion-decepcionante/ )Recursos educativos y artculos divulgativos

    El genoma humano (UNNE) (http:/ / www. unne. edu. ar/ Web/ index. html) Gentica humana (Junta de Andaluca) (http:/ / www. juntadeandalucia. es/ averroes/ concurso2006/ ver/ 26/

    genetica1. html) Seleccin de enlaces en castellano (http:/ / www. xtec. es/ ~imartin6/ genetica/ recursos. htm) La investigacin sobre el genoma humano (http:/ / bioinformatica. uab. es/ base/ base.

    asp?sitio=ensayosgenetica& anar=pgh) El significado biolgico del mensaje gentico escrito en el genoma (http:/ / camineo. info/ news/ 160/ ARTICLE/

    10622/ 2010-08-28. html) INMEGEN: Mapa gentico completo de algunos pueblos nativos mexicanos (http:/ / diversity. inmegen. gob. mx/

    gbrowse/ cgi-bin/ gbrowse/ inmegen_diversity/ )

    En ingls Secuencia del genoma humano. Science 2001;291;5507;1304-51.Texto completo (http:/ / www. sciencemag. org/

    cgi/ content/ full/ 291/ 5507/ 1304) The National Human Genome Research Institute (http:/ / www. genome. gov/ ) National Library of Medicine human genome viewer (http:/ / www. ncbi. nlm. nih. gov/ mapview/ map_search.

    cgi?taxid=9606). (Recomendado). Interfaz de acceso a la secuencia del genoma humano. UCSC Genome Browser (http:/ / genome. ucsc. edu/ ). (Recomendado). Interfaz de acceso a la secuencia del

    genoma humano.

  • Genoma humano 20

    OMIM: Online Mendelian Inheritance in Man (http:/ / www. ncbi. nlm. nih. gov/ entrez/ query. fcgi?db=OMIM).(Recomendado). Base de datos de enfermedades genticas.

    Human Genome Project (http:/ / www. ornl. gov/ sci/ techresources/ Human_Genome/ project/ info. shtml). Sabanc University School of Languages Podcasts What makes us different from chimpanzees? by Andrew Berry

    (http:/ / www. sabanciuniv. edu/ do/ eng/ PodCast/ files/ podcast18. mp3) (MP3 file) The National Office of Public Health Genomics (http:/ / www. cdc. gov/ genomics/ default. htm) The Genographic Project de National Geographic (http:/ / www3. nationalgeographic. com/ genographic/ index.

    html?fs=www3. nationalgeographic. com)

  • Fuentes y contribuyentes del artculo 21

    Fuentes y contribuyentes del artculoGenoma humano Fuente: http://es.wikipedia.org/w/index.php?oldid=75523469 Contribuyentes: Abece, Airunp, Alhen, Alvaro qc, AmanteDeLibros, Amirapuato, Angel GN, Angelmm,Antonorsi, Aipni-Lovrij, Balles2601, Battlizer, Camima, Cookie, Cyloli, DanielithoMoya, Dav7mx, Dcsalva, Diegusjaimes, Dnangelicadotcom, Edmenb, El mago de la Wiki, F.A.A, Fanattiq,Filipo, Filnik, Fmercury1980, Folkvanger, Foundling, Gaijin, Gallowolf, Gdtronik, Gerwoman, Ggenellina, Gzapatawainberg, HUB, Humberto, Jcaraballo, Jkbw, Jorab, Jorge 2701, Jorge c2010,Joseaperez, JuanCRS, Laura Fiorucci, Lauranrg, Leonpolanco, Magduycaro, Manuel Prez Alonso, Matdrodes, Mircalla22, Muro de Aguas, Natrix, Nosce, Oblongo, Pabloallo, Padawan Andhy,Pertile, Petronas, Petruss, Pickkky, Pilar.alameda, Poco a poco, Quijav, Relik27, Retama, Ricardogpn, Rosarinagazo, Ruben Horacio, Rge, Saloca, Samuchepudo94, Segavi, SeoMac, SergioAndres Segovia, Snakefang, SuperBraulio13, Superzerocool, Taty2007, Technopat, Tenan, Tomatejc, Travelour, UPO649 1011 clmilneb, Universalis, Urdangaray, Wkboonec, XanaG, Yaguen,Yesydrodriguez, ngel Luis Alfaro, 308 ediciones annimas

    Fuentes de imagen, Licencias y contribuyentesArchivo:Karyotype.png Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Karyotype.png Licencia: Public Domain Contribuyentes: Courtesy: National Human Genome ResearchInstituteArchivo:De-Gene.png Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:De-Gene.png Licencia: Public Domain Contribuyentes: Gene.png: Courtesy: National Human GenomeResearch Institute derivative work: Garver (talk)Archivo:Iscoros1.JPG Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Iscoros1.JPG Licencia: Public Domain Contribuyentes: NosceArchivo:Frecuencias en el chr22 (Dunham).PNG Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Frecuencias_en_el_chr22_(Dunham).PNG Licencia: Creative CommonsAttribution-ShareAlike 3.0 Unported Contribuyentes: Bestiasonica, NosceArchivo:LINE.PNG Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:LINE.PNG Licencia: Public Domain Contribuyentes: NosceArchivo:Migraciones humanas.png Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Migraciones_humanas.png Licencia: Creative Commons Attribution-Sharealike 3.0Contribuyentes: User:ContinentalisArchivo:Mitochondrial genome (spanish).PNG Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Mitochondrial_genome_(spanish).PNG Licencia: Public Domain Contribuyentes:Bestiasonica, Hystrix, Nosce

    LicenciaCreative Commons Attribution-Share Alike 3.0//creativecommons.org/licenses/by-sa/3.0/

    Genoma humanoComponentes Cromosomas ADN intragnico Genes Pseudogenes

    ADN intergnico ADN repetido en tndem ADN repetido disperso

    Variabilidad SNPs Variacin estructural

    Enfermedades genticas Mutaciones Trastornos monognicos Trastornos polignicos y multifactoriales

    Alteraciones cromosmicas Numricas Estructurales

    Evolucin Genmica comparada entre distintas especies Genmica comparada entre genomas humanos

    Genoma mitocondrial Referencias Enlaces externos En espaol En ingls

    Licencia