Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
1
Genoma mitocondrial completo del chigüiro Hydrochoerus hydrochaeris 1
obtenido a partir de las tecnologías de ensamblaje de nueva generación 2
DISCOVAR de novo y datos Hi-C. 3
4
Juanita Herrera Torres 1*, Santiago Herrera Álvarez1, Andrew J. Crawford 1,2 5
1 Departamento de Ciencias Biológicas, Facultad de Ciencias, Universidad de los Andes, 6
A.A. 4976, Bogotá D.C., Colombia. 7
2 Museo de Historia Natural ANDES, Departamento de Ciencias Biológicas, Facultad de 8
Ciencias, Universidad de los Andes, Bogotá D.C., Colombia. 9
10
* [email protected] 11
12
2
Genoma mitocondrial del chigüiro Hydrochoerus hydrochaeris obtenido a 13
partir de las tecnologías de ensamblaje de nueva generación DISCOVAR 14
de novo y datos Hi-C. 15
16
Resumen 17
El chigüiro (Hydrochoerus hydrochaeris) es el roedor viviente más grande del planeta y es 18
endémico de Suramérica. Este estudio utilizó la tecnología de secuenciación de nueva 19
generación DISCOVAR de novo del Broad Institute y datos Hi-C obtenidos a partir del 20
método bibliotecas ChicagoTM de Dovetail Genomics, para obtener el genoma nuclear y 21
mitocondrial (mt) de este roedor. El contig donde se encontró el genoma mt de H. 22
hydrochaeris tenía una longitud de 17,347 pares de bases (pb) pero hasta el momento solo 23
15,735 pb han sido anotados. El contenido de GC del contig fue de 38.8 %. La estructura, 24
organización y orientación de los genes mt de H. hydrochaeris es similar a la del genoma 25
mt de Cavia porcellus (Cuy) y a la de la mayoría de mito-genomas de mamíferos, los cuales 26
contienen 37 genes: 2 genes de ARN ribosomal (ARNr), 13 genes codificantes para 27
proteínas, 22 genes de ARN de transferencia (ARNt), un origen de replicación de la cadena 28
ligera y una región control (D-Loop). Sin embargo, la longitud del 12S y el D-Loop del 29
genoma de H. hydrochaeris no han sido determinadas del todo. A partir de los trece genes 30
codificantes para proteínas del genoma mt de H. hydrochaeris y doce especies de roedores, 31
se generó un árbol filogenético por inferencia Bayesiana a partir del cual se determinó que 32
el tiempo de divergencia del ancestro común de H. hydrochaeris y C. porcellus es de 19 33
millones de años (Ma). 34
35
Palabras clave: Hydrochoerus hydrochaeris, Rodentia, Caviidae, chigüiro, genoma 36
mitocondrial, ADNmt, análisis estructural, filogenética. 37
3
38
Abstract 39
The capybara (Hydrochoerus hydrochaeris) is the biggest rodent in the world and is 40
endemic of South America. This study used the next-generation sequencing (NGS) 41
technologies DISCOVAR de novo from Broad Institute and Hi-C data obtained with the 42
Chicago LibraryTM method from the Dovetail Genomics, in order to obtain the nuclear and 43
mitochondrial (mt) genomes of this rodent. The contig containing the mt genome of H. 44
hydrochaeris had a length of 17,347 base pairs (bp) and we were able to annotate 15,735 45
pb. The GC content of this fragment was 38.8%. The structure, organization and orientation 46
of the mt genes are very similar to the mt genome of Cavia porcellus (Guinea Pig) and most 47
other mammalian mitogenomes, containing 37 genes: 2 ribosomal RNAs (rRNAs), 13 48
protein-coding genes, 22 transfer RNAs (tRNA), origin of replication of L-strand and 49
control region (D-Loop). However, the length of 12S and D-Loop of the H. hydrochaeris 50
genome have not been completely determined. With the thirteen protein-coding genes of H. 51
hydrochaeris and twelve species of rodent, a phylogenetic tree was generated using 52
Bayesian inference and it was determined that the divergence time of the common ancestor 53
of H. hydrochaeris and C. porcellus was 19 million years ago (My). 54
55
Introducción 56
El chigüiro (Hydrochoerus hydrochaeris) pertenece al orden Rodentia y a la familia 57
Caviidae. Es una especie endémica de Sudamérica que se encuentra distribuida desde los 58
llanos venezolanos hasta la boca del río de la plata en Argentina (Mesa González & López 59
Arévalo, 2014; Moreira et al., 2013). En la actualidad, los chigüiros son los roedores más 60
grandes del mundo, su cuerpo puede alcanzar 1.5 m de largo y 0.70 m de altura a la cruz. El 61
peso de los individuos adultos varia entre 40 y 80 kilogramo (kg), dependiendo de la 62
4
alimentación y la zona que habita, ya que la masa corporal de estos animales se incrementa 63
hacia el sur del continente, siendo los del sur de Brasil y Argentina los que alcanzan un 64
mayor tamaño (Mesa González & López Arévalo, 2014; Sarango V, Ordoñez, Noboa, & 65
Valladares, 2011). Generalmente esta especie habita ecosistemas semi-acuáticos de tierras 66
bajas como sabanas inundables, bosques riparios y esteros (Moreira et al., 2013). Su dieta 67
es estrictamente herbívora y la eficiencia de producción de carne por kg es 2.6 veces mayor 68
que la del ganado vacuno (Giraldo Hernández & Ramírez Perilla, 2001), lo que hace a estos 69
roedores un eslabón clave de la cadena trófica en sus ecosistemas y un recurso económico 70
importante para las poblaciones humanas con las que habita (Aldana Domínguez et al., 71
2007. pág 13-14). 72
A la fecha, la información genética disponible de H. hydrochaeris en el Centro 73
Nacional para la Información Biotecnológica (NCBI) es reducida. A pesar de que H. 74
hydrochaeris es la especie más abundante de mamíferos herbívoros en los ecosistemas de 75
sabanas inundables (Correa Ospina & García Pinzón, 2014), y es considerada una especie 76
con una importancia económica elevada, el conocimiento que se tiene acerca de la 77
estructura y diversidad genética de esta especie es mínimo (Sánchez Isaza & Jiménez 78
Robayo, 2014). Por tal razón, se planteó generar un aporte al entendimiento de la genética 79
de H. hydrochaeris, a partir del uso de nuevas tecnologías de secuenciación para la 80
obtención de su genoma nuclear y mitocondrial (mt). 81
Pero, ¿Por qué el genoma mitocondrial?. La mitocondria es una estructura 82
subcelular presente en todas las células eucariotas, en donde se llevan a cabo varios 83
procesos metabólicos cruciales para el funcionamiento celular (Yoon, Koob, & Yoo, 2010). 84
El principal proceso que se lleva a cabo dentro de este orgánulo es la producción de energía 85
química, también conocida como ATP, el cual es obtenido a partir de la fosforilación 86
5
oxidativa (Bernt, Braband, Schierwater, & Stadler, 2013; Boore, 1999; Taanman, 1999). 87
Otros de los proceso en los cuales está involucrada la mitocondria son la autorregulación de 88
la destrucción celular (apoptosis), la producción de sustancias como el colesterol y el grupo 89
hemo de la hemoglobina, algunas enfermedades metabólicas y el envejecimiento (Boore, 90
1999; Crimi & Rigolio, 2008; Susin et al., 1999; Wang, 2001; Wolstenholme, 1992). La 91
mitocondria de los metazoa contiene su propio material genético (ADNmt), el cual es 92
varios órdenes de magnitud más corto que el genoma nuclear (ADNn) ya que generalmente 93
tiene un tamaño aproximado de 15-20 kilo-bases (kb), tiene un contenido de genes 94
altamente conservado y se hereda únicamente por la línea germinal materna en la mayoría 95
de animales (Boore, 1999; Crimi & Rigolio, 2008; Malka, Lombès, & Rojo, 2006; 96
Taanman, 1999). Además, el ADNmt tiene una tasa de mutación aproximadamente 10 97
veces mayor que la del ADNn (Brown, George, & Wilson, 1979; Crawford, 2003; Correa 98
Ospina & García Pinzón, 2014; Malka et al., 2006) por lo que es ampliamente utilizado en 99
las reconstrucciones filogenéticas, filogeografía y la inferencia de las historias de vida de 100
las poblaciones de las cuales se estudia su ADNmt (Avise et al., 1987; Harrison, 1989; 101
Tomasco & Lessa, 2011). 102
Por medio de la unión de dos tecnologías de nueva generación, la primera del Broad 103
Institute la cual consiste en bibliotecas Ilumina paired end mas su algoritmo de ensamblaje 104
DISCOVAR de novo, y la segunda implementada por la compañía Dovetail Genomics 105
usando su método de bibliotecas ChicagoTM, la cual usa datos Hi-C basados en ligación y 106
secuenciación de segmentos de ADN cercanos en un cromosoma para obtener información 107
sobre distancia física entre fragmentos de ADN previamente secuenciados (Korbel and Lee, 108
2013). Con estos datos, se obtuvo un ensamblaje consenso, producto de ambas tecnologías, 109
que contenía el genoma nuclear y mt de H. hydrochaeris. 110
6
El objetivo principal de este estudio fue evaluar la calidad de estas tecnologías de 111
secuenciación de nueva generación como recurso para la obtención de información del 112
ADNmt; para esto se planteó realizar la caracterización del genoma mt de H. hydrochaeris. 113
Como segundo objetivo, se espera que el genoma mt de H. hydrochaeris brinde 114
información de la variabilidad genética de la especie y pueda ser utilizado como una 115
herramienta a futuro en el planteamiento de procedimientos adecuados para el manejo 116
sostenible y conservación de esta especie insignia de la Orinoquía. 117
118
Materiales y métodos 119
Secuenciación, ensamblaje y calidad del genoma 120
El Broad Institute secuenció el genoma completo de H. hydrochaeris. La muestra 121
para esta secuenciación fue tomada de una hembra del San Diego Zoo, California. El 122
método de ensamblaje utilizado por el Broad Institute llamado DISCOVAR de novo, 123
requiere únicamente como entrada reads de Illumina de un tamaño de 250 pares de bases 124
(pb) provenientes de una biblioteca paired end libre de PCR. Este nuevo método de 125
ensamblaje a partir de pequeñas regiones provee información muy completa y continua, lo 126
que optimiza la calidad de los ensamblajes obtenidos (Computational Research and 127
Development Group, 2013; Jaffe, 2013). 128
Posteriormente, para mejorar el primer ensamblaje obtenido por la tecnología 129
DISCOVAR de novo, se aplicó el método de bibliotecas ChicagoTM de la compañía Dovetail 130
Genomics, el cual utiliza secuencias cortas provenientes de experimentos Hi-C para obtener 131
información de largo alcance. Finalmente los contigs del Broad Institute fueron 132
combinados con los datos Hi-C y ensamblados utilizando el software HiRiseTM pipeline. 133
Este programa utiliza tres entradas: la primera un borrador del genoma en formato FASTA, 134
7
la segunda las secuencias cortas obtenidas de las bibliotecas shotgun en formato FASTQ y 135
la tercera las secuencias de las bibliotecas ChicagoTM en formato FASTQ. El software 136
HiRiseTM pipeline de Dovetail Genomics mejora los ensamblajes debido a que ordena y 137
orienta los contigs en scaffolds pequeños, mapea las bibliotecas ChicagoTM en el 138
ensamblaje de entrada para borrar posibles uniones erróneas en el ensamblaje y llena los 139
huecos que se generan entre contigs, al construir los scaffolds con las secuencias pequeñas 140
obtenidas de la secuenciación por shotgun (Dovetail Genomics, 2015). 141
Como resultado de la unión de estas dos tecnologías (DISCOVAR de novo + 142
bibliotecas ChicagoTM, lo que se ha llamado “DISCO-Dove” ) se obtuvo un ensamblaje 143
final, al que se le analizó la calidad por medio de la herramienta QUAST del Centro de 144
biotecnología algorítmica (CAB) de la Universidad Estatal de San Petersburgo, Rusia 145
(Gurevich, Saveliev, Vyahhi, & Tesler, 2013). 146
147
Búsqueda genoma mitocondrial 148
Una vez se obtuvo el genoma completo del chigüiro, se planteó buscar la presencia 149
del genoma mitocondrial (mt) dentro de este. Lo primero que se hizo para identificar el 150
genoma mt, fue realizar un BLASTn (https://blast.ncbi.nlm.nih.gov/Blast.cgi ) utilizando 151
como entrada 17 secuencias de genes mt de H. hydrochaeris disponibles en GenBank 152
(Tabla 1) y como base de datos el archivo FASTA del genoma completo del chigüiro. 153
Posteriormente, se realizó un segundo BLASTn para identificar el contig donde se 154
encontraba el genoma mt del chigüiro, con el genoma mt de C. porcellus (Cuy; GenBank 155
ID AJ222767.1) como base de datos y las secuencias de los contigs determinados a partir 156
del primer BLASTn como entrada. Finalmente, se realizó una búsqueda de genes mt dentro 157
del contig identificado a partir del segundo BLASTn, esto con el propósito de confirmar 158
8
definitivamente que allí se encontraba el genoma mt. Este tercer BLASTn, se realizó con los 159
37 genes mt anotados de C. porcellus cada uno por separado (2 RNAr, 22 RNAt y 13 genes 160
codificantes para proteínas), las 17 secuencias de genes mt de H. hydrochaeris (Tabla 1) y 161
la secuencia del contig como base de datos. 162
163
Anotación genoma mitocondrial (ADNmt) 164
La identificación de la presencia, posiciones, longitudes y orientación de los genes 165
mt en el genoma de H. hydrochaeris se llevó a cabo con el servidor de anotación de 166
genomas mitocondriales (MITOS). Un pipeline de libre acceso, totalmente automático, 167
especializado en la anotación de novo de genomas mitocondriales de metazoa (Bernt, 168
Donath, et al., 2013) (http://mitos.bioinf.uni-leipzig.de/index.py). La información obtenida a 169
partir de MITOS fue anotada en el software Geneious 8.1.3 (Kearse et al., 2012). Por 170
último, se verificó que los genes mt anotados fueron funcionales y tuvieran una 171
composición similar a la de otros roedores filogenéticamente cercanos, a partir del 172
alineamiento múltiple de los genes mt de H. hydrochaeris, doce especies de roedores y 173
Oryctolagus cuniculus (conejo común, como outgroup; Tabla 2). Los alineamientos de 174
estos genes se hicieron en Geneious 1.8.3 que utiliza como programa de alineamiento 175
MUSCLE (Edgar, 2004). El número de iteraciones utilizadas para estos alineamientos fue 176
de 500 para cada comparación. 177
La posición del origen de replicación de la hebra ligera (hebra-L) en el genoma mt 178
de H. hydrochaeris se determinó por la posición del grupo de cinco ARNt entre el 3’ de 179
NADH2 y el 5’ de COI, donde generalmente se ubica esta región en la gran mayoría de 180
genomas mt de mamíferos (Taanman, 1999). Por otra parte, la región control (D-Loop) se 181
determinó por el alineamiento obtenido a partir de un BLAST entre la secuencia del D-Loop 182
9
de C. porcellus y el contig identificado del segundo BLASTn (ver: Búsqueda genoma 183
mitocondrial). 184
185
Construcción árbol filogenético por inferencia Bayesiana 186
Para determinar el tiempo de divergencia del grupo compuesto por H. hydrochaeris 187
y C. porcellus se construyó un árbol filogenético por inferencia Bayesiana a partir de los 188
alineamientos múltiples de los trece genes codificantes para proteínas (NADH1, NADH2, 189
NADH3, NADH4, NADH4L, NADH5, NADH6, COI, COII, COIII, ATPasa 6, ATPase 8 y 190
CYTB) de H. hydrochaeris, doce especies de roedores y O. cuniculus (conejo común), el 191
cual se escogió como outgroup debido a que pertenece al orden de los lagomorfos y no al 192
orden Rodentia. Posteriormente, se concatenaron los trece alineamientos múltiples en un 193
solo archivo, el cual se utilizó para construir un árbol de máxima verosimilitud por RAxML 194
8.2.9 (Stamatakis, 2014) en el que se utilizó un modelo GTRGamma y 100 iteraciones de 195
bootstrap. 196
El árbol obtenido por máxima verosimilitud se utilizó como soporte para la construcción de 197
un árbol por inferencia Bayesiana (BEAST v1.8.0; Drummond & Rambaut, 2007). Se 198
generó un archivo en BEAUti v1.8.0 en el que se especificaron los nodos de calibración, el 199
primero Ratones: Mus musculus y Rattus rattus, con una edad de 20.9 Ma, el segundo 200
Roedores: C. porcellus, Chinchilla lanigera, Ctenomys leucodon, Ct. sociabilis, H. 201
hydrochaeris, M. musculus, Octodon degus, Proechimys longicaudatus, R. rattus, 202
Spalacopus cyanus, Sphiggutus insidiosus, Trinomys dimidiatus y Tympanoctomys 203
barrerae, con una edad de 73 Ma y el tercero Caviomorpha: C. porcellus, Ch. lanigera, Ct. 204
leucodon, Ct. sociabilis, H. hydrochaeris, O. degus, P. longicaudatus, Sp. cyanus, Sph. 205
insidiosus, Tr. dimidiatus y Ty. barrerae, con una edad de 36 Ma. Los tres taxones fueron 206
10
considerados como monofiléticos y las edades fueron determinadas por fósiles (Hedge, 207
Dudley, & Kumar, 2006; Hedges, Marin, Suleski, Paymer, & Kumar, 2015) 208
(http://www.timetree.org). Se escogió un modelo evolutivo de sustitución: GTR, un modelo 209
de calibración: reloj relajado lognormal, un proceso de especiación con un prior Yule y la 210
distribución escogida para los tres priors en edad de nodo fue uniforme. Las edades para la 211
distribución de Ratones: upper 23.4 y lower 18.3; para Roedores: upper 79 y lower 67 y 212
para Caviomorpha: upper 38 y lower 33. Este análisis se corrió con 100,000,000 213
generaciones y se especificó que recogiera datos cada 1,000 generaciones. El Burnin 214
utilizado en TreeAnnotator v1.8.0 fue 1001 árboles y el límite de probabilidad posterior 0.7. 215
216
Resultados y discusión 217
Secuenciación, ensamblaje y calidad del genoma completo 218
Se obtuvo un ensamblaje final a partir de la unión de los ensamblajes DISCOVAR 219
de novo del Broad Institute y el obtenido con los datos Hi-C de Dovetail Genomics, que 220
midió 2.59 Gb incluyendo los espacios entre contigs dentro de los scaffolds. Este valor se 221
comparó con el de la especie filogenéticamente más cercana con disponibilidad de su 222
genoma nuclear y mitocondrial completos en GenBank que es Cavia porcellus (Cuy), y se 223
observó que los genomas de estas dos especies, tienen tamaños muy similares, debido a que 224
el ensamblaje del genoma completo de C. porcellus provisto por el Broad Institute y 225
reportado en e!Ensembl (http://www.ensembl.org/Cavia_porcellus/Info/Annotation) mide 226
2.72 Gb incluyendo los espacios entre contigs dentro de los scaffolds. Por otra parte, se 227
evaluó la calidad del ensamblaje por medio de la herramienta QUAST (Gurevich et al., 228
2013) y se obtuvo un contig N50 de 12.8 megabases (Mb) y un contenido de Guanina-229
Citocina (GC) de 39.79 %. 230
11
231
Búsqueda del genoma mitocondrial 232
A partir del primer BLASTn, en el que se utilizaron 17 secuencias de genes mt de H. 233
hydrochaeris obtenidas de GenBank (Tabla 1) contra el genoma completo del chigüiro 234
obtenido, se identificaron 20 posibles contigs donde se podría encontrar el genoma mt. De 235
estos 20 contigs se descartaron 11 debido a que tenían un tamaño mayor a 68,000 pb (Tabla 236
3), lo que es 4 veces un genoma mt de un tamaño promedio de 17,000 pb. 237
Con las secuencias de los 9 contigs que quedaron de este primer BLASTn y el 238
genoma mt completo de C. porcellus como base de datos, se hizo un segundo BLASTn en el 239
que se obtuvo un alineamiento de 15,011 pb con un porcentaje de identidad de 81.4 % con 240
el contig identificado como Sceky8L_11183, el cual tenía un tamaño total de 19,929 pb. El 241
tamaño de este alineamiento y de este contig eran cercanos al tamaño esperado para el 242
genoma mt del chigüiro, el cual era aprox. 16,800 pb con base en el tamaño del genoma mt 243
de C. porcellus que es de 16,801 pb. 244
El tercer BLASTn tenía como objetivo confirmar que en el contig Sceky8L_11183 se 245
encontraba el genoma mt, razón por la cual utilizamos las 17 secuencias de los genes mt de 246
chigüiro (Tabla 1) y las 37 secuencias de los genes mt anotados de C. porcellus contra la 247
secuencia del contig. Como resultado se encontraron 14 genes mt: 2 RNAr (12S parcial y 248
16S completo), 8 ARNt completos (los que corresponden a valina, metionina, cisteína 249
complementario, serina complementario, histidina, serina 1, leucina 1, ácido glutámico 250
complementario), 4 genes codificantes (COI parcial, NADH4 completo, NADH5 completo 251
y CYTB completo) y una parte de la región control (498 pb), lo que confirmó que este 252
contig corresponde al genoma mt de H. hydrochaeris. 253
254
12
Anotación y composición del genoma mitocondrial 255
El contig Sceky8L_11183 donde se encontró el genoma mt de H. hydrochaeris mide 256
19,929 pb y es el resultado de la unión de tres contigs más pequeños, esto se evidenció 257
debido a que el contig tiene tres bloques de ácidos nucleicos unidos por dos grupos de 100 258
pares de bases (pb) designados con la letra N. Los bloques miden 2,482 pb, 15,852 pb y 259
1,396 pb. Las 100 pb de N´s son secuencias cortas utilizadas en el ensamblaje para la 260
construcción de contigs grandes a partir de contigs más pequeños. A partir de los resultados 261
obtenidos por MITOS, el BLASTn en el que se utilizaron 17 secuencias parciales de genes 262
mt de H. hydrochaeris, las secuencias de los 37 genes mt de C. porcellus y una búsqueda 263
general en la base de datos NCBI, se dilucidó que el primer contig no hacía parte del 264
genoma mt, por lo que únicamente se trabajó con las 17,347 pb siguientes a este primer 265
contig que fue descartado. Este nuevo contig de 17,347 pb tiene un contenido de GC de 266
38.8%, lo que es muy parecido a la longitud y contenido de GC de mamíferos, 267
específicamente de doce especies de roedores y el conejo común (Tabla 4). 268
La composición y organización del genoma mt de H. hydrochaeris es muy similar a 269
la de la mayoría de mito genomas de mamíferos, 13 genes codificantes para proteínas, 22 270
RNA de transferencia (ARNt), 2 ARN ribosomales (ARNr), una región de origen de 271
replicación de la hebra ligera (hebra-L) y una región control conocida como D-Loop 272
(Figura 1 y Tabla 5). La mayoría de genes están codificados en la cadena pesada, 273
únicamente NADH6 y 8 ARNt son codificados por la cadena ligera. Al comparar el 274
genoma mt de H. hydrochaeris con el genoma mt de C. porcellus (ID AJ222767.1; Figura 275
2), se observó que la estructura general del genoma mt de H. hydrochaeris es similar a la de 276
C .porcellus, pero la longitud del 12S y el D-Loop anotados hasta el momento es más corta 277
(Figura 2a y 2b). 278
13
279
Genes codificantes para proteínas 280
El genoma mt de H. hydrochaeris contiene los trece genes codificantes para 281
proteínas (ARN mensajero, ARNm) que generalmente tiene todos los genomas mt de 282
mamíferos: NADH1, NADH2, NADH3, NADH4, NADH4L, NADH5, NADH6, COI, 283
COII, COIII, ATPasa 6, ATPasa 8 y CYTB (Figura 1, Tabla 5). Los trece genes 284
codificantes para proteínas tienen una longitud, orden y orientación similar a los genes mt 285
de C. porcellus (Figura 2). Diez de estos genes (NADH1, COI, COII, ATPasa 8, ATPasa 6, 286
COIII, NADH4L, NADH4, NADH6 y CYTB) tienen como codón de inicio ATG, los genes 287
NADH2 y NADH5 su codón de inicio es ATT y el de NADH3 es ATC (Tabla 5). Estos tres 288
codones (ATG, ATT y ATC) se han reportado como codones de inicio para mamíferos 289
(Wolstenholme, 1992, p. 188). El marco de lectura de NADH1, NADH2, COI, NADH5, y 290
NADH6 terminan con el codón TAG, el de COII, ATPasa 6, ATPasa 8 y NADH4L finaliza 291
con TAA y el de CYTB con AGA (Tabla 5). Estos tres codones (TAG, TAA y AGA) son 292
codones de parada para en el genoma mt de otros mamíferos (Wolstenholme, 1992, p. 188). 293
El codón final de NADH3 es TA y el de COIII y NADH4 es una T (Tabla 5), estos codones 294
de terminación incompletos son comunes en los ARNm de los metazoa, debido a que la 295
poliadenilación de los ARNm mitocondriales se lleva a cabo en su extremo 3’ después de la 296
transcripción, lo que genera el codón de terminación TAA, el cual es un codón de parada 297
(Bibb, Van Etten, Wright, Walberg, & Clayton, 1981, p. 175; Montoya & Attardi, 1986; 298
Wolstenholme, 1992, p. 188). 299
Dentro de los genomas mt de vertebrados se observa que algunos genes codificantes 300
para proteínas se superponen, generalmente esto ocurre en genes que están codificados en 301
cadenas opuestas como es el caso de NADH5 y NADH6, los cuales están superpuestos en 302
14
el genoma mt de H. hydrochaeris por 4 pb. No obstante, existen dos casos reportados en 303
genomas mt de vertebrados que involucran genes que están codificados en la mismas 304
cadena y se superponen, el primero es ATPasa 8 y ATPasa 6 los cuales presentan una 305
superposición de 2 a 46 pb y en el genoma mt de H. hydrochaeris se solapan por 43 pb. Y 306
el segundo caso, es el de NADH4L y NADH4 que generalmente presenta una 307
superposición de 7 pb y en el genoma mt de H. hydrochaeris se solapan por 7 pb 308
(Wolstenholme, 1992, p. 182). 309
A partir del alineamiento múltiple de cada uno de los trece genes codificantes para 310
proteínas, se evidenció que las secuencias de ácidos nucleicos de COII presenta dos gaps en 311
las posiciones 114 y 115 del gen y COIII cuatro gaps en las posiciones 558 a 561 de la 312
secuencia del gen. Posiblemente estos gaps provengan de errores de secuenciación, por lo 313
que se planea realizar un mapeo de todos los reads relacionados con el contig 314
Sceky8L_11183 y de este modo analizar la cobertura de estas posiciones específicamente. 315
316
Genes de ARN de transferencia 317
La información de los ARNt está resumida en la Figura 1 y la Tabla 5. El 318
mitogenoma de H. hydrochaeris codifica veintidós ARNt, de los cuales ocho (Gln, Ala, 319
Asn, Cys, Tyr, Ser2 [TGA], Glu y Pro) son codificados por la cadena ligera, los otros 320
catorce ARNt son codificados por la cadena pesada. La longitud de estos genes está entre 321
58 pb (ARNtSer 1) y 74 pb (ARNtLeu 2). 322
Comúnmente los genomas mt del orden Rodentia y de los vertebrados en general, 323
presentan tres conjuntos de ARNt altamente conservados IQM, WANCY y HSL (Oh et al., 324
2007; Oh et al., 2011). El genoma mt de H. hydrochaeris posee los tres, el primero IQM se 325
encuentra entre el extremo 3’ de NADH1 y el extremo 5’ de NADH2: Isoleucina (I) 68 pb, 326
15
glutamina (Q) 70 pb y metionina (M) 68 pb, el segundo WANCY, esta entre el extremo 3’ 327
de NADH2 y el extremo 5’ de COI: triptófano (W) 69 pb, alanina (A) 68 pb, asparagina 328
(N) 72 pb, cisteína (C) 66 pb y tirosina (Y) 68 pb, y el tercer grupo HSL se encuentra entre 329
el extremo 3’ de NADH4 y el extremo 5’ de NADH5: histidina (H) 68 pb, serina 1 (S1) 58 330
pb y leucina 1 (L1) 68 pb. 331
Dentro de los ARNt del genoma mt de H. hydrochaeris, se identificaron dos formas 332
para los aminoácidos: serina (ARNtSer1 (GCT) y ARNtSer2 (TGA)) y para leucina (ARNtLeu1 (TAG) 333
y ARNtLeu2 (TAA)), estas dos formas de serina y leucina, que tienen diferente anticodón, son 334
comunes en la mayoría de mito genomas de vertebrados (Boore, 1999). 335
Por otra parte, el ARNt que está ubicado después del 3’ del gen NADH3 presente el 336
mismo anticodón que el ARNt que va después del 3’ del gen NADH2, lo que podría sugerir 337
que el genoma mt H. hydrochaeris presenta dos ARNtTrp. Generalmente los genomas mt de 338
vertebrados, y específicamente el genoma mt de C. porcellus, presenta después del 3’ de 339
NADH3 un ARNtArg (Figura 2c). Para verificar la veracidad de esta observación, se 340
realizaron 3 alineamientos múltiples (Figura 3) en el primero se compararon las secuencias 341
de los ARNt que van después de NADH2 del chigüiro y 13 especies de mamíferos (Figura 342
3A), en el segundo se alinearon las secuencias del ARNt que va inmediatamente después de 343
NADH3 (en las mismas 14 especies, Figura 3B) y en el tercero se compararon las 344
secuencias de los dos ARNtTrp de H. hydrochaeris (Figura 3C). A partir de estos 345
alineamientos se determinó que la secuencia del segundo ARNtTrp de H. hydrochaeris es 346
más parecida a las secuencias del ARNtArg que se encuentra en esta misma posición, que al 347
primer ARNtTrp del mismo genoma. Por otra parte se realizaron tres comparaciones de las 348
secuencias de los ARNt por medio de BLAST para verificar el porcentaje de similitud entre 349
las secuencias. La primera comparación se hizo entre el segundo ARNtTrp de H. 350
16
hydrochaeris y la secuencia ARNtArg de C. porcellus, la segunda entre la secuencia de 351
ARNtTrp de H. hydrochaeris y el ARNtTrp de C. porcellus y la tercera entre los dos ARNtTrp 352
de H. hydrochaeris. Como resultados de estas comparaciones se obtuvo un porcentaje de 353
similitud para ARNtTrp de H. hydrochaeris vs. ARNtArg de C. porcellus del 84%, para 354
ARNtTrp de H. hydrochaeris vs. ARNtTrp de C. porcellus del 90% y para ARNtTrp1 de H. 355
hydrochaeris vs ARNtTrp2 de H. hydrochaeris no se encontró una similitud significativa. Al 356
unir los resultados de ambos análisis se confirma que este segundo ARNtTrp en el genoma 357
de H. hydrochaeris proviene del ARNtArg y no del primer ARNtTrp, es decir este segundo 358
ARNtTrp no es una duplicación del primer ARNtTrp. sino más bien es un error de 359
secuenciación o ensamblaje que causó la variación en el tercer ácido nucleico del anticodón 360
del ARNt, lo que origina un cambio en el aminoácido que no es real. Por esta razón es 361
necesario confirmar la secuencia de este ARNt a partir del mapeo de los reads relacionados 362
con el contig Sceky8L_11183 para observar su cobertura y/o amplificar por PCR y 363
secuenciar por método Sanger la región específica donde se encuentra este ARNt. 364
365
Genes de ARN ribosomal (ARNr) 366
El genoma mt de H. hydrochaeris codifica para dos ARNr, 12S y 16S. El gen 12S 367
está ubicado entre los ARNtPhe y el ARNtVal y mide 757 pb, el gen 16S está ubicado entre el 368
ARNtVal y el ARNtleu 2 y mide 1,567 pb (Figura 1 y Tabla 5). La ubicación y orientación de 369
estos dos genes en el genoma mt de H. hydrochaeris, es la misma reportada en la estructura 370
común de los genomas mt de vertebrados (Boore, 1999; Cao & Xia, 2015; D. Oh et al., 371
2011; Wolstenholme, 1992). Al comparar la longitud de estos dos genes en doce especies 372
de roedores y el conejo común (Tabla 6), la longitud del gen 12S está entre 943 pb (C. 373
porcellus) y 962 pb (S. insidiosus) y la longitud del 16S está entre 1,555 (C. lanigera) y 374
17
1,582 pb (M. musculus). Es decir, la longitud del 16S de H. hydrochaeris es muy similar a 375
la de los otros mamíferos comparados. Sin embargo el 12S de H. hydrochaeris (anotado 376
hasta el momento) es más corto; específicamente al comparar la longitud del 12S de C. 377
porcellus que mide 943 pb, el 12s de H. hydrochaeris es 186 pb más corto (Figura 2a). 378
Además antes del 5’ del 12S hay 401 pb que aún no han sido identificadas. Por estas 379
razones, se plantea que la anotación del 12S de H. hydrochaeris aun no está determinada 380
del todo y es necesario estudiar y dilucidar su longitud real. Para este fin, se plantea 381
nuevamente mapear los reads relacionados con el contig Sceky8L_11183 para observar la 382
cobertura del gen y/o amplificar por PCR y secuenciar por método Sanger la región del 12S 383
en H. hydrochaeris. 384
385
Secuencias no codificantes 386
El origen de replicación de la cadena ligera (hebra-L) del genoma mt de H. 387
hydrochaeris mide 35 pb y se encuentra entre los ARNtAsn (N) y ARNtCys (C). La posición 388
de este origen de replicación se encuentra en la mitad del grupo de 5 ARNt conocido como 389
WANCY, lo cual es consistente con lo reportado para genomas mt de vertebrados (Bernt, 390
Braband, et al., 2013; Fernández Silva, Enriquez, & Montoya, 2003; Taanman, 1999). La 391
región control (D-Loop), determinada hasta el momento mide 498 pb y está entre el 392
ARNtPro y el ARNtPhe, lo que coincide con la ubicación del D-Loop en la mayoría de 393
genomas mt de vertebrados (Taanman, 1999, p. 106; Wolstenholme, 1992, p. 201). Sin 394
embargo, se piensa que esta región es más larga debido a que aún no se ha determinado la 395
identidad de 360 pb ubicadas entre ARNtPro y el lugar de inicio del D-Loop anotado, y 498 396
pb ubicados entre el final del D-Loop anotado y el ARNtPhe (Figura 2b); Es necesario 397
resaltar que entre las primeras 360 pb que no han sido identificadas, las últimas 100 pb son 398
18
N´s, las cuales corresponden a las secuencias cortas de unión entre contigs. Si la secuencia 399
de ácido nucleicos entre ARNtPro y el ARNtPhe corresponden en su totalidad al D-Loop, el 400
chigüiro H. hydrochaeris tendría una región control de un tamaño de 1,256 pb, longitud 401
muy similar al D-Loop de C. porcellus el cual mide 1,356 pb. 402
403
Regiones sin identificar dentro del genoma mitocondrial 404
El contig donde se encontró el genoma mt de H. hydrochaeris mide 17,347 pb y 405
hasta el momento se tienen anotadas 15,735 pb, es decir aprox. 1,612 pb aún no han sido 406
identificadas. El primer bloque que no ha sido identificado, son las primeras 401 pb de la 407
secuencia del genoma mt que están antes del 5’ del ARNr 12S. El segundo bloque mide 408
355 pb y está ubicado entre el ARNtPro y el inicio de la anotación del D-Loop, dentro de 409
estas 355 pb, 100 pb de bases son N´s. El tercer bloque esta ubicado entre la cola del D-410
Loop y el ARNtPhe y mide 499 pb. El cuarto bloque y último, mide 331 pb y está ubicado 411
entre el ARNtPhe y el final de la secuencia del genoma. 412
413
Árbol filogenético por inferencia Bayesiana 414
El árbol filogenético por inferencia Bayesiana se construyó con los trece genes 415
codificantes para proteínas de H. hydrochaeris, doce especies de roedores y O. cuniculus 416
(outgroup). A partir de este árbol filogenético, se determinó que el tiempo de divergencia 417
del ancestro común del grupo conformado por H. hydrochaeris y C. porcellus es de 19 Ma 418
y tiene una probabilidad posterior bayesiana de 0.96 (Figura 4). Upham & Patterson (2012) 419
estimaron el tiempo de divergencia para los roedores pertenecientes al infra orden 420
Hystricognathi a partir de la combinación de 4 genes (12S ARNr + GHR + vWF + RAG1) 421
y el tiempo de divergencia que obtuvieron para el grupo donde se encuentra H. 422
19
hydrochaeris y C. porcellus fue de 19 Ma (Mioceno), lo cual apoya lo encontrado en la 423
filogenia construida en este trabajo. 424
425
Conclusiones 426
Las técnicas de secuenciación de nueva generación han hecho que la secuenciación 427
y ensamblaje de un genomas mt completo de alta calidad hoy día sea rápido, fácil y 428
económico. Sin embargo, a partir de la obtención y caracterización del genoma mt del 429
chigüiro H. hydrochaeris, se evaluó la tecnología DISCO-Dove (DISCOVAR de novo + el 430
método Hi-C) como recursos para la obtención de genomas mt y se presentaron tres 431
problemas importantes con las secuencias obtenidas. El primero consiste en que las 432
secuencias de COII y COIII presentan 2 y 4 gaps respectivamente, los cuales generan un 433
desplazamiento del marco de lectura y posiblemente la presencia de codones de parada en 434
la mitad del gen, lo que no permitiría la correcta traducción de la proteína y por 435
consiguiente la muerte del animal. El segundo es el cambio del tercer ácido nucleico del 436
anticodón del ARNt que va después del 3’ de NADH3, este cambio produce que el genoma 437
mt de H. hydrochaeris tenga dos ARNtTrp y ningún ARNtArg, situación que biológicamente 438
parece poco viable, debido a que esto significaría para la especie vivir sin la presencia del 439
aminoácido arginina dentro de las proteínas fabricadas en la mt. El tercero es la falta de 440
claridad en la longitud del ARNr 12S, puesto que aún no se ha determinado la identidad de 441
732 pb ubicadas entre el ARNtPhe y el ARNr 12S. Como solución a estos tres 442
inconvenientes se planea dos soluciones: la primera, consiste en mapear los reads 443
relacionados con el contig Sceky8L_11183 para observar la cobertura del genoma mt de H. 444
hydrochaeris, y la segunda amplificar por PCR y realizar secuenciación por método Sanger 445
de las regiones problema. 446
20
Agradecimientos 447
Quiero agradecerle a Colciencias por su soporte económico para el proyecto Conservation 448
Genomics of the Capybara: building the foundations for its sustainable (Código 1204-659-44334 y 449
número de contrato FP44842-557-2014, a AJC). También me gustaría darle un agradecimiento 450
especial a Camila Martínez por su apoyo incondicional y explicaciones, a Lucas Barrientos por sus 451
consejos, y a Alejandro Reyes por su asesoría en el análisis bioinformática.452
21
Referencias 453
Aldana Domínguez, J., Vieira Muñoz, M. I., Ángel Escobar, D. C., Jarvis, A., Páyan 454
Garrido, E., Lozada Perdomo, P. A., Mulligan, M., Burke, S., Vega Orduz, L. F., 455
Stevenson, P. (2007). Estudios sobre la ecología del chiguiro (Hydrochoerus 456
hydrochaeris) enfocados a su manejo y uso sostenible en Colombia. (J. Aldana 457
Dominguez, M. I. Vieira Muñoz, & D. C. Ángel Escobar, Eds.). Bogotá D.C., 458
Colombia: Instituto de Investigación de Recursos Biológicos Alexander von 459
Humboldt-2007. 460
Bernt, M., Braband, A., Schierwater, B., & Stadler, P. F. (2013). Genetic aspects of 461
mitochondrial genome evolution. Molecular Phylogenetics and Evolution, 69(2), 328–462
338. http://doi.org/10.1016/j.ympev.2012.10.020 463
Bernt, M., Donath, A., Jühling, F., Externbrink, F., Florentz, C., Fritzsch, G., Pütz, J., 464
Middendorf, M., Stadler, P. F. (2013). MITOS: Improved de novo metazoan 465
mitochondrial genome annotation. Molecular Phylogenetics and Evolution, 69(2), 466
313–319. http://doi.org/10.1016/j.ympev.2012.08.023 467
Bibb, M. J., Van Etten, R. a, Wright, C. T., Walberg, M. W., & Clayton, D. A. (1981). 468
Sequence and gene organization of mouse mitochondrial DNA. Cell, 26(October), 469
167–180. http://doi.org/0092-8674(81)90300-7 [pii] 470
Boore, J. L. (1999). Animal mitochondrial genomes. Nucleic Acids Research, 27(9), 1767–471
1780. 472
Brown, W. M., George, M., & Wilson, A. C. (1979). Rapid evolution of animal 473
mitochondrial DNA. Proc. Natl. Acad. Sci. USA, 76(4), 1967–1971. 474
Cao, W., & Xia, Y. (2015). The complete mitochondrial genome of the Cavia aperea. 475
Mitochondrial DNA, 1736(October), 1–2. 476
http://doi.org/10.3109/19401736.2015.1089557 477
Correa Ospina, C., & García Pinzón, L. F. (2014). Caracterización genética de poblaciones 478
silvestres de chigüiro en el Casanare. In H. F. López Arévalo, P. Sánchez Palomino, & 479
O. L. Montenegro (Eds.), El chigüiro Hydrochoerus hydrochaeris en la Orinoquía 480
colombiana: Ecología, manejo sostenible y conservación (pp. 169–184). Bogotá D.C., 481
Colombia: Universidad Nacional de Colombia, Sede Bogotá. Instituto de Ciencias 482
Naturales. 483
22
Crimi, M., & Rigolio, R. (2008). The mitochondrial genome, a growing interest inside an 484
organelle. International Journal of Nanomedicine, 3(1), 51–57. 485
http://doi.org/10.2147/IJN.S2482 486
Dovetail De Novo Genome Assembly Service Procces. (2015). Retrieved November 20, 487
2016, from https://dovetailgenomics.com/wp-content/uploads/2016/01/Dovetail-488
White-Paper.pdf 489
Drummond, A. J., & Rambaut, A. (2007). BEAST: Bayesian evolutionary analysis by 490
sampling trees. BMC Evolutionary Biology, 7(1), 214. http://doi.org/10.1186/1471-491
2148-7-214 492
Edgar, R. C. (2004). MUSCLE: Multiple sequence alignment with high accuracy and high 493
throughput. Nucleic Acids Research, 32(5), 1792–1797. 494
http://doi.org/10.1093/nar/gkh340 495
Fernández Silva, P., Enriquez, J. A., & Montoya, J. (2003). Replication and transcription of 496
mammalian mitochondrial DNA. Experimental Physiology, 41–56. 497
Giraldo Hernández, D., & Ramírez Perilla, J. A. (2001). Guía para el manejo, cria y 498
parovechamiento sostenible del chigüiro, chiguüire o capibara Hydrochoerus 499
hydrochaeris (Linneo). (H. Y. Bernal, Ed.). Bogotá: Convenio Andrés Bello: Serie 500
ciencia y tecnología. 501
Gissi, C., Gullberg, A., & Arnason, U. (1998). The complete mitochondrial DNA sequence 502
of the rabbit, Oryctolagus cuniculus. Genomics, 50(2), 161–169. 503
http://doi.org/10.1006/geno.1998.5282 504
Group, C. R. and D. (2013). DISCOVAR Genome variant discovery through assembly: 505
Manual. Broad Institute of MIT and Harvard. Cambridge, MA. Retrieved from 506
https://docs.google.com/document/d/1U_o-507
Z0dJ0QKiJn86AV2o_YHiFzUtW9c57eh3tYjkINc/edit# 508
Gurevich, A., Saveliev, V., Vyahhi, N., & Tesler, G. (2013). QUAST: Quality assessment 509
tool for genome assemblies. Bioinformatics, 29(8), 1072–1075. 510
http://doi.org/10.1093/bioinformatics/btt086 511
Harrison, R. G. (1989). Animal mitochondrial DNA as a genetic marker in population and 512
evolutionary biology. Trend.Ecol.Evolut., 4(7), 6–11. 513
Hedge, S. B., Dudley, J., & Kumar, S. (2006). TimeTree: A public knowledge-base of 514
23
divergence times among organisms. Bioinformatics, 22(23), 2971–2972. 515
Hedges, S. B., Marin, J., Suleski, M., Paymer, M., & Kumar, S. (2015). Tree of Life 516
Reveals Clock-Like Speciation and Diversification. Molecular Biology and Evolution, 517
32(4), 835–845. http://doi.org/10.1093/molbev/msv037 518
Jaffe, D. (2013). FAQ: Assemble genomes and find variants with DISCOVAR & 519
DISCOVAR de novo. Retrieved November 13, 2016, from 520
https://software.broadinstitute.org/software/discovar/blog/?page_id=23 521
Kearse, M., Moir, R., Wilson, A., Stones-Havas, S., Cheung, M., Sturrock, S., Buxton, S., 522
Cooper, A., Markowitz, S., Duran, C., Thierer, T., Ashton, B., Meintjes, P., 523
Drummond, A. (2012). Geneious Basic: An integrated and extendable desktop 524
software platform for the organization and analysis of sequence data. Bioinformatics, 525
28(12), 1647–1649. http://doi.org/10.1093/bioinformatics/bts199 526
Malka, F., Lombès, A., & Rojo, M. (2006). Organization, dynamics and transmission of 527
mitochondrial DNA: Focus on vertebrate nucleoids. Biochimica et Biophysica Acta - 528
Molecular Cell Research, 1763(5–6), 463–472. 529
http://doi.org/10.1016/j.bbamcr.2006.04.001 530
Mesa González, E., & López Arévalo, H. F. (2014). El chigüiro Hydrochoerus hydrochaeris 531
(Linnaeus, 1766). In O. L. Montenegro, H. F. López-Arévalo, & P. Sánchez-Palomino 532
(Eds.), El chigüiro Hydrochoerus hudrochaeris en la Orinoquía colombiana: 533
Ecologia, manejo sostenible y conservación (pp. 21–41). Bogotá, Colombia: 534
Universidad Nacional de Colombia, Sede Bogotá. Instituto de Ciencias Naturales. 535
Montoya, J., & Attardi, G. (1986). ADN mitocondrial humano. Investigación Y Ciencia, 536
119, 1–20. Retrieved from http://www.investigacionyciencia.es/revistas/investigacion-537
y-ciencia/numero/118/adn-mitocondrial-humano-1854 538
Moreira, J. R., Alvarez, M. R., Tarifa, T., Pacheco, V., Taber, A., Tirira, D. G., Herrera, E. 539
A., Ferraz, K. M., Aldana Domínguez, J., Macdonald, D. W. (2013). Taxonomy, 540
Natural History and Distribution of the Capybara. In J. R. Moreira, A. Ferraz, E. A. 541
Herrera, & D. W. Macdonald (Eds.), Capybara: Biology, use and conservation of an 542
exceptional Neotropical species (pp. 3–37). New York, NY: Springer New York. 543
http://doi.org/10.1007/978-1-4614-4000-0 544
Oh, D.-J., Kim, J.-Y., Lee, J.-A., Yoon, W.-J., Park, S.-Y., & Jung, Y.-H. (2007). Complete 545
24
mitochondrial genome of the rabbitfish Siganus fuscescens (Perciformes, Siganidae). 546
DNA Sequence : The Journal of DNA Sequencing and Mapping, 18(4), 295–301. 547
http://doi.org/doi:10.1080/10425170701248525 548
Oh, D., Kim, T., Chang, M., Han, S., Oh, H., & Kim, S. (2011). The mitochondrial genome 549
of Apodemus peninsulae ( Rodentia , Muridae ), 22(August), 99–101. 550
http://doi.org/10.1186/1471-2164-8-24.Doda 551
Sánchez Isaza, C. A., & Jiménez Robayo, L. M. (2014). Estudio citogenético del chigüiro 552
(Hydrochoerus hydrochaeris) de la orinoquía colombiana. In H. F. López Arévalo, P. 553
Sánchez Palomino, & O. L. Montenegro (Eds.), El chigüiro Hydrochoerus 554
hydrochaeris en la Orinoquía colombiana: Ecología, manejo sostenible y 555
conservación (pp. 147–168). Bogotá D.C.: Universidad Nacional de Colombia, Sede 556
Bogotá. Instituto de Ciencias Naturales. 557
Sarango V, V., Ordoñez, L., Noboa, D., & Valladares, B. (2011). Manual para manejo de 558
capibaras (Hidrochaeris hidrochaeris) (Gavilanes). Quito, Ecuador.: Organización de 559
las Naciones Unidas para la Alimentación y la Agricultura (FAO). 560
Stamatakis, A. (2014). RAxML version 8: A tool for phylogenetic analysis and post-561
analysis of large phylogenies. Bioinformatics, 30(9), 1312–1313. 562
http://doi.org/10.1093/bioinformatics/btu033 563
Susin, S. A., Lorenzo, H. K., Zamzami, N., Marzo, I., Snow, B. E., Brothers, G. M., 564
Mangion, J., Jacotot, E., Castantini, P., Loeffler, M., Larochette N., Goodlett, D., 565
Aebersold, R., Siderovski, D., Penninger, J. M., Kroemer, G. (1999). Molecular 566
characterization of mitochondrial apoptosis-inducing factor. Nature, 397(6718), 441–567
446. Retrieved from http://dx.doi.org/10.1038/17135 568
Taanman, J. W. (1999). The mitochondrial genome: structure, transcription, translation and 569
replication. Biochimica Et Biophysica Acta, 1410(2), 103–123. 570
http://doi.org/10.1016/S0005-2728(98)00161-3 571
Tomasco, I. H., & Lessa, E. P. (2011). The evolution of mitochondrial genomes in 572
subterranean caviomorph rodents: Adaptation against a background of purifying 573
selection. Molecular Phylogenetics and Evolution, 61(1), 64–70. 574
http://doi.org/10.1016/j.ympev.2011.06.014 575
Upham, N. S., & Patterson, B. D. (2012). Diversification and biogeography of the 576
25
Neotropical caviomorph lineage Octodontoidea (Rodentia: Hystricognathi). Molecular 577
Phylogenetics and Evolution, 63(2), 417–429. 578
http://doi.org/10.1016/j.ympev.2012.01.020 579
Voloch, C. M., Vilela, J. F., Loss-Oliveira, L., & Schrago, C. G. (2013). Phylogeny and 580
chronology of the major lineages of New World hystricognath rodents: insights on the 581
biogeography of the Eocene/Oligocene arrival of mammals in South America. BMC 582
Research Notes, 6, 160. http://doi.org/10.1186/1756-0500-6-160 583
Wang, X. (2001). The expanding role of mitochondria in apoptosis. Gene Dev, 15(214), 584
2922–33. 585
Wolstenholme, D. R. (1992). Animal Mitochondrial DNA : Structure and Evolution. 586
Department of Biology, University of Utah, Salt Lake City, Utah 841 12. 587
Yoon, Y. G., Koob, M. D., & Yoo, Y. H. (2010). Re-engineering the mitochondrial 588
genomes in mammalian cells. Anatomy & Cell Biology, 43(2), 97–109. 589
http://doi.org/10.5115/acb.2010.43.2.97 590
591
Anexos 592
26
593Figura 1. Representación en forma circular de la anotación del genoma mt de H. hydrochaeris. La 594
anotación de este genoma se realizó a partir del servidor web MITOS, alineamientos múltiples de 595
todos los genes y BLASTn. La imagen se generó en Geneious version 8.1.3. Este genoma mt mide 596
17,347 pb y contiene 37 genes: 2 genes de ARN ribosomal (bloques color amarillo), 13 genes 597
codificantes para proteínas (boques color naranja) y 22 genes de ARN de transferencia (triángulos 598
pequeños color café), una región reguladora conocida como D-Loop (bloque color verde) y el 599
origen de replicación de la cadena ligera (triangulo color azul claro). Las líneas azules ubicadas 600
entre CYTB, D-Loop y 12S indican las regiones que aún no han sido determinadas. 601
602
27
(I) Representación lineal del genoma mt de C. porcellus 603
604
605
(II) Representación lineal del genoma mt de H. hydrochaeris 606
607
608 609Figura 2. Comparación entre el genoma mt de H. hydrochaeris (I) y el genoma mt de C. 610
porcellus (II) tomado de GenBank (ID: AJ222767.1). Debido a que C. porcellus es el 611
roedor filogenéticamente más cercano al chigüiro con genoma mt completo disponible en 612
GenBank, su genoma fue tomado como referencia para la anotación de nuestro genoma mt. 613
El genoma mt de H. hydrochaeris mide 17,347 pares de bases (pb) y presenta diferencias 614
con respecto al genoma mt de C. porcellus que mide 16,801 pb. [a] El gen 12S anotado de 615
H. hydrochaeris mide 757 pb y el de C. porcellus 942 pb. [b] El D-Loop anotado de H. 616
hydrochaeris mide 498 pb y el de C. porcellus 1,356 pb. [c] El genoma mt de H. 617
hydrochaeris tiene un segundo ARNtTrp en donde C. porcellus presenta un ARNtArg, esto 618
se debe al cambio del tercer ácido nucleico del anticódon de H. hydrochaeris (ARNtTrp: 619
UCA; ARNtArg: UCG). 620
621
28
A. 622
623
B. 624
625
C. 626
627
Figura 3. Alineamientos múltiples de las secuencias de ARNtTrp y ARNtArg de H. 628
hydrochaeris, doce especies de roedores y O. cuniculus (conejo común, outgroup). Las 629
especies utilizadas se encuentran especificadas con su respectivo número de acceso a 630
GenBank en la Tabla 2 de este mismo documento. Estas imágenes fueron generadas a partir 631
de Geneious 1.8.3 (A) Alineamiento múltiple de las secuencias del ARNtTrp ubicado 632
después del 3’ final del gen NADH2. (B) Alineamiento múltiple de las secuencias del 633
ARNtArg ubicado después del 3’ final del gen NADH3 que en el caso de H. hydrochaeris es 634
un segundo ARNtTrp . (C) Alineamiento múltiple de las dos secuencias de los dos ARNtTrp 635
que presenta H. hydrochaeris, la primera secuencia corresponde al ARNtTrp que está 636
29
ubicado después del 3’ del gen NADH2 y la segunda secuencia corresponde al ARNtTrp que 637
se encuentra después del 3’ del gen NADH3, que en C. porcellus es un ARNtArg. 638
639
640
Figura 4. Árbol filogenético por inferencia Bayesiana para los trece genes codificantes 641
para proteínas (ARNm) del genoma mt de H. hydrochaeris, doce especies de roedores y el 642
conejo común (Outgroup). Se utilizó un modelo de sustitución GTR y un reloj relajado log-643
normal. Las barras de error de cada nodo representan los intervalos de densidad posterior 644
del 95%. Los tres nodos rojos designados con las letras: [a] roedores, [b] ratones y [c] 645
caviomorpha, indican los prior de calibración por fósiles utilizados en la construcción del 646
árbol. La datación de los fósiles utilizada en esta filogenia se obtuvo de la base de datos 647
TimeTree.org (Hedge et al., 2006; Hedges et al., 2015). 648
30
649
Tabla 1. Secuencias de genes mitocondriales de Hydrochoerus hydrochaeris disponibles en 650
GenBank. Con estas 17 secuencias se realizó la primera búsqueda del genoma mitocondrial 651
dentro de todo el genoma de H. hydrochaeris. 652
653Secuencias de Hydrochoerus
hydrochaeris No. Acceso GenBank
Cytochrome B (cytb) gene, complete cds; mitochondrial GU136721.1
Cytochrome B (cytb) gene, partial cds; mitochondrial FJ430787.1
12S ribosomal RNA gene, partial sequence, and tRNA-Val gene, complete sequence
U61081.1
Cytochrome oxidase subunit I (COI) gene, partial cds; mitochondrial KF771219.1
Mitochondrial isovaleryl-CoA dehydrogenase (Ivd) gene, intron 8 KF129554.1
Mitochondrial serine-pyruvate aminotransferase (Agxt) gene, intron 10
KF129531.1
16S ribosomal RNA gene, complete sequence AF069533.1
12S ribosomal RNA, mitochondrial gene U12454.1
12S ribosomal RNA gene, partial sequence AF433925.1
12S ribosomal RNA gene, partial sequence AF433924.1
12S ribosomal RNA gene, partial sequence; and tRNA-Val gene, complete sequence
AY012122.1
16S ribosomal RNA gene, partial sequence AY011154.1
12S ribosomal RNA gene, partial sequence U02573.1
Haplotype H14 D-loop, partial sequence GU456376.1
Haplotype 1 D-loop, partial sequence EU149767.1
Haplotype 7 D-loop, partial sequence EU149773.1 Haplotype H1 D-loop, partial sequence GU456363.1
654
31
Tabla 2. Número de acceso de GenBank y artículos de referencia de donde se obtuvieron 655
secuencias de los genomas mitocondriales completos de doce especies de roedores y de O. 656
cuniculus (conejo común, outgroup). Las secuencias de los mito genomas de Mus musculus 657
y de Rattus rattus fueron obtenidas directamente de la base de datos de genomas mt de 658
NCBI. Estos trece genomas mt se utilizaron para varias comparaciones a lo largo de todo 659
este trabajo. 660
661
Familia Especie No. Acceso GenBank Referencia
Caviidae Cavia porcellus AJ222767.1 (Voloch, Vilela, Loss-Oliveira, & Schrago,
2013) Erethizontidae Sphiggurus insidiosus JX312693.1 (Voloch et al., 2013) Chinchillidae Chinchilla lanígera NC_021386.1 (Voloch et al., 2013) Echimyidae Trinomys dimidiatus NC_021388.1 (Voloch et al., 2013)
Echimyidae Proechimys longicaudatus NC_020657.1 (Tomasco & Lessa, 2011; Voloch et al., 2013)
Ctenomyidae Ctenomys leucodon HM544131.1 (Tomasco & Lessa, 2011) Ctenomyidae Ctenomys sociabilis HM544129.1 (Tomasco & Lessa, 2011)
Octodontidae Tympanoctomys barrerae HM544132.1 (Tomasco & Lessa, 2011; Voloch et al., 2013)
Octodontidae Spalacopus cyanus HM544133.1 (Tomasco & Lessa, 2011; Voloch et al., 2013)
Octodontidae Octodon degus HM544134.1 (Tomasco & Lessa, 2011; Voloch et al., 2013)
Leporidae Oryctolagus cuniculus AJ001588.1 (Gissi, Gullberg, &
Arnason, 1998; Voloch et al., 2013)
Mus Mus musculus AY172335.1 - Muridae Rattus rattus EU273707.1 -
662
32
Tabla 3. Nombre y tamaño de los 20 contigs donde posiblemente se encontraba el genoma 663
mt de H. hydrochaeris. Estos contigs fueron identificados a partir del BLAST con las 17 664
secuencias de genes mt de H. hydrochaeris obtenidas de GenBank. Se descartaron las 665
últimas once secuencias identificadas con (*), debido a que presentaban un tamaño mayor a 666
68,000 pb, lo que es 4 veces un genoma mt de un tamaño promedio de 17,000 pb. 667
Finalmente, se identificó a partir de un BLAST entre los 9 contigs restantes y los 37 genes 668
mt de C. porcellus, que el contig Sceky8L_11183 (subrayado y en negrilla) es el contig 669
donde se encontraba el genoma mt de H. hydrochaeris. 670
Nombre contig Tamaño contig flattened_line_390074 392 flattened_line_149032 678 flattened_line_120866 870 flattened_line_111203 969 Sceky8L_4562 1075 Sceky8L_15960 1496 Sceky8L_3776 2503 Sceky8L_9637 4899 Sceky8L_11183 19929 Sceky8L_9572* 1108412 Sceky8L_14060* 2504216 Sceky8L_6887* 2558631 Sceky8L_11206* 3674861 Sceky8L_2250* 6489165 Sceky8L_23578* 9864454 Sceky8L_4456* 10928252 Sceky8L_14839* 25812760 Sceky8L_1889* 32648974 Sceky8L_16349* 42043349 Sceky8L_17929* 42606405 671
33
Tabla 4. Tamaño y contenido de GC de los genomas mitocondriales completos de doce 672
especies de roedores, O. cuniculus y de H. hydrochaeris. El tamaño y contenido de GC de 673
H. hydrochaeris es el del contig completo. 674
Especie Tamaño genoma mitocondrial (pb) % GC
Cavia porcellus 16,801 39.3 Sphiggurus insidiosus 16,571 35.3 Chinchilla lanigera 16,580 40.9 Trinomys dimidiatus 16,580 38.9 Proechimys longicaudatus 16,816 35.8 Ctenomys leucodon 16,216 34.8 Ctenomys sociabilis 17,016 34.2 Tympanoctomys barrerae 16,863 37 Spalacopus cyanus 16,830 37 Octodon degus 16,798 37.4 Oryctolagus cuniculus 17,245 40.2 Mus musculus 16,299 36.7 Rattus rattus 16,305 38.1 Hydrochoerus hydrochaeris 17,347 38.8 675
34
Tabla 5. Anotación del genoma mt de H. hydrochaeris a partir de MITOS y alineamientos 676
múltiples por Geneious+MUSCLE. Nombre del gen, posiciones inicial y final, tamaño 677
total, codón de inicio y parada para los genes codificantes para proteínas (ARNm), 678
anticodón para los ARNt y ubicación del gen en la hebra pesada (+) o ligera (-). El ARNt 679
Triptófano (W)* es el segundo ARNtTrp que presenta el genoma mt de de H. hydrochaeris, 680
en esta posición en la mayoría de mito genomas de mamíferos se codifica un ARNtArg. 681
Gen Empieza Termina Tamaño Codón
de inicio
Codón de parada Anticodón Hebra
ARNt Fenilalanina (F) 16,950 17,016 66 GAA +
ARNr 12S 401 1,158 757 ARNt Valina (V) 1,156 1,224 68 TAC + ARNr 16S 1,223 2,790 1,567 ARNt Leucina 2 (L2) 2,792 2,866 74 TAA + NADH1 2,870 3,829 959 ATG TAG + ARNt Isoleucina (I) 3,828 3,896 68 GAT + ARNt Glutamina (Q) 3,894 3,964 70 TTG - ARNt Metionina (M) 3,967 4,035 68 CAT + NADH2 4,036 5,080 1,044 ATT TAG + ARNt Triptófano (W) 5,079 5,148 69 TCA +
ARNt Alanina (A) 5,151 5,219 68 TGC - ARNt Asparagina (N) 5,221 5,293 72 GTT -
Origen de replicación de cadena ligera 5,295 5,330 35 -
ARNt Cisteína (C ) 5,332 5,398 66 GCA - ARNt Tirosina (Y) 5,401 5,469 68 GTA - COI 5,476 7,017 1,541 ATG TAG + ARNt Serina 2 (S2) 7,021 7,089 68 TGA - ARNt A. aspártico (D) 7,097 7,165 68 GTC +
COII 7,167 7,848 681 ATG TAA + ARNt Lisina (K) 7,849 7,915 66 TTT + ATPasa 8 7,917 8,120 203 ATG TAA + ATPasa 6 8,078 8,758 680 ATG TAA + COIII 8,758 9,537 779 ATG T + ARNt Glicina (G) 9,538 9,606 68 TCC + NADH3 9,607 9,953 346 ATC TA + ARNt Triptófano (W)* 9,954 10,022 68 TCA +
NADH4L 10,024 10,320 296 ATG TAA + NADH4 10,314 11,691 1,377 ATG T +
35
ARNt Histidina (H) 11,692 11,760 68 GTG + ARNt Serina 1 (S1) 11,764 11,822 58 GCT + ARNt Leucina 1 (L1) 11,823 11,891 68 TAG + NADH5 11,892 13,703 1,811 ATT TAG + NADH6 13,700 14,230 530 ATG TAG - ARNt A. glutámico (E ) 14,231 14,299 68 TTC -
CYTB 14,307 15,446 1,139 ATG AGA + ARNt Treonina (T) 15,450 15,516 66 TGT + ARNt Prolina (P) 15,523 15,592 69 TGG - D-Loop 15,953 16,451 498 682
Tabla 6. Longitudes de los genes 12S y 16S de doce especies de roedores, O. cuniculus y 683
de H. hydrochaeris. 684
Especie 12S (pb) 16S (pb)
Cavia porcellus 943 1,565 Sphiggurus insidiosus 962 1,573 Chinchilla lanigera 954 1,555 Trinomys dimidiatus 950 1,567 Proechimys longicaudatus 949 1,558 Ctenomys leucodon 946 1,567 Ctenomys sociabilis 947 1,568 Tympanoctomys barrerae 953 1,573 Spalacopus cyanus 954 1,571 Octodon degus 953 1,570 Oryctolagus cuniculus 957 1,578 Mus musculus 955 1,582 Rattus rattus 956 1,569 Hydrochoerus hydrochaeris 758 1,568
685