SISTEMA MITOCONDRIAL ANIMAL (SISMIT): A COMPUTING SOFTWARE BASED IN TH MOLECULAR ANALYSIS OF MITOCHONDRIAL GENOMES OF VERTEBRATES
C. Scotto l y R. Valdivia 2
RESUMEN
El presente trabajo reporta el diseño de un programa de computación que analiza a niv molecular las secuencias del ONA mitocondrial de 37 animales vertebrados domésticos y s vestres de importancia zoogenética. Palabras clave: ONA mitocondrial, Programa de Computación, RFLP, PCR
ABSTRACT
The present article reports the design 01 a computing program which analizes at the molecul level the sequences 01 mitochondrial ONA (mtDNA) 0137 domestic and wild life vertebrates zoogenetic importance. Key words: mitochondrial ONA (mtDNA), Computer Program, RFLP, PCR.
INTRODUCCiÓN
Los avances tanto en el campo de la biolo gía molecu lar como en la informática han per mitido el desarrollo de una nueva área de la ciencia denominada bioinformálica. En 1979, BROWN el al. predijeron que las moléculas de DNA mitocondrial de los vertebrados (mtDNA) llegarían a ser una de las primeras moléculas de DNA en ser total mente secuenciadas con el tiempo, debido a que son las unidades genómicas eucarióticas
1 Laboratorio de Bioqu imica y Biologia Molecular. Universidad NaCional Fe derico VillarreaL Lima . Pe ni. E-mail:
[email protected] 2 Instituto Nacional de Recursos Naturales. INAENA. Lima-Peru.
74
más simples que existen en la naturaleza, pu tienen un tamaño promedio de 16 50 nucleótidos (Rosamond, 1982) y carecen intrones (Anderson el al., 1981).
Abreviaturas: PCR = Polymerase Cha Reaction; RFLP = Restriction Fragme Length Polymorphisms; bp = base pairs.
Es así que durante los últimos veinte añ se han estado reportando las secuenci nuc\eotídicas completas del DNA mitocondri de diferentes animales vertebrados disponibl actualmente en el Genbank (1999) de Interne
Por otro lado, debido a las característic que esta molécula posee es muy utilizada
..
PCR (Higuchi el al., 1984). El patrón electroforético de bandas obtenido en un gel por RFLP o peR, junto con el patrón de ban das de un marcador comercial, en cualquier laboratorio son analizados a simple vista o con la ayuda de lectores ópticos para su detección (Scott el al., 1993). Hoy, existen programas de computación que son bancos de datos de secuencias nuc!eotídicas como el Genbank (Altschul el al., 1990) y de secuencias de aminoácidos como el Proteindata Bank (Bemstein el al., 1977). Otros programas de computación tra bajan con estas secuencias hac iendo predic ciones, comparaciones por homología y análi sis de sus propiedades intrínsecas co mo son el Blastp, Seqaid, Oligo, Macaw, etc., (Karlin & Altschul, 1990). Sin embargo, ningún pro grama integra tanto la información molecular dentro de una base de datos junto con las se cuencias nucleotídicas o de aminoácidos y las principales técnicas moleculares utilizados en el análisis de genomas mitocondriales como son el RFLP y el PCR. En respuesta a este problema, se desarro lló y patentó el programa de computación Sismit
visual de análisis de imágenes dig computadora. MATERIALES Y MéTODOS
El Sismit Animal ( l 999) fu e cre zándose el programa Pascal, ver (Tenenbaum & Augenstein, 1981) y mación del trabajo de Tesis de Scott RESULTADOS
El Si smit Animal fue diseñado versátil para funcionar en computad de el modelo AT-286 co n 1 Meg Memoria RAM y en cualquier tipo d monocromática o a color.
El programa utiliza algoritmos m cos apropiados para proyectar una p Menú Principal (Fig. 1) y varias pant lo s Submenús que contienen diferent ne s se leccionables por el usuario (Fi
Dentro del Menú Pri ncipal las opc tos Básicos y Diccionario son b datos con información mitocondrial a
Sistema Mitocondrial
Datos básicos Secuencias de ADNmt Técnicas moleculares Diccionario Configuración Salir Figura 1. 1) Datos básicos; 2) Secuencias de DNAmt; 3) Técni cas moleculares; 4) Diccionario ; 5) Configuración; 6) Salir
Fusión División Enfermedades Es tructura Fisiol ogía ADN mito condrial Código genético Replicac ión Transcripción Traducción Herencia Materna Filogenia y evo luc ión Salir
Figura 2. 1) Historia; 2) Biogénesis; 3) Fusión; 4) División ; 5) Enfermedades ; 6) Estructura ; 7) Fis iología; 8) ADN mitocondrial; 9) Código g ené tico; 10) Replicación ; 11) Transcripción ; 12) Traducción ; 13) Herencia Materna; 14) Filogenia y evo lución; 15) salir.
da (Fig. 3), los cuales están complementados con la proyección de gráficos descriptivos para cada tema seleccionado (Fig. 4).
La opclOn Secuencias del DN mitocondriaJ permite seleccionar el mtD de lino de los 37 animales vertebrados d
enfermeda do s asocia d as al ad n mitocondri a l
11 /2 6
Iil Las principales citopat i as mi tocondriales son:
ENFERMEDAD
ABREVIACION
TIPO DE MUTACION
SECUENCIA DEL ADNmt AFECTADA
Epilepsia
",iectónica
con fibra
MERRF
Puntual
8344
roja desigual
I
Avanzar Retroceder
:
¡
:t
Ve r gráfico :
Sa.lir
:
[Fl¡ [ESe¡
1
Figura 3. Se describe una ci topatía mitocondrial denomi nada Epilepsia mioclónica con fibra roja desigual. Su abre viación : MERRF. Tipo de mutación: Puntual. Secuencia del mtDNA afectada : 8344
76
LHON (3243 Y 3260) LHON (41 60 y 42 16)
15812
I
~---r---:---'c,.--~+1
LHON (13708
LHON (4917 Y 5244) (1177
'>A:,------;¡.--....,--r--;~----;
LHON (7444)
L1l!llI\f&l§wrM
.""----.:..f--~'_::Z----i
GENES AFE CTADOS POR MUTACIONES PUNTUALES
-
NARP (8993) MERRF (8344
I DELE ClONE
Figura 4. Se describe las reg iones en la molécula del mtDNA donde se han identificado las principales mutaciones de tipo puntual (números) o por deleción (semicírculos) que producen enfermedades en humanos con las abreviacio nes LHON , MELAS MERRF, MMC y NARP.
rentes co n que trabaja el programa (Fig. 5) . Ad e má s, para cada cad ena del mtDNA se leccionada (Cadena H o L) pu ede obten erse información de cada un o de los 37 genes q ue poseen las mol éc ul as de mt D A de los vertebrado s: 22 R N A mensajero s, 2 RN A ribos ómicos y 13 gen es para proteínas ( A N el al., 1987) como son la secuenc ia del gen
se lecc io nad o, lo s porcentaje s d nitrogena das (adenina, g uanin a , c timin a) y el número de nu cleó tidos to gen seleccionado (Fi g. 6) .
Dentro de c: tu opción y a l ';dec un gen que codifique para una proteí ten d rá su se ue nc ia de amino ác idos
S ecuencia de ADN mi tocon drial Hw:c.acO 2
(Bomo sspiens)
Hwa.an o 3
(Homo . apiena)
(Balaenopte ra physalis)
Humano "
(Da l aOOlop te r a muscu lus )
(Bos tau ru. )
HUJI1iU7oo S
(Homo sapiena )
(Homo lIapiea.. )
(Petromyz on marin u a)
Bacalao
(Gadu8 lIID-rhu8 )
Ballena aleta Ballena az ul Bovino
Caballo Canguro
(Eq~u8
Carpa Cela canto Cbimpanc e 1 Chimpance 2.
Erizo Fo.c.a 1 Foea l Gato Gibón Gorila 1 Gorila 2 Humano 1 Salir
c ab4 1 1us)
(MacrOpu3 robu5tuS)
(CyprinuB carpio)
(Latimeria cha lumnae )
(pan trogloóytea)
(Pan troqlodytea)
(Erinaceus eu ropaeus)
(Halichoerus grypb.1.! ~)
(Pboca v itu l ina)
(Pe l i s c a t us )
(Hy lobat c 8 lar)
(Gorilla qo r i l1 a)
(Gorilla g oril la)
(Homo sapi ana)
Lm¡lproa Or a ngutan 1 Oranguta,Il 2 Ornitorrinco Pez africano Pez asiático Pez p ulmonado Poll o llana de garras
Rat a R4t ón
Rin oc er onte Truen a. 'Z Arigueya
(Pongo pyqmaeu s py~ e u8)
(Pongo pyqmaeus ab elii)
(Ornithorrhyncbu8 anatinu&)
(Pol ypte ru8 ortanipinn i a)
(Cro •• o . t oma lacustre)
(protopt.e rua dolloi)
(GalI ua g a llus)
(Xenopus laevis)
(R.d tt.U8 nor veg icus)
(Mus Irouscul u. )
( Rh i.lIloceru s u,ni c ornis)
(Onco rhyaehus my k i ss)
(Oidelophis v irginiana)
c ompa ::-ac i .:;:u,.
Fi gura 5. La pantalla muestra las 37 especies diferentes de vertebrados cuyo DNA mitocondrial está en la base de datos
2919 2944 2969 2994 3019 3044 3069 3094 3119 3144
Trabajar con secuencias
ctacgggaatttgataaatagtttc
ttggtgatgttggtgattgtagtag ttgtaggtataagtaatagcgtggt taggatcgggagtgggatcggaatt ggtatacttagggggatgggtacgg tatgggtgatt a attgtatttggac ccttaagataagtatgatcggtata
ggtcggatcgacagatgagttagga aactagtcccactcggagtttgagt tttatacgagattaacctc9gaatg
opciones sel e cci ona d as
Selección de cadena
Cadena seleccionada
H
Secuencias codificadoras Ir al nucleótido ... Salir
Gen seleccionado
NOl
Número de nucleótidos
957
% bases A:27 T :31 C:ll G:30
Figura 6. La pantalla muestra la ubicación espacial, la secuencia nucleotídica, la cadena del mt ONA, número de nucleótidos y porcentaje de bases nitroge nadas del gen NA01 mitoco ndrial.
va (Fig . 7). También denrro de esta opción se puede realizar comparacio nes de dos genes igua les o do s genes diferentes para do s espe cies diferentes o para la misma especie selec cionada por el usuario (Fig. 8).
La opc ión Técnicas Molecula res perm trab ajar con las téc nic as mokc ularcs más u lizadas en la biología m olec ular como son RFLP y PCR (Mania ti:, F. & S ambrook , 1989). Denrro de la opci ón RFLP, se pu
adn mitocondrial 26 51 76 101 126 151 176 201 226 251 276 301 326 351 376
Numero de aminoacidoB
E:Ac. Glutamico D:Ac . Aspartico A:Alanina R : Arginina
HFHINVLLLIIPILLAVAF LTLVE R KILGYHQLRKG PN IVGP YGLLQPI A DALKLFIKEPLQPLTSSTSHF1 IAP lLALTLALTHWIPLPMPYPLINHNL GILFHLAHSSLAVYSILWSGWASNS KYALIGALRAVAQTISYEVTLAIIL LSVLLHSGSFTLSTLIITQEYLWLI FPSWPLAHMWFISTLAETNRAPFDL TEGESELVSGFNUEYAAGPFALFFL AEYANIIHMNIFTTTLFLGAF HS PY LPELYSINFTHKTLLLTCSFLWl RA SYPRFRYO QLMH LLWKNFLPLTLAL CMWHVSLPIMLSSIPPQT
: 318
N:Asparagina C:cisteina F:Fenilalanlna G:Glicina
K:Lisina
Q:Glutamina H:Histidina
M:Metionina
I:Isoleucina L:Leucina
P : Prolina S : Seri n a
Y:Tirosina-'· 't: Treo n ina W:Trip t ofano
V: Va l i na
Figura 7. La pantalla muestra la secuencia de los 318 aminoácidos codificados por una so la letra del gen NO 1 mitocondrial.
78
176 201 226 251 276 301 326 351 376
GGAGCAGGTATCAAGCACACTACAA AGTAGCTCATAACACCTTGCTAGGC CACACCCCCACGGGACACAGCAGTG ATAAAAATTAAGCTATGAACGAAAG TTCGACTAAGTTATATTAAACTAGG GTTGGTAAAATTCGTGCCAGCCACC GCGGTCATACGATTAACCCAAATTA ATAAACCCTCCGGCGTAAAGCGTGT CAAAGACCCATACTAAAATAAAGTT
176 201 226 2 51 276 301 32 6 351 376
GGAGCAGGrATCAAGCACACTAGAA AGTAGCTCATAACACCTTGCTCAGC CACACCCCCAC GGGACACAGCAGTG ATAAAAATTAAGCTATGAACGAAAG TT C GACTAA GTCATAT T~7AA GG
GTTQQTAAATTTCGTGCCA GCCACC GC GGTCATACGATTAAtCCAAATTA ATAAATCTCCGGCGTAAAGCGTGTC AAAGACTAATACCAAAA:rAAAGTTA opcio nes •• l eccionadaa
Comparaciones ~ Caballo Salir
I
Cad .na . e l _ c e iao _d.. L g.a •• AJl.Mtll1t- r. n I AJUft.m t- F.a Col 9 0 : 1.6 % b a••• A: 38 T : % ba.fU A :4 0 T::Z 9 C :U G I I5
ClUDbi a r cadena Elegir nuevo gen
l'
Figura 8. Las pantallas mostradas comparan la secue ncia nucl eotídica del tRNA-Fenilalanina mitocondrial de dos equinos (asno y caballo). También se compara los porcentajes de sus bases nitrogenadas .
seleccionar de una lista de 150 enzimas de restricción diferentes, nueve enzimas de re s tricción y realizar digestion simples o dobles del mtDNA esc ogido (Fig . 9). De la misma manera, para la opción PCR, se puede selec cionar dos sondas o primers ya probados a nivel mundial para amplificar una secuencia espec ífica pa ra un mtD NA seleccionado (Fig. 10).
Para las op iones RFL P y PC g ra ma p ro yecta u n patrón el ec t d ig ital que pemú te ve r a l usuario lo tos obte nidos por RFLP o el fragme ficado por peRoAdemás , se pued nar un marcador mo lecul a r util iza men te en los laboratorio para co distan cia de mig r ció n de l
Selección de enzimas de restricci6n
Nael Narl Ncil Neol Ndel Nhel Nlalll NlalV Notl Nspl Adelante
Nrul Nsil PflMl Plel PpuMl
111!-- Pvul Pvull Rsal Rsrll Atras
Sacl Sa cll Sal l S a u 3AI Sau96l Sea l ScrFI SduI SfaNI Sfil sali r
SgfI SgrAl SmaI Snal SnaBI SpeI Sphl SsPl Sstl SstII
StuI StyI 'l'agI 'l'haI Tt hlllt 'l'urboNael 'l'ru9l VspI XbaI XhoI
Figura 9. Banco de datos de las enzimas de restricción utili zadas en RFLP
L120 3 0As L13 773As L144 37As L14600As L14846 As LlS4S 7As LS13Ba Adelante
L7020Ba L7907Ba L8786B a L9029Ba L146l6Ba L15672Ba L1657lBa Atras
LlS86lBm L163S2Bm L48Bo L239Bo L14487Bo L1476SBo L14929Bo
L9340Bp L1l22lBp LlS028Bp LlS79lBp LlS864Bp L936Bm L938Bm Salir
L16l76Bo LS14Ca L89l6Ca Ll1019Ca L14603Ca L14460Ca L14849Ca
Figura 10. Banco de datos de las sondas utilizadas en peR
electroforé tica. Den tro de e~ta opción se pu ede obtener info rmac ió n molecular como so n el peso molecul ar (e n pb) y el nú mero de Jos frag mentos di geridos por RFLP (F ig. 11 ), o el ta m a ño del segme nto amp lific ado por PCR (Fig. 12)
pb
MARC ADOR
DISCUSiÓN
El prese nte report e demuestra qu e co nuestro programa SISMIT Animal es po sib integrar la información de la sec uenc nuc leotídica del DNA mitoco ndrial disponib e n Internet de diferentes es pecies a nima l
Enzima (s)
MUE STRA
seleccionada (s) Origen
~~:§§§
PstI SacI
s Marcador seleccionado : Lambda HindIII
10,000 5,000 2,500 1,000 500
250
in
Número de bandas
5
Banda seleccionada
1
Peso molecular de la banda en pb
7746
100
50
25
la
Trabajar con secuencias
Seleccionar marcador Ver banda Sa lir
Figura 11. En la pantalla superior derecha se indica las enzimas de res tricción y marcador seleccionados, y el número de bandas
80
5 ,0 0 a N~mero
2,5 00 1,000 5 00
iD
de bandas
: 1
Banda seleccionada : 1
Peso molecular de la ba Dda en pb
250
502
100 50
Trabajar c on secuencias
25
.
10
er
Seleccionar marcador Ver
banda
Sa li r
Figura 12. En la pantalla superior derecha se indica las sondas y marcador se leccionados , número de ban das, banda se leccion ada y peso molecular en pb
con la información de bi ología molecular util i zados en los laboratorios que analizan esta mo lécul a. De es ta manera, se pudo diseñar un programa d computaci6n que util iza un len gu aj e info nn ático para proyectar un sistem a de an áJ i s i ~ de imágenes y facili tar e l acceso y util iz ac ión de e:-; ta información de una f0n11U fácil, confia bl e y úti l para los investigadores .
LITERAT URA CITADA
n
A nderson, S ., Bankier, A • Barrell, B., De B ru ijn , M. , Coulson . A ., Drouin . J, Eperon, l., Nierlich, D., Roe, B ., Sange r, F. , Schreier, P. , Smith , A., Staden. R. & Youn , 1. 1981 . Sequencc and organi z a t io n 01' the human milochondrial geno me . N ature . 290:457-465 . Altschul, S ., Gish, W., Miller, W ., Myers, E. & Lipman , D . 1990. Basic local a lignmenl sea rch too!. J. Mol. Bio!. 215:403-4/0 . Bern t in, F. Koetzle, T., Williams, G. Meyer, E . B rice, M . Rodgers , J., Kennard, O, Sh imanouchi, T. & Tasumi, M. 197 7. The Pr teinData Bank: A compuler
bascd a rc hiva l f ile for macro struct ures. J. Mo l. Bi !. 112 Brown, w., George, M . & \oVi l'on, Rapid voluti on of animal mito O A . P roc. Nat!. ,e j. LIS
J967- 1971. Brown. W. 1980. Pol y morphi sm in m d ríal O A o f hUl11ans as re restri ctioll cndo nuc lease anal ceeding of Ihe N al ional Ac Sciences o f the USA . 77: 360 Cann, R ., S tonek ing, M . & W il son Mitochond rial DNA and h um l io n. Nature . 325(1): 31-36. Gcnba nk (IN TER ET): http://ncbi .n lm. nih. gov Higuchi, R., Bowman, M ., Freib Ryder, O & W ilson, A . 19 seguence fro m lhe quagg a m the horse fa mi ly. 'aturc . 31 2 Ka rl in , S . & Altsch ul, S . 1990. Mc assessing the statislÍcal s ign i molecular sequence f .alure g cnera l scoring schemes. P Acad . LISA. 87: 2264-2208 .
Nei, M. & Li, W. 1979. Mathematical model for studying genetic variation in terms of restriccion endonucleases. Proc. Natl. Acad. USA. 76(10): 5269-5273. Rosamond, J. 1982. The molecular of the mi tochondrion. Biochemical Joumal. 202: ]-8.
Scott, D., Welt, M. & Leung, F. 1993. A com puter to aid in calculating similarity in
82
Biólogo, UNALM, Lima, Perú. Sismit Animal. 1999. Copyright. Sistem Mitocondrial Animal, Versión 1.0 P tente N.o 0743. Indecopi. Lima, Per Tenenbaum, A. & Augenstein, M. 1981. Cop right. Estructura de datos en Pasc Prentice-Hall Inc. 3." ed. México, D