Story Transcript
Casa abierta al tiempo
UNIVERSIDAD AUTONOMA METROPOLITANA
MODELADO MOLECULAR DE QUIMOPAPAiNA TESIS QUE PRESENTA
ALBEDTA JAWLINE PADILLA ZÚÑIGA PARA OBTENEREL GRADO DE
MAEaTDO EN Q@IICA
NOVIEMBRE: DE 1993
UNIVERSIDAD AUI6NOMA ME"R0POLITAN.A UNIDAD IZTAPALAPA DIVISIÓN DE CIENCIASBÁSICAS E INGENIEKÍA DEPARTAMENTO DE QUÍMICA
UNIDAD IZTAPALAPA Av. Michoacán y LaPurísima, Col. Vicentina,Iztapalapa, D.F. C.P. 09340. Tel.: 686-03-22
De mzmpamixGzr deseo e p r w r m ' p nagradechimo al%. M r é i Mdtz %ana por sus valww 0 6 s e n ~ a cywsu ~ kzondicwnaldis-posicwnen Gz asesorh delpresente trabajo y a l e . %-two%go !.Dotnúyuezpor sus consejos, eltkquoy eltmhzjo concedi€os a Gz eGz6omcwn deesta tesk
CAPíTULO 1
INTRODUCCI~N
1
CAPiTULO 2
MtIODCX
8
9 9
10 11
Modelado molecular
12
Superficie de energía potencial
12
Campo de herzag
14
Minimización de energía o mecánica molecular
16
Ckadientem conjugad-
18
Dinámicamolecular
19
Mitodo de Verlet
20
Cálculo de áreas q x d k i a l e m y volilmenem molecularem
24
Buperpmición de cstructura6
24
CAPíTULO 3
RE$UIJTADOS Y DISC3JSION
25
&lección de la atructura b a e a) Homologin en composición b) Hornologia e n secuencia c) 6ignificoncin dc la hornologia en sccucncin
25 25 25 21
Modelado molecular de la quimopapaína a) (3ondrucción del modelo inicinl b) Minimización de crlcrgia c) C.onvcrgcncir-1 hacia l a conformación de equilibrio
30 30 32 33
Evaluación de la calidad atereoquímica del modelo
34
Análimk de la emtructura del modelo de la quimopapaína
46
Comparación mtructural del modelo con otrm miembros de lam PSV
52
hplicacionem del modelo propucA~o
56
CAPíTULO 4 B1BLIOCRAFlA
CONCLU&IONE&
18 81
CAPITULO 1
Por lo conocidoacerca
de las proteínas,todos
los esfuerzosdedicados
al
estudio de sus propiedades y aplicaciones resultan justificados. Si como se ha dicho, el DNA es un proyecto de vida y las proteínas los "ladrillos"y el "mortero" que hacen posible todas
las funciones vitales (Doolittle, 1985), no es sorprendente que encontremos a algunas proteínas cumpliendo funcionesde reconocimiento molecular para el transporte de metabolitos o como defensa contra organismos patógenos; a otras, como reguladores del ritmo vital, como barrera física y soporte,como sintetizadores bioquímicos, como generadoras de movimiento y aúncomomateria prima de otrasbiomoléculas. Y lo mLSs notable es queestaincreíblevariedadde funciones se verifica dentro de las células en condiciones suaves, con extraordinaria eficiencia y congran especificidad.De entre las funciones de síntesis, quizá la labor catalítica es la más rica en cuanto a la diversidad de proteínasinvolucradas. La función enzimática, estrechamente relacionada con el reconocimiento molecular, ha llamado fuertemente
la atención por las aplicaciones industriales que pueden
derivarse de ella, tanto farmacéuticas como alimentarias y de síntesis química. En el afán deutilizar
a las proteínascomopotentescatalizadores
de las
reacciones biológicas, se ha intentadoproducir estasmoléculasenmayorcantidad se hallan naturalmente, sin embargo su obtención
que aquélla en que
purificaciónposterior,representan
un granreto
investigador. Por ello, recientemente se
a la habilidad y experienciadel
a las técnicasdeingeniería de se ha hechoevidente el fuertenexo
haacudido
proteínas y de DNA recombinante,endonde queexisteentre
y su
la estructura de una proteína, la preservacióndesuintegridad
sobretodo, sufunciónbiológica.Con
estosantecedentesescomprensible
interésen los estudiosestructurales,quedealgunos presentando en diferentes partes del mundo diseñodeproteínasdenovo(Richardson cuyoobjetivoesdeterminarsi
y
el gran
años a la fecha se ha venido
y que se manifiesta por ejemplo, enel 8. Richardson, 1984; Goraj et a/., 1990)
las tendencias generales, que han podidodeducirse
un grupodeproteínasconestructura conocida, pueden aplicarse a la generacióndeproteínassintéticasconpatronestridimensionales característicos y predeterminados.Aunqueestosestudios sólo pretendenobtener de la observaciónde
en una conformaciónparticular, ya se haalcanzado otrametaaúnmásambiciosaque es la de producirenellaboratoriopéptidos artificiales con actividad biológica preestablecida (Hahnh et a/., 1990). Estos trabajos permiten confiar en que el fin último de la ingeniería de proteínas sobre el diseño de estasmacromoléculasconfuncionesespecíficas y nuncaantesobservadasen la
cadenas de proteínas plegadas
naturaleza, se encuentra cada vez más cercano.
En la hgeniería de Proteínas están involucrados tanto el diseño y construcción demacromoléculascompletas,como larealizacióndemodificacionespuntuales donde se reemplazan, suprimen o adicionan residuos individuales o aún fragmentos decadenapolipeptídica
en la secuenciade unaproteínanatural.Todo
objeto de identificar los sitios de unión de la proteínaconsusustrato establecer la jerarquíadefuncionesquecadaresiduosostieneen maquinariaenzimática
y dereconocimientomolecular.Asítambién,
esto conel
o ligando y la compleja las técnicas
mutagénicas se han venido empleando en la elucidación del papel que cumplen las cadenaslateralesde
los aminoácidosen
la estabilidad y en el mecanismo
de
plegamientode las proteínasquelespermitealcanzarsuestructuratridimensional biológicamente activa (Altamirano B Calcagno, 1993). El gran esfuerzo que implica el
manipular el DNA celular de
un
microorganismo para lograr la generación de una proteína específica, mantiene aún vigente la alternativa de estudiarmutantesnaturalesdeunaproteínaconestrecha homologíaensecuencia
y queconserven
un patróndedobladocomún.Esto
permitiríano sólo identificar a los residuos inconmutables de aquéllos que cumplen una función
accesoria en la secuenciapolipeptídica(comoen
proteínas), sino que además, proveería de principios generales
la ingenieríade para la identificación
y caracterizacióndeestosgruposdemutantes,queformanverdaderasfamilias
proteínas, para sumarse a los importantesestudiossobre
de
la relaciónestructura-
función-estabilidad que se han mencionado antes. Uno de los problemas más importantes por resolver en biología molecular, es la forma en que la secuencia de aminoácidos de una proteína es capaz de conducir a la macromolécula hacia
la estructura tridimensional que determina su función
biológica específica. Y aunque éste es un punto de debate actualmente, el hecho es que todos los estudiosqueserealizansobreproteínasenelmundo,tienenel
2
objetivo mediato o inmediato de encontrar las claves estructurales que mantienen la estabilidadmolecular y quecontrolan
la maquinariafuncionalde
las proteínas,e
intentar con ello definir las tendencias generales que sigue la naturaleza en el diseño estructural de estas biomoléculas. Por tanto, es necesario contar con un número cada que permitanrealizar
vez mayor de estructuras tridimensionales de alta resolución, estudiosdecaracterizaciónsistem6ticospara
la elucidaciónde los mecanismosde
plegamiento, con las claves moleculares para conocer el proceso de adquisición de la estructura polipeptídica tridimensional únicay completamente funcional. Con la intencióndeobtenernuevasestructurasdeproteínasquepermitan funcionales entre establecer las relaciones
la secuencia de amino6cidos
y la
conformación tridimensional, se han venido empleando exitosamente dos métodos experimentales: la difracciónderayos deresonanciamagnéticanuclear Dahlquist, 1990; Clore
S,
X encristalesdeproteína(Perutz,
1992) y la
(RMN)deproteínasensolución(McIntosh
Gronenborn, 1991). Laprimera
monocristalesdeproteínaestables permita la adecuadadifracciónde
S,
de estas técnicas requiere
a los rayos X y con un ordenmolecularque la radiaciónincidente.Porsuparte,
la técnica de
RMN precisa del manejo de soluciones de proteína en concentraciones relativamente altas (1-2 mMj, valores de pH normalmente menores a 6 (Branden S , Tooze, 1991), y adem6s,moléculasquecontengan
un m6ximode
150 residuosensucadena
polipeptídica (De Vlieg S , van Gunsteren, 1991).En la realidad sólo algunas proteínas pueden cumplir las condiciones experimentales que imponen estas técnicas, y ello es responsable de
que
se
conozcan
sólo
algunos cientos
de
estructuras
tridimensionales, cuando el número de secuencias completamente determinadas que se tiene actualmente, se elevaa varias decenas de miles (Fasman, 1989). Conelrápidocrecimientode
la capacidad de procesamiento
d e datos y con
las velocidades de cálculo numérico de que se dispone actualmente, es ya factible la
utilización de programas de cómputo
para la aplicación de técnicas como
mecánica y dinámicamoleculares,quepermitensimularelcomportamiento propiedades de sistemas constituidos por varios miles proteínas y ácidosnucleicos,con
de átomos, como
una muy buenaaproximación
la y las
las
a los resultados
experimentales (Langone, 1991). De hecho, desde finales de los 60’s se hanvenido empleandoalgoritmosdeprogramaciónparaelmodeladomoleculardeproteínas con gran
éxito, y a partir de entonces, se
han perfeccionado los métodos
3
matemáticos que generan y representan gráficamente el comportamiento dinámico y las conformaciones espaciales más estables, que describen fielmente
la soluciónconcreta
biológicos.Esteúltimopunto,constituye
a los sistemas
al problema de la
adquisición de estructuras tridimensionales, ya que los elementos de partida de las técnicas de simulación molecular son relativamente asequibles y salvan muchas
de
las restricciones sobre la naturaleza molecular, que imponen las técnicas de dih-acción de rayos X y
RMN
mencionadas anteriormente; aunque
aproximacionesteóricayexperimentalresultan
de hecho, las
ser complementarias en la mayoría
de los casos. Las aplicacionesmássobresalientes
de los programas de simulación
además de la generación de modelosmoleculares,son
las que se refieren a la
determinación de parámetrostermodinámicos de sistemaspoliatómicos(Icarplus
8.
Petslto, 1990) y a los cálculos dinámicos a temperaturassuperiores a las del medio biológico, para producir la desnaturalización de una proteína; al menos hasta llevar a la estructura al estado de glóbulo fundido (Daggett,1993).
En el Area de Biofisicoquímica de la UAM-I se está llevando a cabo un proyecto de caracterización termodinámica sobre la familia de enzimas denominada proteasas sulfhidrílicas vegetales (PSV).Esta familia comprende un grupo de enzimas cuyaactividadproteolíticadepende
del grupotiol de un residuo de cisteína de su
secuencia de aminoácidos. Aunque las proteasas sulfhidrílicas más estudiadas son las que se obtienen de fuentes vegetales, existen análogos estructurales en animales y en algunosmicroorganismos(Kamphuis
et al., 1985a; Moore, 1969). Del grupo de
proteasas sulfhidrílicas o tiólicas vegetales, la papaína es la enzima más ampliamente estudiadayportanto,
la mejorconocidahastaahora(Glazer
8. Smith,1971
;
Brocltlehurst et aI., 1981; Baker 8. Drenth, 1987). Estetipo de enzimaspuede ser obtenido ya sea del látex,
el endocarpio y el zumo, o bien del tallo, las hojas y aún
las raíces, de un grannúmerodeFrutosyplantas.Porejemplo,dellátex de papaya se extraen la papaína y al menos otros dos tipos de proteasas: la quimopapaína y la papayapeptidasa A , también conocida como proteinasa Q (Baker 8. Drenth, 1987); e n el látex de las plantas ficus spp., Asclepias syriaca y glaucescem y &/otropis
gigantea, pueden encontrarse las ficinas (Kortt et a l , 1974), las asclepainas (Tablero et al., 1991) y las calotropinas y calotropaínas (Pal 8. Sinha, 1980) respectivamente. Así mismo, del endocarpio de la piña y del fruto llamado kiwi, pueden purificarse las bromelaínas (Takahashi et al., 1973) y las actinidinas (Carne 8. Moore, 1978), y de las hojas de la cebada puede obtenerse la aleuraína(Holwerda 8. Rogers, 1992). Los
4
distintos tipos
se localizan en una sola fuente vegetal, no
de enzimas que
corresponden a simples productos de degradación sino que constituyen en realidad, tipos particulares de proteínas que pueden ser identificados tanto por las variaciones
en sus secuenciasdeaminoácidos,comopor
la manifestación de susdiferentes
propiedades físicas. Todas ellas guardan una estrecha semejanza u homología en sus secuencias de aminoácidos, con una cantidad de residuos idénticos que se encuentra e n el intervalo de 40 a 90%; al efectuarcomparacionesentrepares
de proteínas.
Actualmente se tienen caracterizadas por difracción de rayos X las estructuras de tres proteasastiólicasvegetales:papaína(Kamphuis et d., 1985b), actinidina(Baker, 1980) y proteinasa Q (Pickersgill et d., 1991 ). De la observación de la arquitectura de estas tres proteínas, se sabe que están integradas por dos dominios estructurales
de aproximadamente 100 residuos de amino%cidocadauno, lo que corresponde a cerca de 200 residuosporcadenapolipeptídica.También
activo,localizado
en la hendidurainterdominio,
se conoceque el sitio
se encuentraintegradoporuna
triada de aminoácidos: una cisteína del primer dominio, además de unahistidinay una asparagina pertenecientes
al segundo dominio.
En esta triada,
el grupo
sulfhidrilo de la cisteínainteraccionafuertementecon
el anillo imidazol
histidina, el cual a su vez, se encuentraestabilizadopor
el carbonilo de la cadena
lateral de la asparagina. Espacialmente cercanas identificado siete regiones coadyuvantes
a estostresresiduos,
de la
se han
de la función catalítica que son los
denominadossubsitios S4, S3, S2, S1, S1 ’, S2’ y S3’ de la enzima. De esta forma, siete residuos del sustrato peptídico (codificados interaccionancon
por P4, P3, P2, P I , P l ’ , P2’ y P3’),
los subsitioscatalíticosmencionados
(Fig. 1#1), y el punto de
escisión está situado entre
los subsitios S1 y S1 ’. También se sabe que la diferente afinidad o especificidad por los sustratos en estas enzimas (al menos para papaína y actinidina), está determinada principalmente por la composición y la geometría del subsitio S2 (Drenth et a/., 1976; Baker & Drenth, 1987).
En la familia de las proteasas sulfhidrílicas vegetales se tienen completamente secuenciadas siete enzimas: papaína, actinidina, proteinasa Q , quimopapaína, bromelaína de tallo, papaya peptidasa IV y aleuraína (Mitchel, 1970, Carne ¿LMoore, 1978, Dubois et a/., 1988a, Watson et a/., 1990, Ritonja et a/., 1989a y b, Whittier et a/., 1987,
respectivamente). En la Tabla 1 -I se presenta la extensión de la cadena
5
SUSTRATO H 2N-
P4
P3
P2
P1
PI’
P2’
P3’ -COOH
Figura 1-1. Representaciónde un polipéptidodesieteresiduosqueinteraccionancon los subsitios de una proteasa sulfhidrílica, de acuerdo con Baker 8, Drenth (1 987).
polipeptídica y la indicación de las estructuras caracterizadas por difracción de rayos X, de las proteasas tiólicas que actualmentese estudian en nuestro laboratorio.
De las PSV completamente secuenciadas y cuya estructura tridimensional aún
no se conoce, la quimopapaína es la más estudiada hasta ahora. Se tiene información sobre su actividad catalítica (Buttle
& Barret, 1985), reactividad(EnzymeHandbook,
1991), topografía(Watson, et a/., 1990, Dubois et a/., 3988b, Carey et a/., 1983),
contenido de estructura secundaria (Solís-Mendiola
et a/., 1989) y estabilidad
termodinámica (Solís-Mendiola et a/., 1992), entre otras. Una característica notable al compararalgunas deestasevidenciasexperimentalesconlasobservadaspara
las
demAs PSV estudiadas, es que consistentemente la quimopapaína parece alejarse de las tendenciasgeneralesseguidas
por la familia.Con
intención de contribuiralacompletacaracterización inmediatoen
estosantecedentesycon
la
de laquimopapaína, el objeto
este trabajo, es el poderdeterminarunaestructuratridimensional
confiableparaestaproteína,queayude
a esclarecermuchas de lasinterrogantes
planteadas por los estudiosexperimentales. Sin embargo,aunqueexistenreportes
6
sobre la obtención de cristales de quimopapaína(Jansen S Balls, 1941; Ebata S Yasunobu, 1962) hastaahorano
se hanpublicadoestudios
relacionados con ella. Por otra parte, su cadena
de difracción de rayos X
de 218 residuos de aminoácido, hace
impracticable la caracterización estructural por medio de la
RMN con la tecnología de
que se dispone actualmente. De aquí que la única alternativa viable para salvar
los problemas que imponen las técnicas experimentales, es el empleo de la metodología de la simulación por computadora, que ha resultado ser exitosa en la determinación de la geometríatridimensional de unagranvariedad
de proteínas(Blundell
et a/.,
1988; Karplus S Petsko, 1990; Levitt, 1992; Srinivasan et a l , 1993).Así, el objetivo que se persigue en este trabajo es el de proponer una estructura tridimensional que represente lo másfielmenteposible a la quimopapaína, a través de las técnicas de simulación por computadora, que emplean métodos de mecánica y dinámica moleculares. En las siguientessecciones
se describirá la metodologíaseguidapara
obtención del modelo tridimensional
la
de la quimopapaína, la estimación de sunivel
de confiabilidadysuposterioraplicacióna
la interpretación de algunos de los
resultados experimentales disponibles, sobre todo, de aquéllos que inciden directamente en los aspectos geométricos de las proteínas involucradas.
-r+uw1-1
I
PKOTEASA PAPA~NA QUIMOPAPA~NA PROTEINA5A R 6ROMELAiNA DE TALLO ACTINIDINA FlClNA
I
RESIDUO5 NO. DE
212 218 216 212 220 2
* Proteínas con estructura tridimensional determinada por difracción de rayos X.
7
CArmJLO 2 MÉTODOS
La similitudconforrnacionalentreproteínas
de estructuradesconocida
determinanormalmente, a travésdesusdistanciasrelativasmutuassobre
se
un árbol
filogenético construido con la información estadística de la estructura primaria de un grupo de macromoléculas. Es una característica casi invariante, que las proteínas que guardan alta homologíaensussecuenciasdeaminoácidospresentenpatrones plegamientotridimensional
muy semejantes. Aunquetambién
de
se han encontrado
casos en los que proteínas con una escasa semejanza en sus secuencias manifiestan gran relación geométrica (Ryu et a/., 1990; Holmgren 8. Branden, 1989). Esto sugiere que la diversidad en topologia espacial está mucho más
limitada que la variabilidad
observada en las secuencias de aminoácidos delas proteínas. A pesar del importante progreso que se ha conseguido, sobre de la comprensióndel mensaje cifrado en
la
secuencia de aminoácidos que relaciona a éSta estrechamente con el patrón terciario dentrode
una proteína, aún sedesconocen
engranmedida
los principiosdel
dobladode la cadenapolipeptídica. Así, elmodeladodeestructurasbasadoen homología en secuencia, constituye el principal medio unaproteínamientrasno
RMN (Srinivasan et d
,
la
para predecir la estructura de
se encuentrendisponibles los datoscristalográficos o de 1993).
Dos requisitos indispensables en el modelado de estructuras homólogas son: a) elque
se disponga de la secuencia de aminoácidos de
la proteína de estructura
desconocida; b) que secuente coninformacióntridimensional mismafamiliaestructural 1969; Creer,1981
;
de moléculas de la
a la quepertence la proteínaencuestión(Browne
et d.,
Blundell et a/., 1987). En este trabajo se seleccionó una de las
estructurascristalográficamentedeterminadasen
la familia de las PSV para que
el esqueleto de este molde se sustituyerontodos los residuosqueconstituyen la secuencia de la quimopapaína, y por técnicas de simulación molecular, se permitió que la molécula híbrida adquiriera la conformaciónrepresentativade la proteínaenestudio.Finalmente se procedió a evaluar la calidad estereoquímica del modelo obtenido y a confrontar sus características geométricas conla información experimental disponible. sirviera de molde
a la quimopapaína. Sobre
A continuación se describe la metodologíaseguidaen modelar la estructura tridimensional de la quimopapaína.
este trabajopara
Selección de Ia estructura base Para poder elegir convenientemente
de entre las tres proteasas de estructura
tridimensionalconocida y pertenecientes a las PSV, aquélla que mejorsirviera de base para modelar a la quimopapaína, se compararon las secuencias de aminoácido la aplicación detrescriteriosdeselecciónestadísticos
deestasenzimasmediante
independientes. Se emplearon las secuenciasreportadasporMitchel parapapaína,porCarne
8,
para la proteinasa
Estas secuencias coinciden con
IR.
et a/. (1970)
Moore (1978) paraactinidina y porDubois et a/. (1988)
las estructuras primarias
correspondientes a las mismas enzimas y que se encuentran depositadas junto con los archivos 9PAP, 2ACT y 1 P P O (en pre-liberación)
sus coordenadas espaciales en
del banco de datos cristalográficos
(PDB)(Bernstein et a/., 1977; Abola et a/., 1987).
Parael caso de la quimopapaína se utilizó la secuencia de aminoácidos determinada recientementepor
Jacquet et al. (1989) y Watson et a/. ( 1 990). Los criterios de
selección mencionados que se describen a continuación, involucraron comparaciones en la composición de aminoácidos, análisis de
la homología en secuencia
determinación de la significancia en esa homología en estructura
y
primaria, para cada
proteína caracterizada tridimensionalmente en su confrontación con quimopapaína. I) Homologia en composición.
En este método se determina la diferencia en contenido de aminoácidos que mantienen dos proteínas, a fin de establecer una comparación en composición entre ellas que sirva como primer criterio
de homología; independientemente del
conocimiento que se tenga de las secuencias individuales de las macromoléculas en estudio. La hornologia en composición diferencias en el contenido de cada uno
se evalúa a través de la suma de las de los 20 aminoácidos constituyentes deuna
pareja dada de proteínas, de acuerdo con la siguiente expresión: i=20
IDC =
y.
-
2
(compAi compB1)
9
donde IDC es elíndicede
la diferenciaencomposición
y compAi y compBi las
composiciones del aminoácido i en la pareja de proteínas involucradas A y B. Estas a lafrecuenciaconqueaparecen
composicionespuedenserreferidastanto
los
residuos en la cadena polipeptídica, comoal porcentaje del total de aminoácidos que corresponde a cada residuo en una proteína dada. En cualquier caso, de acuerdo con la relación ( I ) , un valor de IDC=O significa que las proteínas en comparación tienen
idéntica composición de residuos (cero diferencias); y por consiguiente a un mayor valor de IDC corresponde una mayordivergenciaentre
las composiciones de las
moléculas comparadas. En este trabajo se aplicó el criterio descrito para confrontar la composición de aminoácidos de la quimopapaína y cada una de las tres proteasas cristalizadas de las PSV. 2) f-fomología en secuencia. Alineamiento de pares de secuencias.
Parallevar
a cabo la comparacióntopológicaentreestructurasprimarias,
utilizóelalgoritmodesarrollado
poy Myers
S,
Miller (1988) específicamente parael El criterio de homología en
alineamiento de parejasdesecuenciasdeaminoácidos. estecaso,consistió
se
en la identificación de la estructuraquemantuvieraelmayor
número de residuos idénticos y/o similares, simultáneamente con el menornúmero d e insercionesensucadenapolipeptídica,
al seralineadacon
la quimopapaína. El
método de Myers 8. Miller para alinear una pareja de secuencias de aminoácidos, que llamaremos nuevamente
A y B, consiste en la determinación del conjunto
operacionesquetransforman
la proteína A en B de talmanera
costos d e cadaoperaciónsobrelassecuencias,sea
de
que la suma de los
la menor. Las tresoperaciones
definidas son:
(a) Reemplazo de un aminoácido por otro. (b) Supresión de n aminoácidos consecutivos.
(c) Inserción de El costo de reemplazar un residuoporotro
11
aminoácidos consecutivos.
se encuentra especificado en una
matriz W donde cada elemento en el arreglo matricial w(a,b), corresponde al cambio delaminoácido a de la primerproteínaporelaminobcido
b de la segunda. En este
trabajo se utilizó la matriz MDM-78 (Schwartz S , Dayhoff, 1978) que se basaen la estadística de mutaciones puntuales en secuencias
de proteínas homólogas. El costo
de insertar o suprimir un conjunto de n aminoácidos en cualquiera de las secuencias por alinear, se calcula a través de la Función:
10
F(11) =
donde CA es el costode
CA
aperturade
+ (n*CU)
(2)
una inserción y CU es el costo porcada
aminoácido que deba ser agregado a la secuencia. De acuerdo con lo recomendado por los autores, se utilizaron valores de penalización de 100 unidades para cada uno de estos parámetros de alineamiento.
sí por el
Los residuosdeaminoácidoquesonconsideradossimilaresentre métododealineamientoempleadoen
este trabajo Fueron:
A, S y
T (residuos pequeños y polares); D y E (residuos que pueden adquirir carga eléctrica negativa);N y Q (residuos polares vinculados con los dos anteriores); R y K (residuos que pueden adquirir carga eléctrica positiva); I , L, N y V (residuos alifáticos); F, Y y W (residuos aromáticos).
3)Sig11ificanciade la homologia. la selección d e la estructura de basepara el modelo de la quimopapaína, Fue la ponderación del parecido en secuencia entre dos proteínas, respecto a lo que pudiera deberse solamente a casos fortuitos o aleatorios.
El tercercriterioempleadoen
Es decir,deacuerdoconelcriterioestadístico,paraprecisarsidosestructuras presentanhomologíarealquepudiera
dar unaclaraindicación
de algúnancestro
común, es necesario obviar a todas las proteínas cuya secuencia resulte
la de interés sólo por una combinación
El algoritmodelmétodoque
estodsticamente afortunada d e sus residuos.
se utilizóaquí
Wunsch (1970), modificadoporDayhoff
semejante a
es eldiseñadoporNeedleman
8,
( 1 978)y Feng et al. (1985). Este método
consiste en comparar, en unidades de desviación estándar,
la puntuaciónlograda al
alinear las secuencias de aminoácidos dela proteína de interés y d e aquélla d e la que se sospecha un parentesco. Esta puntuación se almacena, e independientemente se vuelven a comparar las secuenciasdeaminoácidosdeestasdosproteínas,pero ahora la secuencia de la segunda macromolécula se mezcla aleatoriamente, aunque la composición, y se evalúa un nuevo marcador.
La mezcla de aminoácidos al azarjuntoconelcálculode la homología.ensecuenciaencada iteración, se prolonga a voluntaddelusuario. El grupo de valores obtenido de esta los que manera, genera toda una distribución de eventos de homología aleatoria en la proteínadecomparaciónestaráincluida; a menosquerealmentemantenga cercaníaevolutivacon la proteínadeinterés.Cabeseñalarqueen el uso de este
sin cambiar
11
método se encontró una grandependenciadelparámetro
de significanciacon el
número de comparaciones aleatorias. Los resultados de este andlisis se publicaron en otrolugar (Rojo 8. Padilla, 1993) y de ellos se establece que elnúmeroóptimo
de
iteracionesque se requiere para llevar a cabo una comparaciónconfiableentre
las
secuencias analizadas, debe mantenerse entre esta prueba se aplica Fundamentalmente
80 y 150 mezclas aleatorias. Aunque a proteínas con baja homología
en
secuencia, se optó por utilizarla en este trabajo para tener mayor confianza en que la estructura seleccionada sería la base más adecuada para
la construcción del modelo
de la quimopapaína. Modelado molecular
Las simulacionesdemecánica
y dinámicamoleculares, se realizaronen
un
sistema IBM RS6000 con l6MB dememoria RAM y 16 Mflops de rendimientoen cálculo numérico. Este recurso se utilizó junto con el programa de cómputo BIOGRAF Versión 2.2 (MolecularSimulationsInc.,Waltham,
MA.) y elcampo
de fuerzas
Dreiding//(Mayo et d., 1990).La paquetería de BIOGRAF permite el manejo
estructurasdepositadasen
los bancosdedatoscristalográficos,
d e las
su representación
gráfica, sumanipulación y análisis, así como la realización de todos los ~ l c u l o sde energía que permiten la simulación de sistemas macromoleculares. A continuación se reseñanbrevemente
los principiosteóricosen
Fundamentan las técnicasdemodeladomolecular,
los que se
y se explican los ,algoritmos de
minimización y dinámica moleculares empleados por BIOGRAF. Superficie de energía potencial
una molécula es un problema
La descripción matemática completa de
formidable debido a las pequeñas escalas dimensionales y a las grandes velocidades involucradasen los movimientos atómicos. Debido a queaúnno teoríamecánico-cuánticarelativistaqueaporte los efectos que se presentan en
se cuenta con una
una descripciónadecuada de todos
las moléculas o ensistemasmoleculares,
es
conveniente revisar un planteamiento de la energía en forma simplificada. De acuerdo con la ecuación de Schrodinger: HY(R,r) = EY(R,r)
12
donde H es elHamiltoniano
para el sistema, Y es la Función d e onda y E es la
energía (por lo común, Y es Función de las coordenadas tanto del núcleo como los electrones). Aunquemuy
de
general,estaecuaciónesdemasiadocomplejapara
cuaiquierusopráctico,demaneraquedebenintroducirsealgunassimplificaciones como la de Born
8,
Oppenheimer ( 1 927) según la cual puede generarse, con buena
aproximación, una ecuación para elmovimientoelectrónicoque
sea independiente
de la que describe al movimiento nuclear, y que dependa sólo paramétricamente de las posiciones de los núcleos atómicos:
HY(r;R) = EY(r;R) En estaecuación
(4)
se define una energíaconocidacomo
la superficie deenergía
potencial, que es función únicamente de las coordenadas nucleares.
en la superficie de
La segunda ecuación que describe el movimiento nuclear
energía potencial es:
H@(R)
=
(5)
E@(R)
donde 0 es ahora una Función que
depende solamente
de las coordenadas
nucleares.
Si se requiere el estudio de
la evolución en el tiempo
resolverse la ecuación (5), sin embargo
de una molécula, debe
la ecuación (4) debe ser resuelta
previamente, lo cual noresulta trivial; por ello, para resolver la ecuación (4) se utiliza normalmente un ajuste empírico a la Superficie de energía potencial. La solución a la ecuación mechico-cuántica (5) es llamada dinámica cuantica, pero dado que puede considerarse a los núcleos como objetos relativamente pesados
al compararloscon
los electrones, los efectos cuánticos resultan despreciables y ental caso, al introducir
una aproximación, la mismaecuación
(5) puedereemplazarsepor
la ecuacióndel
movimientodeNewton,donde se calculanlasvelocidadesqueexperimentacada dtomo de la molécula como Función del tiempo, en cada conformación:
13
La soluciónde la ecuación (6) mediante el ajuste empírico
energía potencial,
a la superficie de o
La mecánica molecular
es llamada dinámica molecular.
minimización de energía, que es un método paralelo a la dinámica molecular, por su parte,ignora
la evoluciónde
los sistemaseneltiempo
y se especializaen
búsquedadegeometríasparticulares,susenergíasasociadas
la
y otraspropiedades
estáticas. Campo de fuerzas ,
El campo de fuerzas es el ajuste empírico a la superficie de energía potencial y
está integrado tanto por
la serie de ecuaciones que describen
interaccionesmoleculares,como
de parámetros que resultandel
porelconjunto
ajuste a la superficiedeenergíapotencial(Ermer, de fuerzasempleadoscomúnmentepara
las diferentes
1976; Hagler, 1985). Los campos
la descripción de las moléculas,emplean
una combinación de coordenadas internas (distancias
y ángulos d e enlace, torsiones
y distorsión en centros de inversión) para describir
la contribución de las
interacciones covalentes a la superficie de energía potencial. Además, estos campos utilizan las distanciasinteratómicas
para estimarlasinteracciones
van der Waals,
electrostáticasy de puentes de hidrógeno. Laforma de las funciones es muy variable, y van desde simples ecuaciones cuadráticas hasta funciones
deFourier
y potencialesLennard-Jones,entreotras.
fuerzas esdescribir,conprecisiónrazonable,
El objetivode
a unagrancantidad
diferentes. De esta manera, el campo de fuerzas interpola información de
un
un campo de de moléculas
y extrapola a partir de la
pequeño conjunto moléculas de empleadas para su
parametrización,hacia un conjuntomayordeestructuras Cabe señalar que en
de Morse, expansiones
y moléculasrelacionadas.
un campo de fuerzas, tanto la forma de las funciones, como los
parámetrosen sí mismos,representan la únicagranaproximaciónenelmodelado molecular. La calidaddelcampodefuerzas,suaplicabilidad predecir las propiedadesestimadasen
y su habilidad para
la simulación,determinadirectamente
la
validez de los resultados. La partefundamentalde
un programa de simulaciónmolecular es elcálculo
de la energía potencial para una determinada distribución espacial d e los átomos. El
14
a las coordenadas
dlculo de esta energía, junto con sus derivadas respecto
atómicas, aporta la información necesaria para la representación de los movimientos atómicos reales. Existendiferentescampos
de fuerzasque se empleancomúnmentepara
la
simulación de una grancantidaddemoléculastantoorgánicascomoinorgánicas. Entreellosdestacan:Dreiding-//(Mayo ef a/., 1990), AMB€R (Wiener et a/., 1984; 1986), CVFFy CFf9l (Biosym Technologies, 1993) y C H A R " (Brooks ef a/., 1983).
Como se había mencionado, las coordenadasreales moléculacombinadasconelcampodefuerzas,describen potencial a travésde
de los átomosde una la superficiedeenergía
una expresióngeneralqueconsidera
las contribuciones de
interacciones enlazadas (ocovalentes)y no enlazadas de la siguiente manera: Epotencial
=
Ecovalente + E n 0 covalente
(7)
donde:
Eno-covalente= EvdW + ECoulomb (5)
(6)
+
Ep-hidrógeno
(9
(7)
La expresiónmatemática para los términos de las ecuaciones (8) y (9) está
determinadaporelcampodeFuerzasespecífico
que se utilice. En este trabajo se
empleó el campo de fuerzas Dreiding-//que forma parte del programa molecular BIOCRAF, y enelque
de simulación
se definen las contribuciones a la energía potencial
de la siguiente forma:
15
En las expresiones anteriores los términos ( 1 ) a (4) representan la energía de deformación de lasdistancias y ángulosdeenlace (R y e), ángulos de torsión o diedros (cp) einteraccionesfueradelplano
o deinversión (a),respectivamente. Los
términos (S) a (7) corresponden a interacciones entre átomos no enlazados: van der Waals, representadaporunafuncióntipoLennard-Jones
12-6; unarepresentación
coulómbica de las interacciones electrostáticas (donde la constante dieléctrica,
la distanciaentre
dependientede
E,
las cargaseléctricasparasimularelefecto
es de
apantallamientodelsolvente) y finalmente, un terminoexpiícitopararepresentar
a
las interaccionesporpuentesdehidrógeno,tambiénconunafuncióntipoLennard-
Jones pero con exponentes 12-1 O. Todas las constantes presentes forman parte de la parametrización del campo de fuerzas. La figura 2-1 muestra esquemáticamente las interacciones atómicas consideradas porla generalidad de los campos de berzas. Minimización de ener-íao mecánica molecular
U n métododegran
utilidad paraexplorar la superficie deenergíapotencial
consiste en encontrar conformaciones que sean puntos estables sobre
esa superficie.
La minimizacióntienecomoobjetivoprimordial,eldeterminarunaconfiguración espacialen
la que la fuerzanetasobrecadaátomo
sea cercana a cero. De esta
manera, las conformacionesestablespuedendeterminarsesimplementellevando valor mínimo
la energía del sistema.
problemas al realizar
al
Sin embargo se presenta una serie de
esta tarea, sobre todo en el caso
macromoléculas, ya quegeneralmenteexistenvariosmínimosen
de proteínas y otras la superficie de
energía potencial donde las fuerzas sobre cada átomo son cercanas a cero, por lo que
la identificación del mínimo global no resulta trivial. Por otra parte, aunque teóricamenteesfácildeterminar la convergenciadelproceso,en la práctica se dificulta su identificación,debido a queelmétodoaproximaasintóticamente la
16
c +c.
+c
+c Figura 2-1. Rcprescntación grifica dc los ldrminos dc las ccrtacioncs (10) y (11). Las contribuciorm a la cncrgíapolcncial qttc sc inclrt!w SOH: 1 ) distancia deenlacc; 2) ingulo de enlace; 3 ) lorsioncs o ingulos dicdros: 4) intcraccioncs h c r a dcl plano o inversioncs; 5)-7) inlcraccioucs W I I dcr Waals. corllótnbicas y dc pucnlcs dc hidrógcno.
energía del sistema a su valor mínimo, y el usuario debe decidir en qué momento se está ya suficientemente cerca de este punto. La minimización de una molécula se realiza en dos etapas; primero se evalúa
la expresión de energíacomoFuncióndelascoordenadaspara
inicialdada, y despuésseajustaesaconformación alcance sumenorvalor.Estemínimode
una conformación
de tal maneraque
la energía una o en
energía,puedeencontrarseen
varias iteraciones (que pueden llegar a ser de cientos), dependiendo de la naturaleza del algoritmo de minimización, de la forma de la ecuación que expresa la energía
y,
del tamaño de la molécula. La eficiencia del proceso de minimización se juzga tanto por el tiempo requerido
para evaluar la Función de energía, como por el número de
ajustes estructurales o iteraciones necesarias para converger a un mínimo. La mayoría de los algoritmos de minimización, asumen
que la superficie de potencial es
aproximadamentearmónica,yaqueaún
las superficiesanarmónicassondescritas convenientementeen el límitedeconvergenciaenelmínimo.Dadaunaecuación que describe la superficie de energía para un sistema y un punto de inicio sobre ella (conformación inicial), los métodosdeminimizacióndebendeterminar la dirección haciaelmínimo
y la distanciaque
lo separadeél.
Una direcciónrazonable
para
iniciarel dlculo, es simplemente la queproduceelmayorcambiode
la funciónen
ese punto. Los algoritmosmáscomunesdeminimización,enorden
deeficiencia,
son: búsqueda lineal, máximos Raphson(BiosymTechnologies,
descensos, gradientes conjugados
y Newton-
1993). En este trabajo se utilizóelmétodo
gradientes conjugados debido a que es elmáseficiente algoritmodeNewton-Raphsonrequiereunacantidad
de
a nuestro alcance, pues el
de memoriaque
excede la
capacidad de cualquier computadora actual en el caso de macromoléculas. Gradientes conjugdos
Este método utiliza
un algoritmo que produce una base completa de
direccionesmutuamenteconjugadas,
de talformaquecada
paso sucesivorefina continuamente la direccióndebúsquedahaciaelmínimodeenergía. El algoritmo principia con la determinación de la dirección de máximo cambio de la superficie de energía, ho, igualándolocon la derivada o gradiente, go, en un puntodeinicio cualquiera. En esa dirección busca iterativamente la conformación de mínima energía, y actualiza las coordenadas a ese punto. Las direccionessiguientes, hi+l, son calculadas a través de la fórmula:
17
donde gi+l es el gradiente en los puntos sucesivos,y y¡ es un escalar definido como:
Todos los cálculosdeminimizacióndeenergía
de este trabajo, se realizaron
con las opcionesdemecánicamoleculardelprograma convergencia utilizado consistió en que
BIOCRAF. El criteriode
la magnitud del gradiente de energía entre
dos etapas consecutivas de cálculo, Fuese menor o igual a 2 kcal mo/-l/f-l.
Dinámica molecular La dinámica molecular resuelve las ecuaciones del movimiento para sistemas atómicos, lo cual se traduce como la representación de la evolución en el tiempo de los movimientos moleculares (también llamada trayectoria). Esta técnica permite
a la
molécularemontarmáximosdeenergíaparaexplorarmúltiplesconformaciones estables(mínimoslocalesde
la superficiedepotencial).
La dependenciaconel tiempo es simultáneamente la fortaleza y la debilidad de este método, ya que sólo puedensimularsedemanerapráctica,trayectoriasdelordende 1 0-l2 a segundos (de picosegundos a nanosegundos). Como se había mencionado previamente, en la metodología de simulación de la dinámica molecular se resuelve la ecuacióndelmovimientodeNewton
para cadaátomodelsistema:
donde Fi es la fuerzaqueactúasobreeli-ésimo
átomo, mi sumasa
Fi
=
mi+,
y ai su
aceleración. El cálculode
la fuerza,necesario para resolverestaecuación,puede obtenersedirectamentede la derivadade la energíapotencial E respecto a las coordenadas ri; estaes la razón deexpresar a la energíapotencialenunaforma analítica y diferenciable:
En principio,con una expresiónadecuadade
masas conocidas de todos
la energíapotencial
los átomos, sería posible resolver
(14) paracalcularfuturasposicionesatómicaseneltiempo
y con las
la ecuacióndiferencial (esto es, determinar la
trayectoria). Desafortunadamente,la física clásica sólo proporciona soluciones exactas
18
a esta ecuación para sistemas de 1 ó 2 partículasindependientes. La resolución de
sistemas mayores requiere el empleo de métodos numéricos, que aportan soluciones aproximadas.
El movimiento de un átomo particular puede expresarse mediante su de Taylor. Si la posición al tiempo t es r(t), la posición desarrolloenunaserie después de un pequeño intervalo de tiempo At será:
+ ... r(t+At)= r(t) + (&/&).At+ (iS2r/6t2).At2/2
(15)
La soluciónnuméricade las ecuacionesdelmovimientodependededos gruposdefactores: a) elconocimiento de la posición r(t), la velocidad 6r/6t y la aceleración &/at2 y b) la aproximación que omite a 10stérminos de orden superior. Las coordenadasiniciales se obtienengeneralmentedeestructurascristalográficas, mientras que las velocidades iniciales son asignadas al azar siguiendo la distribución de Maxwell-Boltzmann que corresponda a la temperatura de interés en la simulación (normalmente 300 K). Una vez resuelta la ecuación ( I S ) , las coordenadas originales se reemplazan por nuevas y las velocidades se actualizandividiendoelcambiode posicióndecadaátomo por elincrementodetiempo At; la aceleración se corrige calculando los gradientes 6E/6ricon las nuevas coordenadas. Un ciclo se completa al realizar estos cálculos para todos los átomos constituyentes de la molécula, y este proceso se repitemiles
o quizá, millonesdeveces
para efectuar la simulación
dinAmica del sistema. Método de Verlet
El algoritmousado
por BIOCRAF para resolverlasecuacionesdiferenciales
( I S ) , es el propuesto originalmente
por Verlet ( 1 967),y que se describirá
brevemente a continuación. Si Vprom es la velocidad promedio durante el intervalo de tiempo transcurrido
entre t y (t+At), entoncesla posición al final del periodo será: r(t+At)= r(t) + Vprom.At
19
Si se supone que la velocidad cambia linealmente durante At, entonces la velocidad promedio puede igualarse a la velocidad instantánea en At/2: Vprom
=
V(t + At/2)
Por otra parte, la velocidad instantánea puede ser calculada de la aceleración promedio desde (t -At/2) hasta (t + At/2): .At V(t + At/2) = V(t - At/2) + aprom Si nuevamente se suponeque
(18)
la aceleración es aproximadamente lineal en el
intervalo de tiempodescrito,entonces
la aceleraciónpromediopuedeestimarse
como su valor instantáneo e n el tiempo t:
Lo anterior conduce a la siguiente expresión para la velocidad: V(t + At/2) = V(t - At/2) + a(t).At AI combinar las ecuaciones (16) y (17) s e obtiene una ecuación similarpara
actualización de las coordenadas,donde
V(t
+
(20) la
At/2) se conoce a través de la
ecuación (20): r(t + At) = r(t) + V(t + At/2).At
(21)
las posicionesatómicas se calculan alfinal de cada incremento de tiempo, mientras que las velocidades se actualizan a la mitad del intervalo (At/2). Cada ciclo que estima las nuevas coordenadas en el tiempo consta de: a) el dlculo de la aceleración, (-l/mi).6E/6ri(t),al tiempo t, b) la actualización de la velocidad al tiempo (t + At/2), a partir de su valor en el instante (t - At/2) con la ecuación (20)y c) la estimación de las coordenadas para el tiempo (t + At) usando su Puede observarseque
valor al tiempo t y la ecuación (21).
20
Un parámetroclaveenelalgoritmo
de Verlet es elvalorasignado
al At.
Obviamente para optimizar los recursos de cómputo conviene emplear el valor más alto del incremento de tiempo. Sin embargo,existenlímitesfundamentalespara usodeintervalos
de tiempograndes. La principallimitaciónson
el
los movimientos
moleculares de la mayor frecuencia a ser simulados. Las vibraciones rápidas implican cambiosabruptosdevelocidad divididoen
y aceleración. Un periodovibracional
debeser
al menos 5 ó 10 segmentos para satisfacer la suposición de Verlet
respecto a que las velocidades y aceleraciones sean lineales a lo largo del periodo de integración. Se conoce que l a s frecuencias de vibración más altas corresponden
a la
distorsión de la longitud de enlaces que involucran átomos ligeros; en nuestro caso la vibración más alta se espera para los enlaces entre átomos de carbono e hidrógeno (C-H), cuyoperiodo es delordende
segundos. Por lo tantoen
este trabajo se
utilizó un At de 1 O"5 segundos (1 k). Otroconceptofundamentalen
las simulaciones de dinámica molecular
es el
de la temperatura. Básicamente, la temperatura es proporcional a la energía cinética
de la molécula, lo cual puede expresarse más convenientemente en términos de las velocidadesatómicas. La relaciónentretemperatura
y velocidad de un sistema se
encuentra a través de la Teoría Cinética de los Gases, con la ecuación de MaxwellBoltzmann: (22)
f(v)6v = (m/2?c1
>
>
>
W
u
> I- I-
u
W
W
m
6
v, 1
-I
w
" I
1
l4 - z c3 c3 tI-
H
bL z
bL z
H
H
c3
c3
n c3
n c3
o L L
->
c3
c3 -0
LL
LL >-
>-u
6
>
1
v,
v,
LL
LL
6
6
o
o
3
o
m -4
c3
c3
u
"U
c3 v,
-0
> >
-1
m
-1
n
6
6
I - I -
6 z
bL - z
n
u -1
>
" I" I
-m
6
bL bL
1L L z -v,
CY CY
W
= -4 >
c3 -I-
n -H
z -m W -
n
U
n
>
>
c 3 -
9
CY
-I -t
6 z 6 -
6
E O
O
6
Q
6 n O
H
U
6 U
'+.I
W
O
O
6
n
n O
H
CY3 n U
&
v, * -Ic3 c3
t
4
z
. Q I-. I-. W
'H
W
z -o z z n -m u -a
3
n
CY
W
>
-2
3
c3
6 CY
u
>
-m
LL
n
-z
n
z
LL
u
>
c3 [ I
> > > v, >
c3
o
v,
z
U
W
v,
a
v,
LL -c3 -6
3
m
c3 c3 n -u
U
n Q CY LL c3 c3
6 -"I-
u
LL
n
" I
6
I
hL
I- Ic3
c3
>
I- I-
-1
LL
W
>
>
w -n
c3
W
I
o
M -> H
4
I
n
W
>"I
>
6 a
6
W
Q
E
d
O
I-
O
crc
n
4 z
z
'U
fi O 2E
H
3
U
t
6
'H
-
W
4 n
E
6
O
IO
e Q
Q
O
E
H
3
U
número limitado de residuos. En esta reorientación se buscó disminuir los contactos van der Waals entre la nuevacadenalateral y el resto de realizadoenotrostrabajos
de modeladomolecular
la estructura, como se ha
(Blundell, 1991; Srinivasan,
1993), a fin de evitar tensiones excesivas antes de intentarla regularización global de la geometríaporminimiucióndeenergía.
los mayores problemas de compatibilidadentre la proteinasa SZ y la nuevaestructuragenerada durante el proceso de sustitución de las cadenas laterales fueron: SerW+Lys, Val100 +Lys, IlelO4+Lys y Val1 10+Tyr. En todos estos casos los residuos se encontraban en zonasdecadenaaleatoria
Los sitiosquepresentaron
y sólo fuenecesarioreorientar
las nuevascadenas
laterales al exterior de la proteína. b) Minimizdción de Energía.
Conelpropósitodedisminuir
la tensiónprovocada por interacciones de alta
energía en la molécula, se procedió a minimizar la energía potencial de través de una seriedeetapasdemecánicamolecular.
Se sabe que,
la misma a
en general, la
sustituciónderesiduossobreunaestructuratridimensionaldadageneratensiones a problemas de estericidad,
locales debido
y que en
estas condiciones
una
minimizaciónglobal sólo propagaría las distorsiones de los sitios de mayor tensión hacia el resto
de la molécula.Por esto, resulta recomendable identificar y minimizar
a cualquierprocesoderelajamientomasivo.Cuando se emplea BIOGRAF para realizar mutaciones sobre cadenas polipeptídicas, los residuos de prolina involucrados (tanto para la susitución Pro+Xaa comopara XaajPro) son esasregionespreviamente
los másnotablesencuanto la creacióndetensionespuntuales. De esta manera se los residuosPro68+Gln,Pro69+Thr, efectuaronminimizacionesindividualespara GlylOl+Pro, Glnl14+Pro,
Pro1 15+Ser, Thrl83+Pro, Prol97+Ser
y Proí!Ol+Gln,
mediante la relajación de sus cadenas laterales, seguida de la minimización de todos
los átomos del residuo y, finalmente, de la regularización del residuo completo junto concuatrovecinosensecuencia(dosprevios requirieron entre
y dosposteriores). En cadacaso se
100 y 200 iteraciones para alcanzar un mínimo de energía
potencial.
La siguienteetapaconsistió en la minimiuciónsimultánea de todas las cadenaslaterales,manteniendo fijas las posiciones de los átomosde la cadena principal y de las 134 moléculasdeaguaquepertenecían a la proteinasa R. Esto permitióque las cadenaslateralespudieranreorganizarseenergéticamente e n el
28
espacio, sinmodificar
la topologíade
a estaetapa
la estructura de base.Previos
las coordenadascristalográficas de la proteinasa i2 nocubrían los requisitos del formato PDB y h e necesario editar el archivo de 2198 átomos para establecer todos los dobles enlaces presentes, así como cambiar el tipo de átomo de los nitrógenos en los grupos amino de la cadena principal y modificar el residuo carboxilo terminal de la proteína. Además se presentaron traslapes entre las cadenas laterales de la Tyr93 y delAsn 173 con dos moléculas de agua, por lo que éstas tuvieronqueserremovidasdelsistema. Una vezrealizadastodasestas modificaciones, se sometió la estructura a 100 etapas de minimización, con lo que la energía potencial disminuyó de 6861 a 838.5 kcnl/mo/.
ocurrieronalgunosimprevistos:
la estructura h e el incluir a las
El paso siguiente en la minimizaciónde
moléculas de agua en el conjunto de átomos móviles que comprendía laterales. Este proceso llevó
a las cadenas
a la energía potencial de un valorinicialde
-364.8 kcal/mol en 210 etapasdeminimización.Finalmente,
1358 hasta
se procedió a la
a la totalidad de los átomosde la molécula. En este caso 210 etapasdeminimizacióncondujeron a la energía potencial de 396.4 hasta un valor de -1429 kcn//mo/. minimiuciónglobal,permitiendolibertaddemovimiento
c) Convergencia hacia /a conformación de equilibrio. La primera etapa en
la simulación de
quimopapaínainvolucróelmodeladode
la dinámica molecular
de la
los dos últimos residuos de esta proteína,
debido a quecomo semencionó,fueronadicionadosenausenciadeaminoAcidos topológicamente equivalentes en la estructura de base. En este proceso se permitió
a los cincoúltimosresiduosde la cadenapolipeptídica (Phe214, Lys215, Gly216, Phe217y Ala2 18) y también a sus átomos vecinos en un radio de 5 A. Estadinámica se realizóconunaprimerasimulación de 150 ps a la temperatura de 300 K,seguida de la remoción de 8 de las 10 moléculas de agua incluidas en la región de átomos móviles (lo cual permitió la interacción de los residuos 21 7 y 218 con el resto de la proteína),y de una minimización de energía. Finalmente, se simuló elmovimiento
una nueva dinámica molecular de esta zona, también de Un procesodeminimizaciónde
150 ps a 300 K.
la quimopapaínaprecedió
a la dinámica
molecular global de la estructura, simulada en condiciones de temperatura de durante 60 ps. AI confórmero de menor energía
300 K
en la trayectoria calculada en esta
29
etapa, se le aplicó una nueva minimización de energía de 60 etapas, lográndose las energlaspotencialesmásbajashasta este puntodelmodelado. Sin embargo, al analizar la estereoquímica de este confórmero, se detectaron los carbonos a de seis residuos e n configuración D y dos enlaces peptídicos en conformación cís. Antes de pasar a la siguiente etapa de dinámica molecular,
se corrigieron todas estas
a la Pro1 51 que se mantuvo en conformación cis, por ser éSta una característica común observada en las proteasas sulfhidrílicas vegetales cristalizadas. Además, se removieron seis moléculas de aguadebido a queespontáneamentesesepararondelresto del sistema(evaporación)duranteelprocesodesimulacióndinámica. La estructura resultante he sometida a un nuevo cálculo de minimización de energía, y después a una dinámica molecular de 40 ps. De los confórmeros obtenidos en este cálculo, se seleccionó eldemenorenergíapotencial, y sobre éI se definierondemanera del enlace peptídico previo
anomalías geométricas, con excepción
explícita la totalidadde los átomosdehidrógeno
(1230) delsistemamolecularen
estudio. La estructura resultante mostró todos sus residuos en conformación presencia minimizada para regularizar la geometría en agregados(hidrógenos).Posteriormente,
L y he
de los nuevos átomos
se realizarondosprocesosdedindmica
molecular, de 35 y 105 ps, separados por una nueva minimización de energía. De la dinámica de 105 p s se eligieron a los tresconfórmerosquemostraron energíapotencialdelconjunto;éstosfueronminimizados ellos se seleccionó a la geometríademás estructuratridimensionalde
la menor
y, finalmente,deentre
baja energía para representar a la
la quimopapaína. En la figura 3-5 se esquematiza la
naturaleza flexible del modelo obtenido, a través de la superposición de las cadenas a de los diferentes confórmeros obtenidas de la simulación de su dinámica molecular
de 105 ps. Es conveniente señalar que para generar cada una de las estructuras que 6000 conformaciones aparecen en esta figura 3-5, elprogramacalculóenrealidad intermedias, para las quefuenecesarioevaluarcadavez las interacciones entre 10s 3645 átomos del sistema.
Las coordenadas del modelo
de la quimopapaína
obtenidas después de esta larga serie de etapas, fueron interpretadas
por el sistema
de despliegue gráfico del paquete de cómputoBIOGRAF, como se ilustra en la figura 3-6. Evaluación d e la calidad estereoquímica del modelo
En un estudiosobremásde
400 proteínasconestructuratridimensional
conocida, Morris ef a/., ( 1 992) obtuvieron las tendencias conformacionales generales
30
queseguía la geometríade las proteínasconsideradas y la correlaciónquepodía establecerse entre esta geometría,la resolución y el factor X cristalográfico para cada proteína del conjunto estudiado. Entre sus resultados más importantes, estos investigadores definieron tres zonas de incidencia sobre un mapa de Ramachandran que incluye a los 121,870 residuos de aminoácido de 462 proteínas y donde se han obviado a los residuosdeprolina
y glicina. Las zonas se distinguen entre sí por la
densidad de residuosregistrada
en cadaunadeellas
y sonclasificadascomo
regiones nucleares (C),observadas (G)y permitidas (A)o también de alta, media y escasa densidad de población, respectivamente (Fig. 3-7). Respecto a la correlación entre la geometría, la resolución y el factor
R de las proteínas analizadas, Morris et a/.
(1992), encontraronqueaquellasestructurasdeterminadasconbuenaresolución
y
con factores X pequeños, presentaban un alto porcentaje de sus residuos dentro de
las zonas nucleares e n el mapa de Ramachandran (Fig. 3-8). El trabajo citado también los valoresdealgunos incluye la determinacióndeintervalosdeconfianzapara elementos geométricos, que deben observados ser por las estructuras tridimensionales de alta resolución. Estos elementos comprenden: ángulos diedros 0 y Y de residuos que forman parte de hélices en
la proteína; ángulos X3 de puentes
disulfuro; ángulos 0 en prolinas; ángulos o de todos los residuos del polipéptido; la quiralidadde los carbonos a y de las cadenas laterales de residuos de Thr e Ile; la conformaciónde los enlacespeptídicos e incluso, los valoresdeenergíapromedio que pueden adquirir las interacciones de puentes de hidrógeno e n el afinamiento de estructurascristalográficas (Tabla 3-11). El trabajo de Morris et a/. (1992) es tan completo, que actualmente se utilizan sus criterios para la aceptación de estructuras tridimensionalesen
las basesdelBancodeDatosCristalográficos
de Proteínas
(Brookhaven National Laboratory, 1992). de Para la evaluación
la calidad estereoquímica del modelo
quimopapaínapropuestoenelpresentetrabajo,
de la
sesometió la estructura deesta
proteína al juicio de los criteriosdel PDB mencionadosen el párrafoanterior, y los resultados obtenidosse detallan a continuación. Del total de los 178 residuos que contiene la quimopapaína al excluir prolinas y glicinas,el 70% de las parejasdeángulos Q, y Y se encontrarondentrode las zonas o regiones nucleares según
se muestra en el mapa
de Ramachandran
construido para la quimopapaínaen
la figura 3-9. De acuerdoconMorris
ef a/.
31
-90
+90
! +90
-90
Figura 3-7. Regiones nuclear(C), observada (G) y permitida (A) sobre la densidad de puntos en el mapa de Ramach,andran de 121,870 residuos, de acuerdo con Morriset al. (1992).
n
L
I
O CD
C
O
i
C
-2
. m
>
U
4
r n 4
LL
.
4
L
-
150
100
50
H
tTJ
CL
O
-50
-100
-150
-150
-100
-50
O
50
100
150
F'I
Figura 3-9. Mapa de Ramachandran para el modelo de la quimopapaína. Las líneas continuas delimitan las regiones nuclearesde la figura 3-7. Los residuos de prolinay glicina estzín identificados por O y&, respectivamente.
(1992),este porcentaje de residuoscorresponde a unaresoluciónde 2.9 A y a un factor R d e 0.28 en estructuras de proteínas obtenidas cristalográficamente (Fig. 3-8). Paraevaluar la posicióndel 30% deresiduosexternos a las zonasnucleares, se representaron las regiones observadasy permitidas de Morris ef a/. sobre el mapa de Ramachandran del modelo de la quimopapaína y se encontró que excepto por cuatro los residuos de la proteína aminoácidos, las regionesobservadascubríaneltotalde (Fig. 3-10). Es importante señalar que los cuatro aminoácidos no considerados en las regiones observadas heron la AIa90, la Asnl16 y la Ser200 que se encuentranen cadena aleatoria, mientras que la Ala97 aparece al inicio de una hélice pequeña en el primer dominio de la quimopapaína.
rARL4 3-11 Valores de los parámetros estereoquímicos para estructuras cristalográficas de alta resoluclón. 0
AnguIos 90%
AnguIo X3 e n puentes S-S Izquierdos Derechos
.85.8 k 10.7" 96.8 k 14.8"
0
Angulo Q, enprolinas
-65.8 k 1 1.2"
0
Angulos helicoidales
0
a, Y
-65.3 k11.9' -39.4 k11.3"
Enerzía de puentes de hidrógeno
0
Conformación trans
Enlaces peptídicos Residuos Los 6ngulosdiedros
-2.03 k 0.75 lccn//mol Isómeros L
X3
de los trespuentesdisulfuroen
quimopapaína se encontraron dentro
de los límites fijados
la molécula de
por el criterio de
evaluaciónestereoquímico. Los valoresnuméricosde estosángulosdiedrosson: -100.06" paraelenlacedisulhroformadoentre los residuosdecisteína 22 y 63;
91.04" paraelque
se encuentraentre las cisteínas 56 y 95; y finalmente -77.80"
entre los residuos 153y 204.
32
150
100
50
H
O
m
IL
-50
-100
.. -
-150 1
-150
-100
-50
I
I
1
I
O
50
100
150
FI Figura 3-10. Regiones nucleares y observadas de Morris et al. (1992) sobre el mapa de Ramachandran d e l modelo de la quirnopapaína, donde se han obviado los residuos de glicina y prolina, y se han identificado los cuatro residuos que aparecen fuera de las zonas observadas.
Respecto a los ángulos diedros 0 de los residuos de prolina en el modelo de la quimopapaína, el 80% incidedentrode
los intervalos establecidos por el criterio
de evaluación y el resto se encuentra desviado en todos
los miembros de la familia
de las PSV con estructura tridimensional conocida.
Delanálisis
geométrico delmodelo
de la quimopapaína se determinóque
todos los ángulos o se encuentranenconformación
trans a excepcióndelenlace
peptídicoprevio a la Pro151, que es un residuocompletamenteconservadoen
la
familia a la que pertenece la quimopapaína y que se encuentra en conformación
cis
entodos los casos conocidos, como ya se habíamencionado.Tambiéndelanálisis geométrico,seconoce quetodos los carbonos a de la cadenaprincipal de la proteínapresentanelisómero
L
y que las cadenaslaterales
de las treoninas e
isoleucinas de la cadenapolipeptídicacumplenconlaquiralidadobservadaen
los aminoácidos naturales (Morris et d., 1992). El hecho de que todos los residuos de la quimopapaína hayan conservado la configuración L durante las últimasetapasde la dinámicamolecular, esde la mayor importancia en el caso de unaestructura la proteína modelada, ya quecualquierinconsistenicageométricaenelinteriorde podría haber ocasionado la inversión de algunos centros quirales durante la simulación. Debido a que cualquier cálculo de energía depende del programa específico que se emplee para afinar unaestructuracristalográfica,elvalornuméricode interacciónque
se proponeenelcriterioestereoquímico
la
para los puentesde
hidrógeno, no resulta comparable directamente con la energía que se calcula para la estructuramodeladade procesode
un
la quimopapaína. Demaneraquefueprecisorealizar
minimizacióndeenergíaqueinvolucrara
programa de mecánicamolecularempleadoenelcasode
por una parte, el mismo la quimopapaína, y por
otra, a las proteasassulfhidrílicasvegetalescuyasestructurastridimensionales
se
encuentranalmacenadasenelBancodeDatosCristalográficos d e Proteínas. Se decidió así trabajar con las estructuras de papaína, actinidinay proteinasa SZ , después deagregar a estasestructurastodoslosátomosnecesarios(átomosdehidrógeno quenoestánincluidosenlosarchivoscristalográficosdel
PDB) para los cálculos
energéticos de puentes de hidrógeno. El resultado numérico de la energía promedio para estasinteracciones,enlastresproteasasarribamencionadas,presentauna
33
desviación menor al 1 .S% respecto a su valor medio (-6.45 kal/mol). Para el caso de
la quimopapaína, la energía por puentes de hidrógeno se encuentra a sólo 1.1% del valor medio observado en PSV, lo cual permite considerar satisfactoria la geometría de los puentes de hidrógeno presentes en el modelo generado, pues la desviación del valor medio para estas interaciones, encontrada por Morris et a/., es de 37% en estructuras cristalográficas de alta resolución. Todos los resultadosde la evaluacióndelascaracterísticasgeométricasdel modelode la quimopapaínacon
los estándaresempleados para juzgar la calidad
estereoquímica en proteínas caracterizadas
por difracción de
rayos X, que se
presentan en la Tabla 3-111, permiten considerar al modelo propuesto en este trabajo como estructura una cubre que satisfactoriamente
los
requerimientos
de buena resolución a los de una proteína
tridimensionales correspondientes cristalogrAfica. -
r + v w3-1II
Análisis estereoquímico del modela d e la quimopapaína Cumple
N o cumple
YO
124
54
70
Angulos X3 en disulhros
3
O
1 O0
Angulo Q, en prolinas
11
Angulos helicoidales
54
Residuos con ángulos 0 y Y en
las zonas nucleares
Enlaces peptídicos trans Residuos en configuración L
216 I
21 8
Energía de puentes de hidrógeno 0
0
(ka//mol)
-6.38 -6.37 -6.47 -6.52
Quimopapaína Papaina Actinidina Proteinasa R
Resolución
2.9
Factor R
0.28
A
34
Análisis d e la estructura del modelo d e la quimopapaina
De la revisión del modelo propuesto para la quimopapaína se puede apreciar que la arquitectura cumple las características generales observadas en proteínas. Esto es, la mayorparte de suscadenaslateraleshidrofóbicas
se encuentrandirigidas al
interior de la molécula, mientras las hidrofilicas se localizan fundamentalmente en la superficie (Fig. 3-1 1). Adicionalmente, el modelo resultó ser consistente con algunos resultadosexperimentalesquereflejandirectamenteciertascaracterísticasde
la
estructura tridimensional de esta proteína, como son:el ambiente polar del triptofano 181 (Dubois et a/., 1988b); la exposición al disolvente de la cisteína 1 17 (Watson et a/., 1990) que se observa en
la figura 3-1 2; la distanciamayor de 20 A entre ese residuo y la otra cisteína libre en la molécula (Topham et a/., 1990a); y la semejanza de regiones interdominio (0alter 8, Drenth, 1987; Fig. 3-1 3) y de la geometfía del
sitio activo (Carey et a/., 1983) con los otros miembros de las PSV. Respecto a este último punto,
la Tabla 3-1V muestra comparativamente algunos valores
de
parámetros geométricos entre las cadenas laterales de los residuos del sitio activo, determinados en el modelo de
la quimopapaína y en las estructuras cristalográficas
de las tres proteasas caracterizadas.
En la parte superior de la figura 3-14, se puede observar la representación del subsitio S2 de las PSV (según la numeración depapaína),
los residuos del sitio
catalítico y también un fragmentodelsustratoenelque
se indicaelenlace
hidrolizar
(p). En
la parteinferiorde
la mismafigura
a
se apreciaelalineamiento
múltiple de las secuencias de seis de estas proteasas. Se han señalado con asteriscos las posicionescompletamenteconservadasen
la familia y conpuntosaquellos
aminoácidos que presentan características similares en sus cadenas laterales. También se han marcado los residuos correspondientes al subsitio S2 triada catalítica
(#). Se aprecia que,
a excepciónde
(0)
y los de la
la lisina que aparece en
bromelaína de talloen la posición 175, todos los miembros de la familiamantienen del sitio activo (Cys, His conservados los residuos sorprendenteelcasodelaminoácido propuesto la existenciade
y Asn). Es de tal manera
175 en la bromelaína,queincluso
se ha
un error (Topham et a/., 199015)en la secuencia de
aminoácidos de esta enzima queha sido reportada por Ritonja et a/. ( 1 989a).
35
9
i
b
-
Figura 3-11. Residrtos hidrofóbicos (a) e hidrofilicos (b) en el modelo de la quimopapaína. La línea continua representa la cadena cx de la proteína.
~~
Figura 3-12. Exposición de la cisteína 117 en el modelo de l a quinqxlpaína. Se presentan también los tres enlaces disulfuro y l a cisteína 25 del sitio activo.
GL*
$15.
54 -LPSYVDWRSAGAVVDIKSQGECGGCWAFSAIATVEGINKITSGSLISLSEQELI -1PEYVDWRQKGAVTPVKNQGSCGSCWAFSAVVTIEGIIKIRTGNLNEYSEQE~~ 54 54 P R O TO.M E G A LPENVDWRKKGAVTPVRHQGSCGSCWAFSAVATVEGINKIRTGKLVELSEQELV 54 PAP.PROT.IV -LPESVDWRAKGAVTPVKHQGYCESCWAFSTVATVEGINKIKTGNLVELSEQELV Q U I M O P A P A ~ N A- Y P Q S I D W R A K G A V T P V K N Q G A C G S C W A F S T I A T V E G I N K I V T G N ~ L E L S E Q E L V5 4 55V L BROMELAÍNA AVPQSIDWRDYGAVTSVKNQNPCGACWAFAAIATVESIYKIKKGILEPLSEQQ
ACTINIDINA
PAPAÍNA
~
*
.*** ***. _ . * * *..****.".
x**.*
**
*
* *
x**.*.
h 7 ,, ACTINIDINA PAPAÍNA P R OOTM. E G A PAP.PROT.IV QUIMOPAPAÍNA BROMELAÍNA
DCGRTQNTRGCDGGYITDGFQFIINDGGINTQENYPYTAQDGDCDVALQDQKYVT DCDR--RSYGCNGGYPWSALQLVAQYG-IHYRNTYPYEGVQRYCRSREKGPYAAK DCER--RSHGCKGGYPPYALEYVAKNG-IHLRSKYPYKAKQGTCRAKQVGGPIVK DCDL--QSYGCNRGYQSTSLQYVAQNG-IHLRAKYPYIAKQQTCRANQVGGPKVK DCDK- -HSYGCKGGYQTTSLQYVANNG-VHTSKVYPYQAKQYKCRATDKPGPKVK DCAK---GYGCKGGWEFRAFEFIISNKGVASGAIYPYKAAKGTCKTDGVPNSAY-
**.
. * * . *.
...
.
109 106 106 106 106 106
*** . . * 157,
.133
li,lCK)
ACTINIDINA
IDTYDNVPYNNEWALQTAVTYQPVSVALDAAGDAFKQYASGIFTGPCGTAVDHAI
PAPA~NA
TDGVRQVQPYNEGALLYSIANQPVSVVLEAAGKDFQLYRGGIFVGPCGNKVDHAV
164 161 P R OOTM. E G A TSGVGRVQPNNEGNLLNAIAKQPVSVVVESKGRPFQLYKGGIFEGPCGTKVDHAV 161 PAP.PROT.IV TNGVGRVQSNNEGSLLNAIAHQPVSVVVESAGRDFQNYKGGIFEGSCGTKVDHAV 161 QUIMOPAPAÍNA I T G Y K R V P S N C E T S F L G A L A N Q P L S V L V E A G G K P F Q L Y K S G V F D G P C G T K L D H A V1 6 1 BROMELAÍNA I T G Y A R V P R N N E S S M M Y A V S K Q P I T V A V D A N A N - F Q Y Y K S G V F N G P C G T S L N 1H6A0V
...
.*.
* ..
. . . **..* ...
. *. * . * . * *.**. ..**. 205,
,207
ACTINIDINA
VIVGYGTEGGVDYWIVKNSWDTTWGEEGYMRILRNVGGA-GTCGIATMPSYPVKYNN
PAPAÍNA
A A V G Y G P N - - - - Y I L I K N S W G T G W G E N G Y I R I K R G T G N S Y G V C G L Y T S S F Y P V K N - -212
220
P R OOTM . EGA T A V G Y G K S G G K G Y I L I K N S W G T A W G E K G Y I R I K R A P G N S P G V C G L Y K S S Y Y P T K N - - 216 PAP.PROT.IV TAVGYGKSGGKGYILIKNSWGPGWGENGYIRIRRASGNSPGVCGVYRSSYYPIKN-- 216 Q U I M O P A P A Í N AT A V G Y G T S D G K N Y I I I K N S W G P N W G E K G Y M R L K R Q S G N S Q G T C G V Y K S S Y Y P F K G F A2 1 8 B R O M E L A Í N AT A I G Y G Q D S - - - I I Y P K K W G A K W G E A G Y I R M A R D V S S S S G I C G I A I D P L Y P T L E E2 -1 2
. . *** .
.
. . * . . *** **.*. *
. . . *.**.
**
FiLwra 3-14. Residuos del sitio acti\.o (#) y del subsitio S2 (o) en PSV. segiln l a numeración de papaína, sobre el aliuealuieuto mílltiple de las proteasas completanlenle secuenciadasde l a familia. También se indica el enlace que sufre hidrólisis en el sustrato ( b y ) .
TABLA 3-IV Geometría del sitio activo en las PSV.
PAPAíNA
ACnNlDlNA
PROTEINA5A a
QUlMOPAPAíNA
a (A)
3.65
tJ(8)
2.77 7.25
3.30 2.79 6.99
3.91 2.72 7.36
3.91 4.64 6.96
116.01
71.22
117.44
87.05
134.19
60.03
124.15
97.68
c (A)
5N10 ("1 5N2O ("1
Comparación estructural del modelo con otros miembros de las PSV
De la figura 3-14, y siguiendo con la numeración de papaína,puede apreciarse también que la tirosina 67 se conserva en cinco de las proteasas, con la bromelaína nuevamente como la única excepción. La posición 68 muestra gran variabilidad e n la familia siendo un residuo no polar el que ocupa esta posición en los casos de actinidina, papaína y proteinasa i 2 ; polar en proteinasa IV y quimopapaína e incluso;cargadoeléctricamente
en la bromelaína. Por su parte, la posición 69
muestra también la sustitución de cadenas laterales con características
muy
diferentes; en tamaño, desde la pequeña serina hasta el triptofano, y en polaridad, desde la fenilalaninahasta la treonina. Las posiciones 133, 157 y 160 conservan la
36
naturaleza hidrofóbica de sus residuos, manteniendo completamente invariante a la alaninaen esta última posición. Finalmente, los residuos 205 y 207 en las proteasas analizadas presentan un gran carácter polar e hidrofóbico, respectivamente, excepto en el caso de la actinidina. A juzgar por la naturaleza de los residuos del subsitio 52, esta cavidad parece tener el mayor volumen en
esta última enzima, mientras que en
la bromelaína se distingue por la presencia de dos cargas negativas.
de la quimopapaína y de las estructuras
Mediante el uso del modelo
tridimensionales de actinidina, papaína y proteinasa R , se determinaron las áreas de las cadenas laterales de los residuos que conforman a los subsitios S2 en cada una de estasproteínas
y que se anotanen
representadaconpuntos,
la tabla 3-IV. La superficiedelsubsitio
se muestraen
la figura 3-15 para elmodelode
S2 la
quimopapaína.
Area de la superficie del subsitio 52
332.0 302.2 341.2 266.4
Quirnopapaína Actinidina Papaína Proteinasa il
Puedeapreciarsequelosvaloresobtenidosen
la tablaanterior,sonmuysimilares
entre sí y que el mayor volumen, esperado para la actinidina, no es evidente de este análisisdeáreassuperficiales.
Deaquí se hace patente la necesidad de estimar los
volúmenes libres del subsitio S2;un trabajo que no resulta
trivial, pues requiere entre
otras cosas, de la definición precisa y sistemática de los límites de estas regiones. El análisis del modelocontinuócon
la comparaciónde
las características
topológicasde los miembrosde la familiade las proteasassulfhidrílicasvegetales
la presencia,típicaen la familia, de dos dominios estructurales, y su cadena principal es muy semejante a la encontrada por Baker y Drenth ( 1 987) para papaína, arquetipo de las PSV (Fig. 3-16). Las estructuras de estas dos enzimas pueden superponerse fácilmente, aunque se observan pequeñas porciones de la cadena principal que divergen. Para ubicar esas zonas, se
caracterizadas. La quimopapaínamuestra
37
L
calculó la diferenciaenposiciónde
los carbonos a de la cadenaprincipalde
la
a la papaína, y tambiénrespecto a la proteinasa SZ. Esto último se realizóconel objetodeidentificarcualquierposibleinfluencia de la estructura de basesobre laconformación final delmodelo. Los resultadosseñalan (Fig. 3-17a) que la estructura obtenida para la quimopapaína es incluso, en algunas porciones de la molécula,máscercana a la papaínaque a la propiaproteinasa 0; esto es, no se observantendenciasgeométricas en elmodelo que indiquen la permanencia de la conformación de la estructura de base en la quimopapaína. Por su parte, es notable la gransimilitudenubicación y magnitudes relativas de las zonas
quimopapaínarespecto
de mayor variabilidad presentes en la figura 3 - l 7 a , con las desviaciones encontradas por Baker B Drenth (1987) en la posiciónde
la cadenaprincipal
de papaína y
a la molécula,desde el espacioconformacionalcorrespondiente a la estructurade la proteinasa R , hastaunaposiciónquereflejarazonablementeelcompromisode las actinidina (Fig. 3-17b). Este último resultado indica que el modelado logró llevar
interacciones que experimentan los grupos químicos enla quimopapaína. Un criterio adicional de comparación topológica consistió en el cálculo de las diferencias en los ángulos Q, y Y, entre el modelo, la papaína y la proteinasa S2 (Figs. 3-18 y 3-19). En estecaso
se observó la concordanciaexistenteentre
las regionesde
principalquevenalteradossusángulosdiedros posición de sus carbonos a. De esta manera,
la cadena y losquedivergenmásen la se tienen ya dos evidencias
independientesqueidentifican,enelmodelode
la quimopapaína,características
geométricas particulares que permiten su consideración como
una estructura
tridimensional más de la familia de las proteasas sulfhidrílicas vegetales. La figura 320 muestra la superposición de las cadenasprincipalesdetodas
las estructuras
conocidas de miembros de las PSV. Aplicaciones del modelo propuesto
En un estudioexperimentalrecientedonde dicroísmocircularsobrepapaína,quimopapaína
se aplica la espectroscopíade y proteinasa S2 (Solís-Mendiola et
ai., 1992), se advierte la existencia aparente deun diferente contenido de estructuras secundariasentreestastresproteasas, y se encuentra un contenidomayor de a enquimopapaína.Además,estosmismos residuosenconformacióndehélice autores indican que las variaciones en los espectros de dicroísmo circular sugieren la presencia de un patrón de doblado distinto para la quimopapaína respecto al que se ha encontrado para las otras dos enzimas estudiadas e incluso, la posibilidad de que
38
O
Sr
aJ
co
c3
O 0
-cv
i
O
co
O
00
O
O
00 I
O
co 7
I
L
O CD
7
O
03
O
O 00 I
O
CD 7
I
I
esta enzima pertenezca a una clase estructural diferente (alp,segmentos alternados de hélices a y hojas+). El hecho de que la quimopapaína pudiera tener un patrón de
dobladodistinto o pertenecer a una claseestructuraldiferente
a las otrasdos PSV
estudiadas, resulta inesperado dada la alta homología en secuencia existente entre estas proteínas (más del 50%) como se mencionóen ese trabajo. En un intento por explicar esta situación, se construyóla red de puentes de hidrógeno entrelos átomos de las cadenas principales de
las tres PSV consideradas,cuyosesquemasde conectividad se muestranen la figura 3-21. Estasrepresentaciones se basanen un estudio similar practicado sobre actinidina (Baker 8, Drenth, 1987) elcual se incluye también en la figura 3-21 citada, para su comparación. Los esquemas de puentes de hidrógeno definen claramente la extensión de cada una de las estructuras secundariaspresentesen las moléculas, y pueden dar una indicaciónde la clase estructural a la quepertenececadaproteína. La construcción deesta red de interacciones Fue posibleenquimopapaína sólo debido a que se contabacon un modelodesuestructuratridimensional,enelquepuedendefinirse los puentes de hidrógeno de la misma manera en que se efectúa sobre una estructura determinada que la cristalográficamente. Del análisis de esta información se haceevidente quimopapaína mantiene el patrón general de doblado presente en las PSV, y ademds conserva la clasificación estructural de la familia (a+P,regiones predominantemente helicoidales y zonasricasenhojas-Penporcionesseparadasde
la molécula). Es
interesante notar aquí, que la papaína posee un par de cadenas en conformación de hoja-p de menor longitud respecto a las otras PSV (que correspondea la inserción de cuatro residuos entre las posiciones 169 y 170 de papaína) y que todas las hojas p presentes en la familia son antiparalelas. Respecto al punto del diferente contenido en estructura secundaria particularmente a la mayorincidencia
y
en
de residuosenconformaciónhelicoidal
quimopapaína,en la figura 3-22 se presentaelalineamientode
las secuenciasde
esta enzima junto con las de la papaína y la proteinasa !2 y se señalan las diferentes estructurassecundariaspresentesencadaproteína.Estasestructurassecundarias fuerondeterminadastantoporelcriteriodepuentesdehidrógenocomo por el de ángulos Q, y Y. Es evidente la gran semejanza en localización y extensión de hélices a y de hojas+ en estastresproteasas,siendo
longitudde
las dosprimerashélices
la únicadiferencia
detectable la
(A y B). Deaquípuedeproponerse
contenidodeestructurasecundariaenestasenzimas,no
que el
es capazdeexplicar
39
N N
V
N
N
I
c
N
U
f
6
uW
4
Z
w
t-
O CLI a.
...
.
-
A
1
B
P A P A Í NA
IPEY~RQKGAVTPVKNQGSCGSCWAF~AWTIEGIIKIRTGNLNEYSEQELLD
55
PROT.OMEGA
LPEN~RKKGAVTPVRHQGSCGSCWAF~AVATVEGIN~I~TGKLVELSEQELVD
55
QUIMOPAPAÍNA
Y P Q S ~ R A K G A V T P V K N Q G A C G S ~ ~ S ~ ~ ~ E G I 55 N K I V
2
C P A P NAAÍ
CDRRSYGCNGGYPWSALQLVAQYGIHYRNTYPYEGVQRYCRSREKGPYAAKT~
110
PROT.OMEGA
CERRSHGCKGGYPPYALEWANGIHLRSKYPYKAKQGTCRAKQVGGPIVKT~
110
QUIMOPAPAÍNA CDKHSYGCKGGYQTTSLQWANGVHTSKVYPYQAKQYKCRATDKPGPKVKI~
2
D
3
E
110
4
P A PN A A Í
~QPYNEGALLYSIANQPVSVVLEAAGKDFQLYRGGIFVGPCGNKVDHAVAAVG
165
PROT.OMEGA
~QPNNEGNLLNAXAKQPVSWESKGRPFQLYKGGIFEGPCGTKVDHAVTAVG ~PSNCETSFLGALANQPLSVLVEAGGKPFQLYKSGVFDGPCGTKLDHAVTAVG
165
QUIMOPAPAÍNA
4
5
165
7
6
P A PNA AÍ
YGPN----YILIKNSWGTGWGENGYIRIKRGTGNSYGVCGLYTSS~KN
212
PROT.OMEGA
BGGKGYILIKNSWGTAWGEKGYIRIKRAPGNSPGVCGLYKSS~KN
216
QUIMOPAPAÍNA =DG_KNYIII~NSWGPNWGEKGYMRLKRQSGNSQGTCGVY
-
KSSYYPFKGFA
218
Figura 3-22. Estnlcturassecundariasmarcadassobrelassecuencias de aminohcidos de papaína, proteinasa l2 y quimopapaína. Las hélices a sedenotan con letras y las hojas B con nilmeros.
completamente las diferencias observadas en los espectros de dicroísmo circular de
las tresproteínasestudiadas.Talesdiferencias cercanía de los 200 nm, donde unaseñal
se presentanprincipalmenteen
la
que resulta muy evidente en papaína,
desaparece en quimopapaína y ademds, para éSta última, la magnitud relativa de las señales cercanas a 210 y 220 nm se encuentra invertida (Fig. 3-23). Por otra parte, al observar los espectros de dicroísmo circular de la bromelaína de tallo (Arroyo-Reyna, 1993), la actinidina(Valle-Guadarrama,
1993) y la ficina(López y Celis, 1993), se
encuentra que todasestasproteasassulfhidrílicasparecenposeerespectroscon características intermediasa las que se presentan en los correspendientes a papaína y quimopapaína. Estos espectrosse incluyen en la figura 3-24, con fines comparativos. AI intentardarunainterpretación
desaparicióngradualde
a lo queaparentemente se tratade
una
la señalde 200 nm en los espectosdedicroísmocircular
obtenidos para las PSV en la regióndeenlacespeptídicos
(180-250 nm), que se
observaen la figura 3-24, y considerandoque las estructurassecundariasdeesas enzimas se encuentran ampliamente conservadas
(al menos en
las estructuras
tridimensionales conocidas), se pensó en atribuir tal desvanecimiento de la señal de 200 nm a la presencia de algún cromóforo no peptídico que hubiese sido obviado en trabajos previos. Debido a que la cantidad de cadenas laterales con grupos químicos aromáticos, específicamente triptofanos, varía sin seguir
una tendenciaparticular al
pasar de una proteína a otra de la familia, se decidió realizar un análisis comparativo de la geometríade los trespuentesdisulfuroque se encuentrancompletamente conservados en las PSV. Esta decisión se tomó en base a lo reportado por Perczel et al. (1992) acerca de la contribución de estos elementos estructurales a las señales de dicroísmo circular en la regióndelultravioletalejano, y a los reportesdeCasey 8, Martin (1972) y Ottnad et al. (1975) quienes encuentran una señal de signo negativo alrededor de los 200 nm para compuestos modelo que contienen enlaces disulfuro. Los resultados de este análisis se presentan en la figura 3-25, donde se aprecian los valoresde
los ángulosdiedrosCp-S-S-Cpde
los puentesdisulfuro
proteinasa 0, actinidina y quimopapaína. Puede notarse que en valores de los ángulos muestran una tendencia Suave
para p a p a h ,
los cuatro casos, 10s
a cambiarenelmismoorden
en que disminuye la señal de 200 nm de sus espectros (proteinasa omega seguida de papaína,actinidina y por últimoquimopapaína), lo quehace muy razonable la asignación de esa banda en dicroísmo circulara la geometría de las tres interacciones covalentes entre residuos de cisteína en
las PSV. Los resultadosdelan&lisisanterior
40
IO
O0
5
50
O
O
T
-5
’50
-10
.IO0
IO
O0
5
50
cn al a
L
m
O
O
o, U
Y
-50
-5
r’ L
E 10
-100
n
CD
Y
IO
IO0
5
50
O
O
-5
-30
-10
-100 1
200
240
1
1
260
1
1
280
1
1
1
300
WAVELENGTH ( n m 1
Figura 3-23. Espectros de dicroísmo circular de papaína ( a ) proteinasa S2 (b) y quimopapaína (c), de acuerdo con Solís-Mendiola et o/. (1990).
Elipticidad molar (grad cm2 dmol")
x IOe3
10
5
O
-5
-10 180
2 0109 0
2102 5204203202 0
Longitud de onda
I
(nm)
Fip;ura 3-24. Espectros de dicroísmo circular para seis PSV en la zona del ultravioletaleiano.
Ángulo d edro
(O)
-85
120
- 90 110
-95
1O 0
- 100
- 105
90
-110 80 -8-
S-S 1
+ S-S
+;
-115
2C!
- 120
70 OMEGA
PAPAíNA
ACTIN ID
Figura 3-25 Ángulos diedros Cp-S-S-Cp de los tres enlaces disulfilro para proteinasa R,papaína, actinidina y quimopapaina.
sugieren a esta familia como un sistema que permitiría estudiar por primera vez, influencia de la conformaciónde
los puentesdisulfuroen
dicroísmocircularenproteínas,en
la
la espectroscopía de
la regióndelultravioletalejano.Esinteresante
señalar que la orientación relativa de algunas estructuras secundarias cambia de una PSV a otra, siguiendo la misma tendencia de las señales de dicroísmo circular a 200
nm. Estosignificaque
las posicionesrelativasdeestructurassecundariaspodrían
contribuir significativamente a la forma de los espectros (Fis.3-26). También se han
realizado estudios de estabilidad sobre papaína
y
quimopapaína (Solís-Mendiola et a/., 1993) en los que se han identificado variaciones de los parAmetros termodinámicos para el proceso de desnaturalización térmica en ambasenzimas.Estoresulta
muy llamativo,puesconstituyeelsegundogrupode
resultados experimentales queapuntan en la dirección de la existencia de diferencias
a pesar de su cercanía filogenética. La interpretación de las diferencias observadas, como se mencionó en el primer artículo citado de estos autores (Solís-Mendiolaet a/., 1992),sólo sería posible a través de un estudioestructuraltopológicodetalladodecadaproteínainvolucrada, y elcontar ahora con un modelo tridimensional de la quimopapaína nos permitirá intentar esta interpretación. De acuerdocon los resultadoscalorimétricoscomparativosentre quimopapaína y papaína que se obtuvieron en el trabajo de Solís-Mendiola et a/. en el año de 1993, la quimopapaína presenta una mayor cooperatividad en su proceso de desnatruralización térmica,un menor cambio en su capacidad calorífica durante la transición, y una mayor entalpía de interacción entre sus dominios estructurales.
estructurales entre estas enzimas,
En relación a la mayorcooperatividadenelprocesodedesnaturalización
térmica de quimopapaína respecto a papaína, Solís-Mendiolaet a/.,( 1 993) proponen la existencia de una mayor interacción entre los dominios estructurales de la primera de estas enzimas; de acuerdo con
desarrollado por ellosmismos.
un mecanismodedesnaturalizaciónplanteado La interpretaciónestructural
y
deestaconclusión,
a través de la estimación de la cantidad de interacciones interdominio y de su energía correspondiente, mediante el empleo de las coordenadas espaciales atómicas de la estructura cristalográfica de la papaína y del modelo obtenido para la quimopapaína. derivada de los datos experimentales, fue hecha en el presente trabajo
Las interaccionesinterdominioconsideradasaquí,
hidrógeno entre diferentes grupos de
se refirieron a los puentesde
la cadena polipeptídica y entre moléculas de
41
Ángulo diedro
(O)
T
175
40
165 35 155
30
145
135 .25 125
115 OMEGA
~
1
m ~
PA
í NA
HéliceA-Hoja4a
+
1
20
ACTlNlDlNA QUIMOPAPAiNA
HéliceA-Hoja4b 4-
HéliceA-HéliceB 4-
Figura 3-26. Ángulos diedros entre estructuras secundarias en proteinasaR , papaína, actinidina y quimopapaína; 421 y 4b se refieren a la primera y segunda porciones de l a cuarta hoja p.
agua que se enlazaban directamente con átomos de ambos dominios en
la proteína.
Otras interacciones interdominio consideradas heron los contactos vander Waals y las fuerzaselectrostáticas(queincluyenpuentessalinos).
La Tabla 3-VI muestra
de hidrógeno y puentes salinos
comparativamente número el de puentes
interdominio para quimopapaína y papaína. Se observa que existe un número mayor de interacciones de ambos tipos para el caso del modelo de la quimopapaína, donde
la mayor contribución es debida a los puentes de hidrógeno entre cadenas laterales. Es interesantenotarqueenelcaso deesta última proteasa se encontrarondos puentes salinos entre grupos químicos de dominios diferentes, mientras que para la papaína no se detecta este tipo de interacciones.
TARLA 3-VI Número de interacciones interdominio. PAPAÍNA
QUIMOPAPAfNA
Entre átomos de la cadena principal
5
5
Entre átomos de cadenas laterales
2
7
Entre cadena lateral y principal TOTALES
5
4
12
16
O
2
PUENTES DE HIDRóGENO
PUENTES SALINOS
Cabe resaltar que el número de interacciones considerado en la Tabla 3-VI, no es necesariamente un reflejo de
la energía de atracción entre
estructurales,peroaúnencasoafirmativo,existiría interaccionesvander
Waals, cuyo número
los dominios
la participaciónadicional de las
es difícil estimar.Por
presenta en la Tabla 3-VI1 la contribucióndecadatipo
esta razón se
de interacción a la energía
potencial total de la región interdominio. Es importante señalar que en estos ~ l c u l o s se utilizó mismo el campo de Fuerzas empleado para modelado el de
la
quimopapaína, y puestoquecadacampotienesuparametrizaciónparticular,fue necesariorelajar
la estructuracristalográficade
la papaínamedianteelprograma
En esta tabla se anotan las estimaciones energéticas realizadas sobrela papaína antes y después dela relajación. BIOGRAF para que los resultadosfuesencomparables.
-
r A B a 3-VII
Enersía de interacción interdominio. Papaína
Papaína
Cristaloqráfica
Minimizada
-101.71 -54.42 -03.99
-132.01 +12.40 -15.39
-100.02 -94.23 -107.73
-239.20
-75.80
-309.37
Quimopapaína
Tipo de Interacci6n
(kcal/mofl
Van der Waals Electrostática Puentes de Hidrógeno Energía Potencial Interdominio Total
Es muy interesantenotarenesta
tabla que los dominiosde
encuentranmásfirmementeunidosentre
sí queenelcasode
la quimopapaína se la papaína (tanto
a juzgar por la menor energía potencial interdominio total encontrada aquí (mayor valor absoluto).
cristalográfica como minimizada),
En la Fig. 3-27 se ha señalado, sobre
las secuencias de papaína y
quimopapaína, la posiciónde los residuosqueintervienenen puentesdehidrógenointerdominio,
la formaciónde
los
a que se refiere la Tabla 3-VI. Es notableel
papelprotagónicoquedesempeñanel
W7 enambasenzimas,
así como la S29 en
papaína y la Q19, Yl66,y S180 enquimopapaína, ya queintervienenenmásde un tipo de interaccióninterdominio a la vez. Porotraparte,en
enlistan las moléculasdeaguaqueenlazan
la Tabla 3-VI11 se a los dominiosestructuralesen las
las determinadas
enzimas estudiadas. Estas moléculas de agua son tanto cristalográficamenteenel quesirviódebaseen permanecieron después de
caso de la papaína,como las presentesen la estructura la construccióndelmodelode
la quimopapaína y que
las múltiples etapas de minimización
y dinámica
molecular.Dadoqueensolución,ambasproteínaspodríantener
un mayornúmero
demoléculas de agua queinteraccionaransimultáneamentecon
los dosdominios
estructurales, debe tomarse con cautela el hecho de que exista un número mayor de
43
QUIMOPAPAÍNA PAPAÍNA
YPQSID@AKGAVTPVKNQACGSCWAFSTIATVEGINKI
40
IPEYVD~QKGAVTPVKN~GSCGSCWAFSAWTIEGIIKI40 -
= =
QUIMOPAPA~NA VTGNLLELSEQELVDCDKHSYGCKGGYQTTSLQYVANNGV PAPAÍNA RTGNLNEYSEQELLDCDRRSYGCNGGYPWSALQLVAQYGI
80 80
QUIMOPAPAÍNA PAPAÍNA
HTSKVYPYQAKQYKCRATDKPGPKVKITGYKRVPSNCETS 120 HYRNTYPYEGVQRYCRSREKGPYAAKTDGVRQVQPYNEGA 120
QUIMOPAPAÍNA PAPAÍNA
FLGALANQPLSVLVEAGGKPFQLYKSGVFDGPCGTKLDHA
160 LLYS~ANQPVSVVLEAAGKDFQLYRGGIFVGPCGNKVDHA160
QUIMOPAPAÍNA PAPAÍNA
VTAVG~GTSDGKNYIIIKNLWGPNWGEKGYMRLKRQSGNS 200
QUIMOPAPAÍNA PAPAÍNA
QGTCGVYKSSYYPFKGFA - 218
= i
VAAVG~GPN----YILIKNSWGTGWGENGYIRIKRGTGNS 196 =
YGVCGLYTSSFYPVKN
=
=
212
Figura 3-27. Conqxlración de los residuos involrlcrados en l a formación de puentes de hidrógeno
interdominio en quimopapaina y papaina. Se utilizaron las siguientes convenciones para distinguir los diferentes tipos de puentes de hidrógeno: entre cadena principal, subrayado; entre cadenas laterales, negritas; y mixtos, itdicns.
los
estos puentes de agua en quimopapaína, como era de esperarse según resultados experimentales.
TABLA 3-VIII Moléculas de agua del interdominio en papaína y quimopapaína.
r
PAPAINA Dominio 1
Dominio 2
Agua
E50 303-307 305 133 E35, K17306+307 E50 306-307 307 E35 300 K17 F20 320-+300 F20 320-313 320 L72 E3 322 v35 392-340 G20 400-343 R41 339-353 R41 446-353 VI 6 359-361 D6 384-360 R0 370-364 R0 370 R0 402+370 K106 372 W69 412-390 R41 339-453 v35 392+335
(
Dominio 1
UIMOPAPAI iA Agua
54 210 tí174 54 219 Q120, PI29 K174 VI3 264 P15,E35 K174 225 G66 K174 289-229 G66 N175 289-230 N175 241 Q60 VI6 K174 251-247 G109,1107 VI6 251+250 253 R191 R0 5205 R0 253-254 w177 Q60 250-274 Q120 Q60 250-+326 VI3 Q120 264-221 N104 V13,54 265-219 Y170 E35, A32 267 El03 169 276 El03 169 275+276 El03 133 204 K211 N10 206 5205 142 292 K211, N212 G20,N10 302-206 Y106 N10 312 341 Q3 Y1 342
Dominio2
1160, Y174 Y166,Y174
Y190 K170 K157 d150 5131
Y190 K100
El07 El07 Y211 5209
Y190 Y166,Y174 K170
Y110 Y110 P129,
N120
w101 G216
w101 N104 TI60 E110
Los resultados para la regióninterdominio de papaína y quimopapaínaque son mostrados en
las Tablas 3-VI a 3-VIII (número de interacciones,energía
potencial y puentesdeagua),
indican que los dominiosestructuralestienenuna
44
mayorinteracción
en quimopapaínaque en la papaína,como se esperaba de los
resultados calorimétricos mencionados previamente. Para continuar con
la utilización del modelo de quimopapaína e n la
interpretación estructural
de
la
información termodinámica obtenida
experimentalmente por Solís-Mendiola et d., (1993), se emplearon las ideas propuestas por Privalov (1979) respecto a la correlaciónlinealpositivaentre
el
cambio e n la capacidad calorífica (ACp) de una solución de proteína, inducido por su desnaturaliución,y la cantidad de contactoshidrofóbicos en la estructuranativa. Paraello se determinaron las densidadesmoleculares en papaínayquimopapaína,
las cuales se presentan en la Tabla 3-1X, y donde se aprecia una densidad mayor e n cada uno de los dominiosestructuralespara el caso de la papaína,comosería de esperar para un número más alto de contactos hidrofóbicos en esa enzima, responsables de un mayor ACp.
1-ABM3-IX Propiedades físicas por dominio. Volumen
(A3)
Masa molar
5uperSicie
Densidad
(A2)
(glmol)
(&m3)
10090.6
10737.0
12050
1.9021
9425,9
10077.6
11295
1.9905
Dominio 1 (1-1 07)
9026.0
10762.2
11703
1.9704
Dominio2 (108-2 18)
10115.9
11092.7
11972
1.9659
PAPAiNA Dominio1 ( 1- 107) Dominio 2 ( 108-212)
QUlMOPAPAiNA
en la capacidadcaloríficadebidoal proceso de desnaturalización térmica en proteínas, ha sido propuesta por Murphy et Unanuevainterpretacióndelcambio
al. (1992) ySpolar et al. (1992), quienesencontraronque
proporcional al incremento generadapor
del área hidrofóbica accesible
el ACp es directamente al disolvente (AAhf)
el desplegamiento de la cadenapolipeptídicasegún
la siguiente
expresión:
45
-
.
.. -
" " 1 "
ACp
=
(26)
0.24 AAhf
AI calcularel
AAhf para papaína y quimopapaína, se obtuvieronvalores de 12,393.7 y 1 1,625.8A’, respectivamente. A partir deestosdatos y con la ecuación (26),se encontraron los valores de ACp para ambas proteínas que se anotan en la Tabla 3-X.
TABLA 3-X Valores de ACp teórico y calorimétrico. I
I
I
I
PAPAíNA
QUlMOPAPAíNA
Valor Estimado (kcal/mol K)
3.0 iz 0.37
2.8 f 0.35
Valor Experimental (kca//mol K)
3.3 f 0.45
2.3 iz 0.50
Como se observa, los resultados teóricos y calorimétricos coinciden razonablemente bien, dentro del error experimental estimado.La discrepancia entre estos dos grupos devalores,
es quizádebida
a la orientación particular de las cadenaslaterales
superficiales de estas moléculas,en los confórmeros utilizados para estimar el AAhf.
46
...
CONCLUSIONES
Uno de los objetivos más importantes en el estudio asignar una estructuratridimensionalprecisa
de proteínas, es el poder
a cualquiersecuencia de aminoácidos
particular.Como se ha mencionado, actualmente se realizan grandes esfuerzos para incrementar las bases de datos de estructuras tridimensionales de técnicas experimentales como ocasiones, lanaturaleza
la difracciónderayos
X y
de proteínas a través
RMN,peroenmuchas
de las macromoléculashaceimpracticable
lautilización
de
los métodos experimentales mencionados. Una alternativaviablequehamostrado
serexitosa en la determinacióndeestructurastridimensionales
es la simulación o
modelado molecular, el cual ha tenido un creciente impacto en la comunidad sólo en años recientesdebido a la asequibilidaddeprocesadoresmásveloces
y demayor
capacidad.
una
Es importante mencionar que cualquier modelo tridimensional de proteína representa por
sí mismo sólo una propuesta estructural
considerarse completamente equivalente
a la geometría 'real
modelada, a menosquedemuestreampliamente
y no debe
de la molécula
la validezdelmodelo.
trabajo se propone un arreglotridimensionalcondetalleatómico
En este
de un integrante
de la familia de las proteasas sulfhidrílicas vegetales, la quimopapaína. Este modelo
fue sometido a dos criterios de evaluación geométrica independientes: la aplicación de las pautas utilizadas para aceptar estructuras cristalográficas de alta resolución en elBancodeDatosCristalográficosdeProteínas,
y la comparaciónconinformación
experimental publicada por diferentes autores que indirectamente con la estructura tridimensional de resultados del análisis
se relaciona directa
o
esta proteasa. De acuerdo con los
geométrico practicado, el modelo
de la quimopapaína
obtenido en este trabajo cumplió satisfactoriamente los requerimientos estructurales impuestos por ambos criterios. Cabe señalar que el criterio de calidad estereoquímica empleadoen
estetrabajo,es
muy estricto y, aún ciertasestructurascristalinas
proteínas que se encuentran accesibles en el Banco de Datos, estándares. Porotraparte,
es importantemencionarqueen
de
no logran cumplir los
este primermodelado
molecularde la quimopapaínanunca se incluyeron restricciones sobre la geometría inicial, que condujeran a la estructura a cumplir con las observaciones experimentales que sobre la arquitectura de las proteasas sulfhidrílicas vegetalesse dispone.
Los resultadosobtenidosenelpresentetrabajopermiten objetivo de proponer un modelotridimensionalpara
afirmar queel
la quimopapaína, que contara
con la calidad suficiente para ser empleado como una estructura más en la familia de las PSV, Fue convenientementealcanzado. En unasegunda
quimopapaínafueutilizado
a nivel espectroscópicos.
la
para realizarunarevisióncomparativaconlosdemás
miembros de la familia caraterizados interpretación
etapa, elmodelode
molecular
y posteriormente se le empleó de
En la interpretación estructural de
e n la
algunos resultados calorimétricos
los resultados espectroscópicos
y
de
dicroísmo circular sobre los miembros de la familia de las PSV, se proponen en este trabajodosposiblesexplicaciones
a las inesperadasdiferenciasobservadasen
los
espectros de estas proteasas de gran homología en secuencia de aminoácidos. Una de las interpretaciones involucra el cambio simultáneo y gradual en la geometría de
los tres enlaces disulfuro presentes en cada una deestasproteasas. La otra explicación está relacionada con el cambio paulatino en la orientación relativa de las estructuras secundarias prácticamente invariantes en esta familia de enzimas vegetales. Aunque las dos exégesis porseparadopodríanexplicarelefectoen los espectros de dicroísmo circular, también es posible que la combinación de estas dos interpretaciones fuese compatible con una explicación más general, que correlacionaraunadistorsiónglobalprogresivade las estructurascon los cambios espectroscópicos. Estosignificaque las modificacionesen la geometríade los enlaces disulfuro y e n las interacciones entre estructuras secundarias, podrían sersólo consecuenciadetaldistorsióngeneralizada
y no la causa per se quegenerara las
diferencias en la forma de los espectros de dicroísmo circular. Para poder discriminar de entre los posiblesorígenesde
las disparidadesespectroscópicas se requierede mayor información, por lo queen lo sucesivo se analizará con particular atención la incidenciadecromóforosnoconvencionalesen las estructurastridimensionales de estas proteínas, que pudieran ser responsables dela aparición de señales en la región del ultravioleta lejano e n dicroísmo circular. Con relación
a la aplicación del modelo propuesto
informacióncalorimétricasobrepapaína quizá, la explicaciónmolecularsobre
para interpretar la
y quimopapaína,elhechomásnotable
es,
la diferentecooperatividad en elprocesode
alteración estructural inducida térmicamente en estas proteínas. Según el mecanismo propuesto para la desnaturalizacióndeambasenzimas,lasinteraccionesentresus
78
dominiosestructuralesjuegan
un papel determinante en
la cooperatividaddel
para el caso de la quimopapaína. AI analizar las
fenómeno,debiendosermayores
regionesinterdominio e n la estructura de la papaína y las correspondientesen el modelo, se encuentraquebajotodos
los criteriosempleadosaquí,(puentesde
hidrógeno, puentes salinos, energía de interacción no covalente
y puentes de agua)
el modelo de la quimopapaína resulta ser congruente con el mecanismo de desnaturalización mencionado y que fue sugerido
por otros autores (Solís-Mendiola
et al., 1992). Por otro lado, de la estimación del cambio en el Area hidrofóbica expuesta
al
solventecausada por ladesnaturalizacióntérmica en papaína y quimopapaína, se logró estimar en este trabajo el ACp para ambas proteasas con resultados comparables, dentro del error experimental, con los valores determinados por Murphy et a/. calorimétricamente. Estos resultados corroboran las ideas sugeridas
(1992) y Spolar et a/. (1 992), relativas a la dependencia lineal entre los cambios de áreahidrofóbicaexpuestacon
la capacidad calorífica delasmoléculas
al sufrir la
pérdidadelaestructuranativa.
Un trabajofuturointeresantepodríaserlainclusión
delcambioenelArea polar o hidroh'lica,inducida por la desnaturalización,en la estimación del ACp como lo han sugerido los autores arriba mencionados, y también podríaser
de utilidad elempleardiferentesconfórmeros
estudiadas y observar la influenciaque
estotenga
de las dosproteínas
en los valoresdelparámetro
termodin6mico mencionado. Dentrodelasperspectivasparacontinuarcon
la línea de investigacióndel modeladomolecular de proteínas,enelAreadeBiofisicoquímica se pretende la simulaciónestructural que comprenden emplearestrategiasmássofisticadasen entreotras: la inclusiónexplícitademoléculasde disolvente, el análisis de las trayectorias obtenidas en la dinámica molecular, simulaciones más prolongadas en el tiempo, uso de las técnicasderecocido y templado para un mejormuestre0del espacio conformacional y uso nuevos de algoritmos para construir las conformaciones iniciales que sirven de molde a la molécula de estructura la finalidaddeobtenerestructuras que tridimensionaldesconocida.Todoestocon reflejen más fielmente los detalles geométricos que establecen las diferencias entre la estabilidad y lafuncióndemoléculastancomplicadamenteprecisascomosonlas proteínas.
BIBLIOGRAFíA Abola E., Bernstein F.C., Bryant S.H., Koetzle T.F. y Weng J. (1987) (En)
Crystallographic Da tabases-lnfonna tion Content, Software systems, Scientific Applications. (Allen F.H., Bergerhoff C. y Sievers R , eds). Data Commission of the International Union of Crystallography. pp. 107-1 32.
Altamirano M.M. y Calcagno M.L. (1993) Mensdje Bioquímico Vol. XVII, Fac. de Medicina, UNAM. Arroyo-Reyna A. (1993) UAM-lztapalapa. Comunicacicjn personal. Baker E.N. (1980)f . Mol. Bol. 141:441-484. Baker E.N. y Drenth J. (1987) (En) Biological Macromolecules andAssemblies (Jurnalc F.A. y McPherson A., eds.), vol. 3 , pp. 31 3-368. John Wiley 8, Sons, N.Y. Bernstein F.C., Koetzle T.F., Williams G.J.B., Meyer E.F., Brice M.D., Rodgers J.R, Kennard O., Shimanouchi T. y Tasumi M. ( 1 977) /. Mol. Biol. 1 12: 535-542. Biosym Technologies (1993) Discover User Cuide,Versión 3.1, California. Blundell T.L. (1991) (En) Protein Conformation. Ciba Foundation Symposium 161, pp. 28-51. John Wiley 8, Sons, Chichester. Blundell T.L., Sibanda B.L., Sternberg M.J.E. y Thornton J.M. ( 1 987) Nature 326: 347352. Blundell T.L., Carney D., Gardner S., Hayes F., Howlin B., Hubbard J.T., Overington J . , Singh D.A., Sibanda B.L. y Sutcliffe M. (1988) Eur.1. Biochem. 172: 513-520. Born M. y Oppenheimer J.R (1927) Ann. Physik 8
4 :
457.
Branden C. y Tooze J. (199 1) Introduction to Protein Structure.Garland Publishing, Inc., N.Y. Brocklehurst I