MODELADO MOLECULAR DE QUIMOPAPAiNA

Casa abierta al tiempo

UNIVERSIDAD AUTONOMA METROPOLITANA

MODELADO MOLECULAR DE QUIMOPAPAiNA TESIS QUE PRESENTA

ALBEDTA JAWLINE PADILLA ZÚÑIGA PARA OBTENEREL GRADO DE

MAEaTDO EN Q@IICA

NOVIEMBRE: DE 1993

UNIVERSIDAD AUI6NOMA ME"R0POLITAN.A UNIDAD IZTAPALAPA DIVISIÓN DE CIENCIASBÁSICAS E INGENIEKÍA DEPARTAMENTO DE QUÍMICA

UNIDAD IZTAPALAPA Av. Michoacán y LaPurísima, Col. Vicentina,Iztapalapa, D.F. C.P. 09340. Tel.: 686-03-22

De mzmpamixGzr deseo e p r w r m ' p nagradechimo al%. M r é i Mdtz %ana por sus valww 0 6 s e n ~ a cywsu ~ kzondicwnaldis-posicwnen Gz asesorh delpresente trabajo y a l e . %-two%go !.Dotnúyuezpor sus consejos, eltkquoy eltmhzjo concedi€os a Gz eGz6omcwn deesta tesk

CAPíTULO 1

INTRODUCCI~N

1

CAPiTULO 2

MtIODCX

8

9 9

10 11

Modelado molecular

12

Superficie de energía potencial

12

Campo de herzag

14

Minimización de energía o mecánica molecular

16

Ckadientem conjugad-

18

Dinámicamolecular

19

Mitodo de Verlet

20

Cálculo de áreas q x d k i a l e m y volilmenem molecularem

24

Buperpmición de cstructura6

24

CAPíTULO 3

RE$UIJTADOS Y DISC3JSION

25

&lección de la atructura b a e a) Homologin en composición b) Hornologia e n secuencia c) 6ignificoncin dc la hornologia en sccucncin

25 25 25 21

Modelado molecular de la quimopapaína a) (3ondrucción del modelo inicinl b) Minimización de crlcrgia c) C.onvcrgcncir-1 hacia l a conformación de equilibrio

30 30 32 33

Evaluación de la calidad atereoquímica del modelo

34

Análimk de la emtructura del modelo de la quimopapaína

46

Comparación mtructural del modelo con otrm miembros de lam PSV

52

hplicacionem del modelo propucA~o

56

CAPíTULO 4 B1BLIOCRAFlA

CONCLU&IONE&

18 81

CAPITULO 1

Por lo conocidoacerca

de las proteínas,todos

los esfuerzosdedicados

al

estudio de sus propiedades y aplicaciones resultan justificados. Si como se ha dicho, el DNA es un proyecto de vida y las proteínas los "ladrillos"y el "mortero" que hacen posible todas

las funciones vitales (Doolittle, 1985), no es sorprendente que encontremos a algunas proteínas cumpliendo funcionesde reconocimiento molecular para el transporte de metabolitos o como defensa contra organismos patógenos; a otras, como reguladores del ritmo vital, como barrera física y soporte,como sintetizadores bioquímicos, como generadoras de movimiento y aúncomomateria prima de otrasbiomoléculas. Y lo mLSs notable es queestaincreíblevariedadde funciones se verifica dentro de las células en condiciones suaves, con extraordinaria eficiencia y congran especificidad.De entre las funciones de síntesis, quizá la labor catalítica es la más rica en cuanto a la diversidad de proteínasinvolucradas. La función enzimática, estrechamente relacionada con el reconocimiento molecular, ha llamado fuertemente

la atención por las aplicaciones industriales que pueden

derivarse de ella, tanto farmacéuticas como alimentarias y de síntesis química. En el afán deutilizar

a las proteínascomopotentescatalizadores

de las

reacciones biológicas, se ha intentadoproducir estasmoléculasenmayorcantidad se hallan naturalmente, sin embargo su obtención

que aquélla en que

purificaciónposterior,representan

un granreto

investigador. Por ello, recientemente se

a la habilidad y experienciadel

a las técnicasdeingeniería de se ha hechoevidente el fuertenexo

haacudido

proteínas y de DNA recombinante,endonde queexisteentre

y su

la estructura de una proteína, la preservacióndesuintegridad

sobretodo, sufunciónbiológica.Con

estosantecedentesescomprensible

interésen los estudiosestructurales,quedealgunos presentando en diferentes partes del mundo diseñodeproteínasdenovo(Richardson cuyoobjetivoesdeterminarsi

y

el gran

años a la fecha se ha venido

y que se manifiesta por ejemplo, enel 8. Richardson, 1984; Goraj et a/., 1990)

las tendencias generales, que han podidodeducirse

un grupodeproteínasconestructura conocida, pueden aplicarse a la generacióndeproteínassintéticasconpatronestridimensionales característicos y predeterminados.Aunqueestosestudios sólo pretendenobtener de la observaciónde

en una conformaciónparticular, ya se haalcanzado otrametaaúnmásambiciosaque es la de producirenellaboratoriopéptidos artificiales con actividad biológica preestablecida (Hahnh et a/., 1990). Estos trabajos permiten confiar en que el fin último de la ingeniería de proteínas sobre el diseño de estasmacromoléculasconfuncionesespecíficas y nuncaantesobservadasen la

cadenas de proteínas plegadas

naturaleza, se encuentra cada vez más cercano.

En la hgeniería de Proteínas están involucrados tanto el diseño y construcción demacromoléculascompletas,como larealizacióndemodificacionespuntuales donde se reemplazan, suprimen o adicionan residuos individuales o aún fragmentos decadenapolipeptídica

en la secuenciade unaproteínanatural.Todo

objeto de identificar los sitios de unión de la proteínaconsusustrato establecer la jerarquíadefuncionesquecadaresiduosostieneen maquinariaenzimática

y dereconocimientomolecular.Asítambién,

esto conel

o ligando y la compleja las técnicas

mutagénicas se han venido empleando en la elucidación del papel que cumplen las cadenaslateralesde

los aminoácidosen

la estabilidad y en el mecanismo

de

plegamientode las proteínasquelespermitealcanzarsuestructuratridimensional biológicamente activa (Altamirano B Calcagno, 1993). El gran esfuerzo que implica el

manipular el DNA celular de

un

microorganismo para lograr la generación de una proteína específica, mantiene aún vigente la alternativa de estudiarmutantesnaturalesdeunaproteínaconestrecha homologíaensecuencia

y queconserven

un patróndedobladocomún.Esto

permitiríano sólo identificar a los residuos inconmutables de aquéllos que cumplen una función

accesoria en la secuenciapolipeptídica(comoen

proteínas), sino que además, proveería de principios generales

la ingenieríade para la identificación

y caracterizacióndeestosgruposdemutantes,queformanverdaderasfamilias

proteínas, para sumarse a los importantesestudiossobre

de

la relaciónestructura-

función-estabilidad que se han mencionado antes. Uno de los problemas más importantes por resolver en biología molecular, es la forma en que la secuencia de aminoácidos de una proteína es capaz de conducir a la macromolécula hacia

la estructura tridimensional que determina su función

biológica específica. Y aunque éste es un punto de debate actualmente, el hecho es que todos los estudiosqueserealizansobreproteínasenelmundo,tienenel

2

objetivo mediato o inmediato de encontrar las claves estructurales que mantienen la estabilidadmolecular y quecontrolan

la maquinariafuncionalde

las proteínas,e

intentar con ello definir las tendencias generales que sigue la naturaleza en el diseño estructural de estas biomoléculas. Por tanto, es necesario contar con un número cada que permitanrealizar

vez mayor de estructuras tridimensionales de alta resolución, estudiosdecaracterizaciónsistem6ticospara

la elucidaciónde los mecanismosde

plegamiento, con las claves moleculares para conocer el proceso de adquisición de la estructura polipeptídica tridimensional únicay completamente funcional. Con la intencióndeobtenernuevasestructurasdeproteínasquepermitan funcionales entre establecer las relaciones

la secuencia de amino6cidos

y la

conformación tridimensional, se han venido empleando exitosamente dos métodos experimentales: la difracciónderayos deresonanciamagnéticanuclear Dahlquist, 1990; Clore

S,

X encristalesdeproteína(Perutz,

1992) y la

(RMN)deproteínasensolución(McIntosh

Gronenborn, 1991). Laprimera

monocristalesdeproteínaestables permita la adecuadadifracciónde

S,

de estas técnicas requiere

a los rayos X y con un ordenmolecularque la radiaciónincidente.Porsuparte,

la técnica de

RMN precisa del manejo de soluciones de proteína en concentraciones relativamente altas (1-2 mMj, valores de pH normalmente menores a 6 (Branden S , Tooze, 1991), y adem6s,moléculasquecontengan

un m6ximode

150 residuosensucadena

polipeptídica (De Vlieg S , van Gunsteren, 1991).En la realidad sólo algunas proteínas pueden cumplir las condiciones experimentales que imponen estas técnicas, y ello es responsable de

que

se

conozcan

sólo

algunos cientos

de

estructuras

tridimensionales, cuando el número de secuencias completamente determinadas que se tiene actualmente, se elevaa varias decenas de miles (Fasman, 1989). Conelrápidocrecimientode

la capacidad de procesamiento

d e datos y con

las velocidades de cálculo numérico de que se dispone actualmente, es ya factible la

utilización de programas de cómputo

para la aplicación de técnicas como

mecánica y dinámicamoleculares,quepermitensimularelcomportamiento propiedades de sistemas constituidos por varios miles proteínas y ácidosnucleicos,con

de átomos, como

una muy buenaaproximación

la y las

las

a los resultados

experimentales (Langone, 1991). De hecho, desde finales de los 60’s se hanvenido empleandoalgoritmosdeprogramaciónparaelmodeladomoleculardeproteínas con gran

éxito, y a partir de entonces, se

han perfeccionado los métodos

3

matemáticos que generan y representan gráficamente el comportamiento dinámico y las conformaciones espaciales más estables, que describen fielmente

la soluciónconcreta

biológicos.Esteúltimopunto,constituye

a los sistemas

al problema de la

adquisición de estructuras tridimensionales, ya que los elementos de partida de las técnicas de simulación molecular son relativamente asequibles y salvan muchas

de

las restricciones sobre la naturaleza molecular, que imponen las técnicas de dih-acción de rayos X y

RMN

mencionadas anteriormente; aunque

aproximacionesteóricayexperimentalresultan

de hecho, las

ser complementarias en la mayoría

de los casos. Las aplicacionesmássobresalientes

de los programas de simulación

además de la generación de modelosmoleculares,son

las que se refieren a la

determinación de parámetrostermodinámicos de sistemaspoliatómicos(Icarplus

8.

Petslto, 1990) y a los cálculos dinámicos a temperaturassuperiores a las del medio biológico, para producir la desnaturalización de una proteína; al menos hasta llevar a la estructura al estado de glóbulo fundido (Daggett,1993).

En el Area de Biofisicoquímica de la UAM-I se está llevando a cabo un proyecto de caracterización termodinámica sobre la familia de enzimas denominada proteasas sulfhidrílicas vegetales (PSV).Esta familia comprende un grupo de enzimas cuyaactividadproteolíticadepende

del grupotiol de un residuo de cisteína de su

secuencia de aminoácidos. Aunque las proteasas sulfhidrílicas más estudiadas son las que se obtienen de fuentes vegetales, existen análogos estructurales en animales y en algunosmicroorganismos(Kamphuis

et al., 1985a; Moore, 1969). Del grupo de

proteasas sulfhidrílicas o tiólicas vegetales, la papaína es la enzima más ampliamente estudiadayportanto,

la mejorconocidahastaahora(Glazer

8. Smith,1971

;

Brocltlehurst et aI., 1981; Baker 8. Drenth, 1987). Estetipo de enzimaspuede ser obtenido ya sea del látex,

el endocarpio y el zumo, o bien del tallo, las hojas y aún

las raíces, de un grannúmerodeFrutosyplantas.Porejemplo,dellátex de papaya se extraen la papaína y al menos otros dos tipos de proteasas: la quimopapaína y la papayapeptidasa A , también conocida como proteinasa Q (Baker 8. Drenth, 1987); e n el látex de las plantas ficus spp., Asclepias syriaca y glaucescem y &/otropis

gigantea, pueden encontrarse las ficinas (Kortt et a l , 1974), las asclepainas (Tablero et al., 1991) y las calotropinas y calotropaínas (Pal 8. Sinha, 1980) respectivamente. Así mismo, del endocarpio de la piña y del fruto llamado kiwi, pueden purificarse las bromelaínas (Takahashi et al., 1973) y las actinidinas (Carne 8. Moore, 1978), y de las hojas de la cebada puede obtenerse la aleuraína(Holwerda 8. Rogers, 1992). Los

4

distintos tipos

se localizan en una sola fuente vegetal, no

de enzimas que

corresponden a simples productos de degradación sino que constituyen en realidad, tipos particulares de proteínas que pueden ser identificados tanto por las variaciones

en sus secuenciasdeaminoácidos,comopor

la manifestación de susdiferentes

propiedades físicas. Todas ellas guardan una estrecha semejanza u homología en sus secuencias de aminoácidos, con una cantidad de residuos idénticos que se encuentra e n el intervalo de 40 a 90%; al efectuarcomparacionesentrepares

de proteínas.

Actualmente se tienen caracterizadas por difracción de rayos X las estructuras de tres proteasastiólicasvegetales:papaína(Kamphuis et d., 1985b), actinidina(Baker, 1980) y proteinasa Q (Pickersgill et d., 1991 ). De la observación de la arquitectura de estas tres proteínas, se sabe que están integradas por dos dominios estructurales

de aproximadamente 100 residuos de amino%cidocadauno, lo que corresponde a cerca de 200 residuosporcadenapolipeptídica.También

activo,localizado

en la hendidurainterdominio,

se conoceque el sitio

se encuentraintegradoporuna

triada de aminoácidos: una cisteína del primer dominio, además de unahistidinay una asparagina pertenecientes

al segundo dominio.

En esta triada,

el grupo

sulfhidrilo de la cisteínainteraccionafuertementecon

el anillo imidazol

histidina, el cual a su vez, se encuentraestabilizadopor

el carbonilo de la cadena

lateral de la asparagina. Espacialmente cercanas identificado siete regiones coadyuvantes

a estostresresiduos,

de la

se han

de la función catalítica que son los

denominadossubsitios S4, S3, S2, S1, S1 ’, S2’ y S3’ de la enzima. De esta forma, siete residuos del sustrato peptídico (codificados interaccionancon

por P4, P3, P2, P I , P l ’ , P2’ y P3’),

los subsitioscatalíticosmencionados

(Fig. 1#1), y el punto de

escisión está situado entre

los subsitios S1 y S1 ’. También se sabe que la diferente afinidad o especificidad por los sustratos en estas enzimas (al menos para papaína y actinidina), está determinada principalmente por la composición y la geometría del subsitio S2 (Drenth et a/., 1976; Baker & Drenth, 1987).

En la familia de las proteasas sulfhidrílicas vegetales se tienen completamente secuenciadas siete enzimas: papaína, actinidina, proteinasa Q , quimopapaína, bromelaína de tallo, papaya peptidasa IV y aleuraína (Mitchel, 1970, Carne ¿LMoore, 1978, Dubois et a/., 1988a, Watson et a/., 1990, Ritonja et a/., 1989a y b, Whittier et a/., 1987,

respectivamente). En la Tabla 1 -I se presenta la extensión de la cadena

5

SUSTRATO H 2N-

P4

P3

P2

P1

PI’

P2’

P3’ -COOH

Figura 1-1. Representaciónde un polipéptidodesieteresiduosqueinteraccionancon los subsitios de una proteasa sulfhidrílica, de acuerdo con Baker 8, Drenth (1 987).

polipeptídica y la indicación de las estructuras caracterizadas por difracción de rayos X, de las proteasas tiólicas que actualmentese estudian en nuestro laboratorio.

De las PSV completamente secuenciadas y cuya estructura tridimensional aún

no se conoce, la quimopapaína es la más estudiada hasta ahora. Se tiene información sobre su actividad catalítica (Buttle

& Barret, 1985), reactividad(EnzymeHandbook,

1991), topografía(Watson, et a/., 1990, Dubois et a/., 3988b, Carey et a/., 1983),

contenido de estructura secundaria (Solís-Mendiola

et a/., 1989) y estabilidad

termodinámica (Solís-Mendiola et a/., 1992), entre otras. Una característica notable al compararalgunas deestasevidenciasexperimentalesconlasobservadaspara

las

demAs PSV estudiadas, es que consistentemente la quimopapaína parece alejarse de las tendenciasgeneralesseguidas

por la familia.Con

intención de contribuiralacompletacaracterización inmediatoen

estosantecedentesycon

la

de laquimopapaína, el objeto

este trabajo, es el poderdeterminarunaestructuratridimensional

confiableparaestaproteína,queayude

a esclarecermuchas de lasinterrogantes

planteadas por los estudiosexperimentales. Sin embargo,aunqueexistenreportes

6

sobre la obtención de cristales de quimopapaína(Jansen S Balls, 1941; Ebata S Yasunobu, 1962) hastaahorano

se hanpublicadoestudios

relacionados con ella. Por otra parte, su cadena

de difracción de rayos X

de 218 residuos de aminoácido, hace

impracticable la caracterización estructural por medio de la

RMN con la tecnología de

que se dispone actualmente. De aquí que la única alternativa viable para salvar

los problemas que imponen las técnicas experimentales, es el empleo de la metodología de la simulación por computadora, que ha resultado ser exitosa en la determinación de la geometríatridimensional de unagranvariedad

de proteínas(Blundell

et a/.,

1988; Karplus S Petsko, 1990; Levitt, 1992; Srinivasan et a l , 1993).Así, el objetivo que se persigue en este trabajo es el de proponer una estructura tridimensional que represente lo másfielmenteposible a la quimopapaína, a través de las técnicas de simulación por computadora, que emplean métodos de mecánica y dinámica moleculares. En las siguientessecciones

se describirá la metodologíaseguidapara

obtención del modelo tridimensional

la

de la quimopapaína, la estimación de sunivel

de confiabilidadysuposterioraplicacióna

la interpretación de algunos de los

resultados experimentales disponibles, sobre todo, de aquéllos que inciden directamente en los aspectos geométricos de las proteínas involucradas.

-r+uw1-1

I

PKOTEASA PAPA~NA QUIMOPAPA~NA PROTEINA5A R 6ROMELAiNA DE TALLO ACTINIDINA FlClNA

I

RESIDUO5 NO. DE

212 218 216 212 220 2

* Proteínas con estructura tridimensional determinada por difracción de rayos X.

7

CArmJLO 2 MÉTODOS

La similitudconforrnacionalentreproteínas

de estructuradesconocida

determinanormalmente, a travésdesusdistanciasrelativasmutuassobre

se

un árbol

filogenético construido con la información estadística de la estructura primaria de un grupo de macromoléculas. Es una característica casi invariante, que las proteínas que guardan alta homologíaensussecuenciasdeaminoácidospresentenpatrones plegamientotridimensional

muy semejantes. Aunquetambién

de

se han encontrado

casos en los que proteínas con una escasa semejanza en sus secuencias manifiestan gran relación geométrica (Ryu et a/., 1990; Holmgren 8. Branden, 1989). Esto sugiere que la diversidad en topologia espacial está mucho más

limitada que la variabilidad

observada en las secuencias de aminoácidos delas proteínas. A pesar del importante progreso que se ha conseguido, sobre de la comprensióndel mensaje cifrado en

la

secuencia de aminoácidos que relaciona a éSta estrechamente con el patrón terciario dentrode

una proteína, aún sedesconocen

engranmedida

los principiosdel

dobladode la cadenapolipeptídica. Así, elmodeladodeestructurasbasadoen homología en secuencia, constituye el principal medio unaproteínamientrasno

RMN (Srinivasan et d

,

la

para predecir la estructura de

se encuentrendisponibles los datoscristalográficos o de 1993).

Dos requisitos indispensables en el modelado de estructuras homólogas son: a) elque

se disponga de la secuencia de aminoácidos de

la proteína de estructura

desconocida; b) que secuente coninformacióntridimensional mismafamiliaestructural 1969; Creer,1981

;

de moléculas de la

a la quepertence la proteínaencuestión(Browne

et d.,

Blundell et a/., 1987). En este trabajo se seleccionó una de las

estructurascristalográficamentedeterminadasen

la familia de las PSV para que

el esqueleto de este molde se sustituyerontodos los residuosqueconstituyen la secuencia de la quimopapaína, y por técnicas de simulación molecular, se permitió que la molécula híbrida adquiriera la conformaciónrepresentativade la proteínaenestudio.Finalmente se procedió a evaluar la calidad estereoquímica del modelo obtenido y a confrontar sus características geométricas conla información experimental disponible. sirviera de molde

a la quimopapaína. Sobre

A continuación se describe la metodologíaseguidaen modelar la estructura tridimensional de la quimopapaína.

este trabajopara

Selección de Ia estructura base Para poder elegir convenientemente

de entre las tres proteasas de estructura

tridimensionalconocida y pertenecientes a las PSV, aquélla que mejorsirviera de base para modelar a la quimopapaína, se compararon las secuencias de aminoácido la aplicación detrescriteriosdeselecciónestadísticos

deestasenzimasmediante

independientes. Se emplearon las secuenciasreportadasporMitchel parapapaína,porCarne

8,

para la proteinasa

Estas secuencias coinciden con

IR.

et a/. (1970)

Moore (1978) paraactinidina y porDubois et a/. (1988)

las estructuras primarias

correspondientes a las mismas enzimas y que se encuentran depositadas junto con los archivos 9PAP, 2ACT y 1 P P O (en pre-liberación)

sus coordenadas espaciales en

del banco de datos cristalográficos

(PDB)(Bernstein et a/., 1977; Abola et a/., 1987).

Parael caso de la quimopapaína se utilizó la secuencia de aminoácidos determinada recientementepor

Jacquet et al. (1989) y Watson et a/. ( 1 990). Los criterios de

selección mencionados que se describen a continuación, involucraron comparaciones en la composición de aminoácidos, análisis de

la homología en secuencia

determinación de la significancia en esa homología en estructura

y

primaria, para cada

proteína caracterizada tridimensionalmente en su confrontación con quimopapaína. I) Homologia en composición.

En este método se determina la diferencia en contenido de aminoácidos que mantienen dos proteínas, a fin de establecer una comparación en composición entre ellas que sirva como primer criterio

de homología; independientemente del

conocimiento que se tenga de las secuencias individuales de las macromoléculas en estudio. La hornologia en composición diferencias en el contenido de cada uno

se evalúa a través de la suma de las de los 20 aminoácidos constituyentes deuna

pareja dada de proteínas, de acuerdo con la siguiente expresión: i=20

IDC =

y.

-

2

(compAi compB1)

9

donde IDC es elíndicede

la diferenciaencomposición

y compAi y compBi las

composiciones del aminoácido i en la pareja de proteínas involucradas A y B. Estas a lafrecuenciaconqueaparecen

composicionespuedenserreferidastanto

los

residuos en la cadena polipeptídica, comoal porcentaje del total de aminoácidos que corresponde a cada residuo en una proteína dada. En cualquier caso, de acuerdo con la relación ( I ) , un valor de IDC=O significa que las proteínas en comparación tienen

idéntica composición de residuos (cero diferencias); y por consiguiente a un mayor valor de IDC corresponde una mayordivergenciaentre

las composiciones de las

moléculas comparadas. En este trabajo se aplicó el criterio descrito para confrontar la composición de aminoácidos de la quimopapaína y cada una de las tres proteasas cristalizadas de las PSV. 2) f-fomología en secuencia. Alineamiento de pares de secuencias.

Parallevar

a cabo la comparacióntopológicaentreestructurasprimarias,

utilizóelalgoritmodesarrollado

poy Myers

S,

Miller (1988) específicamente parael El criterio de homología en

alineamiento de parejasdesecuenciasdeaminoácidos. estecaso,consistió

se

en la identificación de la estructuraquemantuvieraelmayor

número de residuos idénticos y/o similares, simultáneamente con el menornúmero d e insercionesensucadenapolipeptídica,

al seralineadacon

la quimopapaína. El

método de Myers 8. Miller para alinear una pareja de secuencias de aminoácidos, que llamaremos nuevamente

A y B, consiste en la determinación del conjunto

operacionesquetransforman

la proteína A en B de talmanera

costos d e cadaoperaciónsobrelassecuencias,sea

de

que la suma de los

la menor. Las tresoperaciones

definidas son:

(a) Reemplazo de un aminoácido por otro. (b) Supresión de n aminoácidos consecutivos.

(c) Inserción de El costo de reemplazar un residuoporotro

11

aminoácidos consecutivos.

se encuentra especificado en una

matriz W donde cada elemento en el arreglo matricial w(a,b), corresponde al cambio delaminoácido a de la primerproteínaporelaminobcido

b de la segunda. En este

trabajo se utilizó la matriz MDM-78 (Schwartz S , Dayhoff, 1978) que se basaen la estadística de mutaciones puntuales en secuencias

de proteínas homólogas. El costo

de insertar o suprimir un conjunto de n aminoácidos en cualquiera de las secuencias por alinear, se calcula a través de la Función:

10

F(11) =

donde CA es el costode

CA

aperturade

+ (n*CU)

(2)

una inserción y CU es el costo porcada

aminoácido que deba ser agregado a la secuencia. De acuerdo con lo recomendado por los autores, se utilizaron valores de penalización de 100 unidades para cada uno de estos parámetros de alineamiento.

sí por el

Los residuosdeaminoácidoquesonconsideradossimilaresentre métododealineamientoempleadoen

este trabajo Fueron:

A, S y

T (residuos pequeños y polares); D y E (residuos que pueden adquirir carga eléctrica negativa);N y Q (residuos polares vinculados con los dos anteriores); R y K (residuos que pueden adquirir carga eléctrica positiva); I , L, N y V (residuos alifáticos); F, Y y W (residuos aromáticos).

3)Sig11ificanciade la homologia. la selección d e la estructura de basepara el modelo de la quimopapaína, Fue la ponderación del parecido en secuencia entre dos proteínas, respecto a lo que pudiera deberse solamente a casos fortuitos o aleatorios.

El tercercriterioempleadoen

Es decir,deacuerdoconelcriterioestadístico,paraprecisarsidosestructuras presentanhomologíarealquepudiera

dar unaclaraindicación

de algúnancestro

común, es necesario obviar a todas las proteínas cuya secuencia resulte

la de interés sólo por una combinación

El algoritmodelmétodoque

estodsticamente afortunada d e sus residuos.

se utilizóaquí

Wunsch (1970), modificadoporDayhoff

semejante a

es eldiseñadoporNeedleman

8,

( 1 978)y Feng et al. (1985). Este método

consiste en comparar, en unidades de desviación estándar,

la puntuaciónlograda al

alinear las secuencias de aminoácidos dela proteína de interés y d e aquélla d e la que se sospecha un parentesco. Esta puntuación se almacena, e independientemente se vuelven a comparar las secuenciasdeaminoácidosdeestasdosproteínas,pero ahora la secuencia de la segunda macromolécula se mezcla aleatoriamente, aunque la composición, y se evalúa un nuevo marcador.

La mezcla de aminoácidos al azarjuntoconelcálculode la homología.ensecuenciaencada iteración, se prolonga a voluntaddelusuario. El grupo de valores obtenido de esta los que manera, genera toda una distribución de eventos de homología aleatoria en la proteínadecomparaciónestaráincluida; a menosquerealmentemantenga cercaníaevolutivacon la proteínadeinterés.Cabeseñalarqueen el uso de este

sin cambiar

11

método se encontró una grandependenciadelparámetro

de significanciacon el

número de comparaciones aleatorias. Los resultados de este andlisis se publicaron en otrolugar (Rojo 8. Padilla, 1993) y de ellos se establece que elnúmeroóptimo

de

iteracionesque se requiere para llevar a cabo una comparaciónconfiableentre

las

secuencias analizadas, debe mantenerse entre esta prueba se aplica Fundamentalmente

80 y 150 mezclas aleatorias. Aunque a proteínas con baja homología

en

secuencia, se optó por utilizarla en este trabajo para tener mayor confianza en que la estructura seleccionada sería la base más adecuada para

la construcción del modelo

de la quimopapaína. Modelado molecular

Las simulacionesdemecánica

y dinámicamoleculares, se realizaronen

un

sistema IBM RS6000 con l6MB dememoria RAM y 16 Mflops de rendimientoen cálculo numérico. Este recurso se utilizó junto con el programa de cómputo BIOGRAF Versión 2.2 (MolecularSimulationsInc.,Waltham,

MA.) y elcampo

de fuerzas

Dreiding//(Mayo et d., 1990).La paquetería de BIOGRAF permite el manejo

estructurasdepositadasen

los bancosdedatoscristalográficos,

d e las

su representación

gráfica, sumanipulación y análisis, así como la realización de todos los ~ l c u l o sde energía que permiten la simulación de sistemas macromoleculares. A continuación se reseñanbrevemente

los principiosteóricosen

Fundamentan las técnicasdemodeladomolecular,

los que se

y se explican los ,algoritmos de

minimización y dinámica moleculares empleados por BIOGRAF. Superficie de energía potencial

una molécula es un problema

La descripción matemática completa de

formidable debido a las pequeñas escalas dimensionales y a las grandes velocidades involucradasen los movimientos atómicos. Debido a queaúnno teoríamecánico-cuánticarelativistaqueaporte los efectos que se presentan en

se cuenta con una

una descripciónadecuada de todos

las moléculas o ensistemasmoleculares,

es

conveniente revisar un planteamiento de la energía en forma simplificada. De acuerdo con la ecuación de Schrodinger: HY(R,r) = EY(R,r)

12

donde H es elHamiltoniano

para el sistema, Y es la Función d e onda y E es la

energía (por lo común, Y es Función de las coordenadas tanto del núcleo como los electrones). Aunquemuy

de

general,estaecuaciónesdemasiadocomplejapara

cuaiquierusopráctico,demaneraquedebenintroducirsealgunassimplificaciones como la de Born

8,

Oppenheimer ( 1 927) según la cual puede generarse, con buena

aproximación, una ecuación para elmovimientoelectrónicoque

sea independiente

de la que describe al movimiento nuclear, y que dependa sólo paramétricamente de las posiciones de los núcleos atómicos:

HY(r;R) = EY(r;R) En estaecuación

(4)

se define una energíaconocidacomo

la superficie deenergía

potencial, que es función únicamente de las coordenadas nucleares.

en la superficie de

La segunda ecuación que describe el movimiento nuclear

energía potencial es:

H@(R)

=

(5)

E@(R)

donde 0 es ahora una Función que

depende solamente

de las coordenadas

nucleares.

Si se requiere el estudio de

la evolución en el tiempo

resolverse la ecuación (5), sin embargo

de una molécula, debe

la ecuación (4) debe ser resuelta

previamente, lo cual noresulta trivial; por ello, para resolver la ecuación (4) se utiliza normalmente un ajuste empírico a la Superficie de energía potencial. La solución a la ecuación mechico-cuántica (5) es llamada dinámica cuantica, pero dado que puede considerarse a los núcleos como objetos relativamente pesados

al compararloscon

los electrones, los efectos cuánticos resultan despreciables y ental caso, al introducir

una aproximación, la mismaecuación

(5) puedereemplazarsepor

la ecuacióndel

movimientodeNewton,donde se calculanlasvelocidadesqueexperimentacada dtomo de la molécula como Función del tiempo, en cada conformación:

13

La soluciónde la ecuación (6) mediante el ajuste empírico

energía potencial,

a la superficie de o

La mecánica molecular

es llamada dinámica molecular.

minimización de energía, que es un método paralelo a la dinámica molecular, por su parte,ignora

la evoluciónde

los sistemaseneltiempo

y se especializaen

búsquedadegeometríasparticulares,susenergíasasociadas

la

y otraspropiedades

estáticas. Campo de fuerzas ,

El campo de fuerzas es el ajuste empírico a la superficie de energía potencial y

está integrado tanto por

la serie de ecuaciones que describen

interaccionesmoleculares,como

de parámetros que resultandel

porelconjunto

ajuste a la superficiedeenergíapotencial(Ermer, de fuerzasempleadoscomúnmentepara

las diferentes

1976; Hagler, 1985). Los campos

la descripción de las moléculas,emplean

una combinación de coordenadas internas (distancias

y ángulos d e enlace, torsiones

y distorsión en centros de inversión) para describir

la contribución de las

interacciones covalentes a la superficie de energía potencial. Además, estos campos utilizan las distanciasinteratómicas

para estimarlasinteracciones

van der Waals,

electrostáticasy de puentes de hidrógeno. Laforma de las funciones es muy variable, y van desde simples ecuaciones cuadráticas hasta funciones

deFourier

y potencialesLennard-Jones,entreotras.

fuerzas esdescribir,conprecisiónrazonable,

El objetivode

a unagrancantidad

diferentes. De esta manera, el campo de fuerzas interpola información de

un

un campo de de moléculas

y extrapola a partir de la

pequeño conjunto moléculas de empleadas para su

parametrización,hacia un conjuntomayordeestructuras Cabe señalar que en

de Morse, expansiones

y moléculasrelacionadas.

un campo de fuerzas, tanto la forma de las funciones, como los

parámetrosen sí mismos,representan la únicagranaproximaciónenelmodelado molecular. La calidaddelcampodefuerzas,suaplicabilidad predecir las propiedadesestimadasen

y su habilidad para

la simulación,determinadirectamente

la

validez de los resultados. La partefundamentalde

un programa de simulaciónmolecular es elcálculo

de la energía potencial para una determinada distribución espacial d e los átomos. El

14

a las coordenadas

dlculo de esta energía, junto con sus derivadas respecto

atómicas, aporta la información necesaria para la representación de los movimientos atómicos reales. Existendiferentescampos

de fuerzasque se empleancomúnmentepara

la

simulación de una grancantidaddemoléculastantoorgánicascomoinorgánicas. Entreellosdestacan:Dreiding-//(Mayo ef a/., 1990), AMB€R (Wiener et a/., 1984; 1986), CVFFy CFf9l (Biosym Technologies, 1993) y C H A R " (Brooks ef a/., 1983).

Como se había mencionado, las coordenadasreales moléculacombinadasconelcampodefuerzas,describen potencial a travésde

de los átomosde una la superficiedeenergía

una expresióngeneralqueconsidera

las contribuciones de

interacciones enlazadas (ocovalentes)y no enlazadas de la siguiente manera: Epotencial

=

Ecovalente + E n 0 covalente

(7)

donde:

Eno-covalente= EvdW + ECoulomb (5)

(6)

+

Ep-hidrógeno

(9

(7)

La expresiónmatemática para los términos de las ecuaciones (8) y (9) está

determinadaporelcampodeFuerzasespecífico

que se utilice. En este trabajo se

empleó el campo de fuerzas Dreiding-//que forma parte del programa molecular BIOCRAF, y enelque

de simulación

se definen las contribuciones a la energía potencial

de la siguiente forma:

15

En las expresiones anteriores los términos ( 1 ) a (4) representan la energía de deformación de lasdistancias y ángulosdeenlace (R y e), ángulos de torsión o diedros (cp) einteraccionesfueradelplano

o deinversión (a),respectivamente. Los

términos (S) a (7) corresponden a interacciones entre átomos no enlazados: van der Waals, representadaporunafuncióntipoLennard-Jones

12-6; unarepresentación

coulómbica de las interacciones electrostáticas (donde la constante dieléctrica,

la distanciaentre

dependientede

E,

las cargaseléctricasparasimularelefecto

es de

apantallamientodelsolvente) y finalmente, un terminoexpiícitopararepresentar

a

las interaccionesporpuentesdehidrógeno,tambiénconunafuncióntipoLennard-

Jones pero con exponentes 12-1 O. Todas las constantes presentes forman parte de la parametrización del campo de fuerzas. La figura 2-1 muestra esquemáticamente las interacciones atómicas consideradas porla generalidad de los campos de berzas. Minimización de ener-íao mecánica molecular

U n métododegran

utilidad paraexplorar la superficie deenergíapotencial

consiste en encontrar conformaciones que sean puntos estables sobre

esa superficie.

La minimizacióntienecomoobjetivoprimordial,eldeterminarunaconfiguración espacialen

la que la fuerzanetasobrecadaátomo

sea cercana a cero. De esta

manera, las conformacionesestablespuedendeterminarsesimplementellevando valor mínimo

la energía del sistema.

problemas al realizar

al

Sin embargo se presenta una serie de

esta tarea, sobre todo en el caso

macromoléculas, ya quegeneralmenteexistenvariosmínimosen

de proteínas y otras la superficie de

energía potencial donde las fuerzas sobre cada átomo son cercanas a cero, por lo que

la identificación del mínimo global no resulta trivial. Por otra parte, aunque teóricamenteesfácildeterminar la convergenciadelproceso,en la práctica se dificulta su identificación,debido a queelmétodoaproximaasintóticamente la

16

c +c.

+c

+c Figura 2-1. Rcprescntación grifica dc los ldrminos dc las ccrtacioncs (10) y (11). Las contribuciorm a la cncrgíapolcncial qttc sc inclrt!w SOH: 1 ) distancia deenlacc; 2) ingulo de enlace; 3 ) lorsioncs o ingulos dicdros: 4) intcraccioncs h c r a dcl plano o inversioncs; 5)-7) inlcraccioucs W I I dcr Waals. corllótnbicas y dc pucnlcs dc hidrógcno.

energía del sistema a su valor mínimo, y el usuario debe decidir en qué momento se está ya suficientemente cerca de este punto. La minimización de una molécula se realiza en dos etapas; primero se evalúa

la expresión de energíacomoFuncióndelascoordenadaspara

inicialdada, y despuésseajustaesaconformación alcance sumenorvalor.Estemínimode

una conformación

de tal maneraque

la energía una o en

energía,puedeencontrarseen

varias iteraciones (que pueden llegar a ser de cientos), dependiendo de la naturaleza del algoritmo de minimización, de la forma de la ecuación que expresa la energía

y,

del tamaño de la molécula. La eficiencia del proceso de minimización se juzga tanto por el tiempo requerido

para evaluar la Función de energía, como por el número de

ajustes estructurales o iteraciones necesarias para converger a un mínimo. La mayoría de los algoritmos de minimización, asumen

que la superficie de potencial es

aproximadamentearmónica,yaqueaún

las superficiesanarmónicassondescritas convenientementeen el límitedeconvergenciaenelmínimo.Dadaunaecuación que describe la superficie de energía para un sistema y un punto de inicio sobre ella (conformación inicial), los métodosdeminimizacióndebendeterminar la dirección haciaelmínimo

y la distanciaque

lo separadeél.

Una direcciónrazonable

para

iniciarel dlculo, es simplemente la queproduceelmayorcambiode

la funciónen

ese punto. Los algoritmosmáscomunesdeminimización,enorden

deeficiencia,

son: búsqueda lineal, máximos Raphson(BiosymTechnologies,

descensos, gradientes conjugados

y Newton-

1993). En este trabajo se utilizóelmétodo

gradientes conjugados debido a que es elmáseficiente algoritmodeNewton-Raphsonrequiereunacantidad

de

a nuestro alcance, pues el

de memoriaque

excede la

capacidad de cualquier computadora actual en el caso de macromoléculas. Gradientes conjugdos

Este método utiliza

un algoritmo que produce una base completa de

direccionesmutuamenteconjugadas,

de talformaquecada

paso sucesivorefina continuamente la direccióndebúsquedahaciaelmínimodeenergía. El algoritmo principia con la determinación de la dirección de máximo cambio de la superficie de energía, ho, igualándolocon la derivada o gradiente, go, en un puntodeinicio cualquiera. En esa dirección busca iterativamente la conformación de mínima energía, y actualiza las coordenadas a ese punto. Las direccionessiguientes, hi+l, son calculadas a través de la fórmula:

17

donde gi+l es el gradiente en los puntos sucesivos,y y¡ es un escalar definido como:

Todos los cálculosdeminimizacióndeenergía

de este trabajo, se realizaron

con las opcionesdemecánicamoleculardelprograma convergencia utilizado consistió en que

BIOCRAF. El criteriode

la magnitud del gradiente de energía entre

dos etapas consecutivas de cálculo, Fuese menor o igual a 2 kcal mo/-l/f-l.

Dinámica molecular La dinámica molecular resuelve las ecuaciones del movimiento para sistemas atómicos, lo cual se traduce como la representación de la evolución en el tiempo de los movimientos moleculares (también llamada trayectoria). Esta técnica permite

a la

molécularemontarmáximosdeenergíaparaexplorarmúltiplesconformaciones estables(mínimoslocalesde

la superficiedepotencial).

La dependenciaconel tiempo es simultáneamente la fortaleza y la debilidad de este método, ya que sólo puedensimularsedemanerapráctica,trayectoriasdelordende 1 0-l2 a segundos (de picosegundos a nanosegundos). Como se había mencionado previamente, en la metodología de simulación de la dinámica molecular se resuelve la ecuacióndelmovimientodeNewton

para cadaátomodelsistema:

donde Fi es la fuerzaqueactúasobreeli-ésimo

átomo, mi sumasa

Fi

=

mi+,

y ai su

aceleración. El cálculode

la fuerza,necesario para resolverestaecuación,puede obtenersedirectamentede la derivadade la energíapotencial E respecto a las coordenadas ri; estaes la razón deexpresar a la energíapotencialenunaforma analítica y diferenciable:

En principio,con una expresiónadecuadade

masas conocidas de todos

la energíapotencial

los átomos, sería posible resolver

(14) paracalcularfuturasposicionesatómicaseneltiempo

y con las

la ecuacióndiferencial (esto es, determinar la

trayectoria). Desafortunadamente,la física clásica sólo proporciona soluciones exactas

18

a esta ecuación para sistemas de 1 ó 2 partículasindependientes. La resolución de

sistemas mayores requiere el empleo de métodos numéricos, que aportan soluciones aproximadas.

El movimiento de un átomo particular puede expresarse mediante su de Taylor. Si la posición al tiempo t es r(t), la posición desarrolloenunaserie después de un pequeño intervalo de tiempo At será:

+ ... r(t+At)= r(t) + (&/&).At+ (iS2r/6t2).At2/2

(15)

La soluciónnuméricade las ecuacionesdelmovimientodependededos gruposdefactores: a) elconocimiento de la posición r(t), la velocidad 6r/6t y la aceleración &/at2 y b) la aproximación que omite a 10stérminos de orden superior. Las coordenadasiniciales se obtienengeneralmentedeestructurascristalográficas, mientras que las velocidades iniciales son asignadas al azar siguiendo la distribución de Maxwell-Boltzmann que corresponda a la temperatura de interés en la simulación (normalmente 300 K). Una vez resuelta la ecuación ( I S ) , las coordenadas originales se reemplazan por nuevas y las velocidades se actualizandividiendoelcambiode posicióndecadaátomo por elincrementodetiempo At; la aceleración se corrige calculando los gradientes 6E/6ricon las nuevas coordenadas. Un ciclo se completa al realizar estos cálculos para todos los átomos constituyentes de la molécula, y este proceso se repitemiles

o quizá, millonesdeveces

para efectuar la simulación

dinAmica del sistema. Método de Verlet

El algoritmousado

por BIOCRAF para resolverlasecuacionesdiferenciales

( I S ) , es el propuesto originalmente

por Verlet ( 1 967),y que se describirá

brevemente a continuación. Si Vprom es la velocidad promedio durante el intervalo de tiempo transcurrido

entre t y (t+At), entoncesla posición al final del periodo será: r(t+At)= r(t) + Vprom.At

19

Si se supone que la velocidad cambia linealmente durante At, entonces la velocidad promedio puede igualarse a la velocidad instantánea en At/2: Vprom

=

V(t + At/2)

Por otra parte, la velocidad instantánea puede ser calculada de la aceleración promedio desde (t -At/2) hasta (t + At/2): .At V(t + At/2) = V(t - At/2) + aprom Si nuevamente se suponeque

(18)

la aceleración es aproximadamente lineal en el

intervalo de tiempodescrito,entonces

la aceleraciónpromediopuedeestimarse

como su valor instantáneo e n el tiempo t:

Lo anterior conduce a la siguiente expresión para la velocidad: V(t + At/2) = V(t - At/2) + a(t).At AI combinar las ecuaciones (16) y (17) s e obtiene una ecuación similarpara

actualización de las coordenadas,donde

V(t

+

(20) la

At/2) se conoce a través de la

ecuación (20): r(t + At) = r(t) + V(t + At/2).At

(21)

las posicionesatómicas se calculan alfinal de cada incremento de tiempo, mientras que las velocidades se actualizan a la mitad del intervalo (At/2). Cada ciclo que estima las nuevas coordenadas en el tiempo consta de: a) el dlculo de la aceleración, (-l/mi).6E/6ri(t),al tiempo t, b) la actualización de la velocidad al tiempo (t + At/2), a partir de su valor en el instante (t - At/2) con la ecuación (20)y c) la estimación de las coordenadas para el tiempo (t + At) usando su Puede observarseque

valor al tiempo t y la ecuación (21).

20

Un parámetroclaveenelalgoritmo

de Verlet es elvalorasignado

al At.

Obviamente para optimizar los recursos de cómputo conviene emplear el valor más alto del incremento de tiempo. Sin embargo,existenlímitesfundamentalespara usodeintervalos

de tiempograndes. La principallimitaciónson

el

los movimientos

moleculares de la mayor frecuencia a ser simulados. Las vibraciones rápidas implican cambiosabruptosdevelocidad divididoen

y aceleración. Un periodovibracional

debeser

al menos 5 ó 10 segmentos para satisfacer la suposición de Verlet

respecto a que las velocidades y aceleraciones sean lineales a lo largo del periodo de integración. Se conoce que l a s frecuencias de vibración más altas corresponden

a la

distorsión de la longitud de enlaces que involucran átomos ligeros; en nuestro caso la vibración más alta se espera para los enlaces entre átomos de carbono e hidrógeno (C-H), cuyoperiodo es delordende

segundos. Por lo tantoen

este trabajo se

utilizó un At de 1 O"5 segundos (1 k). Otroconceptofundamentalen

las simulaciones de dinámica molecular

es el

de la temperatura. Básicamente, la temperatura es proporcional a la energía cinética

de la molécula, lo cual puede expresarse más convenientemente en términos de las velocidadesatómicas. La relaciónentretemperatura

y velocidad de un sistema se

encuentra a través de la Teoría Cinética de los Gases, con la ecuación de MaxwellBoltzmann: (22)

f(v)6v = (m/2?c1

>

>

>

W

u

> I- I-

u

W

W

m

6

v, 1

-I

w

" I

1

l4 - z c3 c3 tI-

H

bL z

bL z

H

H

c3

c3

n c3

n c3

o L L

->

c3

c3 -0

LL

LL >-

>-u

6

>

1

v,

v,

LL

LL

6

6

o

o

3

o

m -4

c3

c3

u

"U

c3 v,

-0

> >

-1

m

-1

n

6

6

I - I -

6 z

bL - z

n

u -1

>

" I" I

-m

6

bL bL

1L L z -v,

CY CY

W

= -4 >

c3 -I-

n -H

z -m W -

n

U

n

>

>

c 3 -

9

CY

-I -t

6 z 6 -

6

E O

O

6

Q

6 n O

H

U

6 U

'+.I

W

O

O

6

n

n O

H

CY3 n U

&

v, * -Ic3 c3

t

4

z

. Q I-. I-. W

'H

W

z -o z z n -m u -a

3

n

CY

W

>

-2

3

c3

6 CY

u

>

-m

LL

n

-z

n

z

LL

u

>

c3 [ I

> > > v, >

c3

o

v,

z

U

W

v,

a

v,

LL -c3 -6

3

m

c3 c3 n -u

U

n Q CY LL c3 c3

6 -"I-

u

LL

n

" I

6

I

hL

I- Ic3

c3

>

I- I-

-1

LL

W

>

>

w -n

c3

W

I

o

M -> H

4

I

n

W

>"I

>

6 a

6

W

Q

E

d

O

I-

O

crc

n

4 z

z

'U

fi O 2E

H

3

U

t

6

'H

-

W

4 n

E

6

O

IO

e Q

Q

O

E

H

3

U

número limitado de residuos. En esta reorientación se buscó disminuir los contactos van der Waals entre la nuevacadenalateral y el resto de realizadoenotrostrabajos

de modeladomolecular

la estructura, como se ha

(Blundell, 1991; Srinivasan,

1993), a fin de evitar tensiones excesivas antes de intentarla regularización global de la geometríaporminimiucióndeenergía.

los mayores problemas de compatibilidadentre la proteinasa SZ y la nuevaestructuragenerada durante el proceso de sustitución de las cadenas laterales fueron: SerW+Lys, Val100 +Lys, IlelO4+Lys y Val1 10+Tyr. En todos estos casos los residuos se encontraban en zonasdecadenaaleatoria

Los sitiosquepresentaron

y sólo fuenecesarioreorientar

las nuevascadenas

laterales al exterior de la proteína. b) Minimizdción de Energía.

Conelpropósitodedisminuir

la tensiónprovocada por interacciones de alta

energía en la molécula, se procedió a minimizar la energía potencial de través de una seriedeetapasdemecánicamolecular.

Se sabe que,

la misma a

en general, la

sustituciónderesiduossobreunaestructuratridimensionaldadageneratensiones a problemas de estericidad,

locales debido

y que en

estas condiciones

una

minimizaciónglobal sólo propagaría las distorsiones de los sitios de mayor tensión hacia el resto

de la molécula.Por esto, resulta recomendable identificar y minimizar

a cualquierprocesoderelajamientomasivo.Cuando se emplea BIOGRAF para realizar mutaciones sobre cadenas polipeptídicas, los residuos de prolina involucrados (tanto para la susitución Pro+Xaa comopara XaajPro) son esasregionespreviamente

los másnotablesencuanto la creacióndetensionespuntuales. De esta manera se los residuosPro68+Gln,Pro69+Thr, efectuaronminimizacionesindividualespara GlylOl+Pro, Glnl14+Pro,

Pro1 15+Ser, Thrl83+Pro, Prol97+Ser

y Proí!Ol+Gln,

mediante la relajación de sus cadenas laterales, seguida de la minimización de todos

los átomos del residuo y, finalmente, de la regularización del residuo completo junto concuatrovecinosensecuencia(dosprevios requirieron entre

y dosposteriores). En cadacaso se

100 y 200 iteraciones para alcanzar un mínimo de energía

potencial.

La siguienteetapaconsistió en la minimiuciónsimultánea de todas las cadenaslaterales,manteniendo fijas las posiciones de los átomosde la cadena principal y de las 134 moléculasdeaguaquepertenecían a la proteinasa R. Esto permitióque las cadenaslateralespudieranreorganizarseenergéticamente e n el

28

espacio, sinmodificar

la topologíade

a estaetapa

la estructura de base.Previos

las coordenadascristalográficas de la proteinasa i2 nocubrían los requisitos del formato PDB y h e necesario editar el archivo de 2198 átomos para establecer todos los dobles enlaces presentes, así como cambiar el tipo de átomo de los nitrógenos en los grupos amino de la cadena principal y modificar el residuo carboxilo terminal de la proteína. Además se presentaron traslapes entre las cadenas laterales de la Tyr93 y delAsn 173 con dos moléculas de agua, por lo que éstas tuvieronqueserremovidasdelsistema. Una vezrealizadastodasestas modificaciones, se sometió la estructura a 100 etapas de minimización, con lo que la energía potencial disminuyó de 6861 a 838.5 kcnl/mo/.

ocurrieronalgunosimprevistos:

la estructura h e el incluir a las

El paso siguiente en la minimizaciónde

moléculas de agua en el conjunto de átomos móviles que comprendía laterales. Este proceso llevó

a las cadenas

a la energía potencial de un valorinicialde

-364.8 kcal/mol en 210 etapasdeminimización.Finalmente,

1358 hasta

se procedió a la

a la totalidad de los átomosde la molécula. En este caso 210 etapasdeminimizacióncondujeron a la energía potencial de 396.4 hasta un valor de -1429 kcn//mo/. minimiuciónglobal,permitiendolibertaddemovimiento

c) Convergencia hacia /a conformación de equilibrio. La primera etapa en

la simulación de

quimopapaínainvolucróelmodeladode

la dinámica molecular

de la

los dos últimos residuos de esta proteína,

debido a quecomo semencionó,fueronadicionadosenausenciadeaminoAcidos topológicamente equivalentes en la estructura de base. En este proceso se permitió

a los cincoúltimosresiduosde la cadenapolipeptídica (Phe214, Lys215, Gly216, Phe217y Ala2 18) y también a sus átomos vecinos en un radio de 5 A. Estadinámica se realizóconunaprimerasimulación de 150 ps a la temperatura de 300 K,seguida de la remoción de 8 de las 10 moléculas de agua incluidas en la región de átomos móviles (lo cual permitió la interacción de los residuos 21 7 y 218 con el resto de la proteína),y de una minimización de energía. Finalmente, se simuló elmovimiento

una nueva dinámica molecular de esta zona, también de Un procesodeminimizaciónde

150 ps a 300 K.

la quimopapaínaprecedió

a la dinámica

molecular global de la estructura, simulada en condiciones de temperatura de durante 60 ps. AI confórmero de menor energía

300 K

en la trayectoria calculada en esta

29

etapa, se le aplicó una nueva minimización de energía de 60 etapas, lográndose las energlaspotencialesmásbajashasta este puntodelmodelado. Sin embargo, al analizar la estereoquímica de este confórmero, se detectaron los carbonos a de seis residuos e n configuración D y dos enlaces peptídicos en conformación cís. Antes de pasar a la siguiente etapa de dinámica molecular,

se corrigieron todas estas

a la Pro1 51 que se mantuvo en conformación cis, por ser éSta una característica común observada en las proteasas sulfhidrílicas vegetales cristalizadas. Además, se removieron seis moléculas de aguadebido a queespontáneamentesesepararondelresto del sistema(evaporación)duranteelprocesodesimulacióndinámica. La estructura resultante he sometida a un nuevo cálculo de minimización de energía, y después a una dinámica molecular de 40 ps. De los confórmeros obtenidos en este cálculo, se seleccionó eldemenorenergíapotencial, y sobre éI se definierondemanera del enlace peptídico previo

anomalías geométricas, con excepción

explícita la totalidadde los átomosdehidrógeno

(1230) delsistemamolecularen

estudio. La estructura resultante mostró todos sus residuos en conformación presencia minimizada para regularizar la geometría en agregados(hidrógenos).Posteriormente,

L y he

de los nuevos átomos

se realizarondosprocesosdedindmica

molecular, de 35 y 105 ps, separados por una nueva minimización de energía. De la dinámica de 105 p s se eligieron a los tresconfórmerosquemostraron energíapotencialdelconjunto;éstosfueronminimizados ellos se seleccionó a la geometríademás estructuratridimensionalde

la menor

y, finalmente,deentre

baja energía para representar a la

la quimopapaína. En la figura 3-5 se esquematiza la

naturaleza flexible del modelo obtenido, a través de la superposición de las cadenas a de los diferentes confórmeros obtenidas de la simulación de su dinámica molecular

de 105 ps. Es conveniente señalar que para generar cada una de las estructuras que 6000 conformaciones aparecen en esta figura 3-5, elprogramacalculóenrealidad intermedias, para las quefuenecesarioevaluarcadavez las interacciones entre 10s 3645 átomos del sistema.

Las coordenadas del modelo

de la quimopapaína

obtenidas después de esta larga serie de etapas, fueron interpretadas

por el sistema

de despliegue gráfico del paquete de cómputoBIOGRAF, como se ilustra en la figura 3-6. Evaluación d e la calidad estereoquímica del modelo

En un estudiosobremásde

400 proteínasconestructuratridimensional

conocida, Morris ef a/., ( 1 992) obtuvieron las tendencias conformacionales generales

30

queseguía la geometríade las proteínasconsideradas y la correlaciónquepodía establecerse entre esta geometría,la resolución y el factor X cristalográfico para cada proteína del conjunto estudiado. Entre sus resultados más importantes, estos investigadores definieron tres zonas de incidencia sobre un mapa de Ramachandran que incluye a los 121,870 residuos de aminoácido de 462 proteínas y donde se han obviado a los residuosdeprolina

y glicina. Las zonas se distinguen entre sí por la

densidad de residuosregistrada

en cadaunadeellas

y sonclasificadascomo

regiones nucleares (C),observadas (G)y permitidas (A)o también de alta, media y escasa densidad de población, respectivamente (Fig. 3-7). Respecto a la correlación entre la geometría, la resolución y el factor

R de las proteínas analizadas, Morris et a/.

(1992), encontraronqueaquellasestructurasdeterminadasconbuenaresolución

y

con factores X pequeños, presentaban un alto porcentaje de sus residuos dentro de

las zonas nucleares e n el mapa de Ramachandran (Fig. 3-8). El trabajo citado también los valoresdealgunos incluye la determinacióndeintervalosdeconfianzapara elementos geométricos, que deben observados ser por las estructuras tridimensionales de alta resolución. Estos elementos comprenden: ángulos diedros 0 y Y de residuos que forman parte de hélices en

la proteína; ángulos X3 de puentes

disulfuro; ángulos 0 en prolinas; ángulos o de todos los residuos del polipéptido; la quiralidadde los carbonos a y de las cadenas laterales de residuos de Thr e Ile; la conformaciónde los enlacespeptídicos e incluso, los valoresdeenergíapromedio que pueden adquirir las interacciones de puentes de hidrógeno e n el afinamiento de estructurascristalográficas (Tabla 3-11). El trabajo de Morris et a/. (1992) es tan completo, que actualmente se utilizan sus criterios para la aceptación de estructuras tridimensionalesen

las basesdelBancodeDatosCristalográficos

de Proteínas

(Brookhaven National Laboratory, 1992). de Para la evaluación

la calidad estereoquímica del modelo

quimopapaínapropuestoenelpresentetrabajo,

de la

sesometió la estructura deesta

proteína al juicio de los criteriosdel PDB mencionadosen el párrafoanterior, y los resultados obtenidosse detallan a continuación. Del total de los 178 residuos que contiene la quimopapaína al excluir prolinas y glicinas,el 70% de las parejasdeángulos Q, y Y se encontrarondentrode las zonas o regiones nucleares según

se muestra en el mapa

de Ramachandran

construido para la quimopapaínaen

la figura 3-9. De acuerdoconMorris

ef a/.

31

-90

+90

! +90

-90

Figura 3-7. Regiones nuclear(C), observada (G) y permitida (A) sobre la densidad de puntos en el mapa de Ramach,andran de 121,870 residuos, de acuerdo con Morriset al. (1992).

n

L

I

O CD

C

O

i

C

-2

. m

>

U

4

r n 4

LL

.

4

L

-

150

100

50

H

tTJ

CL

O

-50

-100

-150

-150

-100

-50

O

50

100

150

F'I

Figura 3-9. Mapa de Ramachandran para el modelo de la quimopapaína. Las líneas continuas delimitan las regiones nuclearesde la figura 3-7. Los residuos de prolinay glicina estzín identificados por O y&, respectivamente.

(1992),este porcentaje de residuoscorresponde a unaresoluciónde 2.9 A y a un factor R d e 0.28 en estructuras de proteínas obtenidas cristalográficamente (Fig. 3-8). Paraevaluar la posicióndel 30% deresiduosexternos a las zonasnucleares, se representaron las regiones observadasy permitidas de Morris ef a/. sobre el mapa de Ramachandran del modelo de la quimopapaína y se encontró que excepto por cuatro los residuos de la proteína aminoácidos, las regionesobservadascubríaneltotalde (Fig. 3-10). Es importante señalar que los cuatro aminoácidos no considerados en las regiones observadas heron la AIa90, la Asnl16 y la Ser200 que se encuentranen cadena aleatoria, mientras que la Ala97 aparece al inicio de una hélice pequeña en el primer dominio de la quimopapaína.

rARL4 3-11 Valores de los parámetros estereoquímicos para estructuras cristalográficas de alta resoluclón. 0

AnguIos 90%

AnguIo X3 e n puentes S-S Izquierdos Derechos

.85.8 k 10.7" 96.8 k 14.8"

0

Angulo Q, enprolinas

-65.8 k 1 1.2"

0

Angulos helicoidales

0

a, Y

-65.3 k11.9' -39.4 k11.3"

Enerzía de puentes de hidrógeno

0

Conformación trans

Enlaces peptídicos Residuos Los 6ngulosdiedros

-2.03 k 0.75 lccn//mol Isómeros L

X3

de los trespuentesdisulfuroen

quimopapaína se encontraron dentro

de los límites fijados

la molécula de

por el criterio de

evaluaciónestereoquímico. Los valoresnuméricosde estosángulosdiedrosson: -100.06" paraelenlacedisulhroformadoentre los residuosdecisteína 22 y 63;

91.04" paraelque

se encuentraentre las cisteínas 56 y 95; y finalmente -77.80"

entre los residuos 153y 204.

32

150

100

50

H

O

m

IL

-50

-100

.. -

-150 1

-150

-100

-50

I

I

1

I

O

50

100

150

FI Figura 3-10. Regiones nucleares y observadas de Morris et al. (1992) sobre el mapa de Ramachandran d e l modelo de la quirnopapaína, donde se han obviado los residuos de glicina y prolina, y se han identificado los cuatro residuos que aparecen fuera de las zonas observadas.

Respecto a los ángulos diedros 0 de los residuos de prolina en el modelo de la quimopapaína, el 80% incidedentrode

los intervalos establecidos por el criterio

de evaluación y el resto se encuentra desviado en todos

los miembros de la familia

de las PSV con estructura tridimensional conocida.

Delanálisis

geométrico delmodelo

de la quimopapaína se determinóque

todos los ángulos o se encuentranenconformación

trans a excepcióndelenlace

peptídicoprevio a la Pro151, que es un residuocompletamenteconservadoen

la

familia a la que pertenece la quimopapaína y que se encuentra en conformación

cis

entodos los casos conocidos, como ya se habíamencionado.Tambiéndelanálisis geométrico,seconoce quetodos los carbonos a de la cadenaprincipal de la proteínapresentanelisómero

L

y que las cadenaslaterales

de las treoninas e

isoleucinas de la cadenapolipeptídicacumplenconlaquiralidadobservadaen

los aminoácidos naturales (Morris et d., 1992). El hecho de que todos los residuos de la quimopapaína hayan conservado la configuración L durante las últimasetapasde la dinámicamolecular, esde la mayor importancia en el caso de unaestructura la proteína modelada, ya quecualquierinconsistenicageométricaenelinteriorde podría haber ocasionado la inversión de algunos centros quirales durante la simulación. Debido a que cualquier cálculo de energía depende del programa específico que se emplee para afinar unaestructuracristalográfica,elvalornuméricode interacciónque

se proponeenelcriterioestereoquímico

la

para los puentesde

hidrógeno, no resulta comparable directamente con la energía que se calcula para la estructuramodeladade procesode

un

la quimopapaína. Demaneraquefueprecisorealizar

minimizacióndeenergíaqueinvolucrara

programa de mecánicamolecularempleadoenelcasode

por una parte, el mismo la quimopapaína, y por

otra, a las proteasassulfhidrílicasvegetalescuyasestructurastridimensionales

se

encuentranalmacenadasenelBancodeDatosCristalográficos d e Proteínas. Se decidió así trabajar con las estructuras de papaína, actinidinay proteinasa SZ , después deagregar a estasestructurastodoslosátomosnecesarios(átomosdehidrógeno quenoestánincluidosenlosarchivoscristalográficosdel

PDB) para los cálculos

energéticos de puentes de hidrógeno. El resultado numérico de la energía promedio para estasinteracciones,enlastresproteasasarribamencionadas,presentauna

33

desviación menor al 1 .S% respecto a su valor medio (-6.45 kal/mol). Para el caso de

la quimopapaína, la energía por puentes de hidrógeno se encuentra a sólo 1.1% del valor medio observado en PSV, lo cual permite considerar satisfactoria la geometría de los puentes de hidrógeno presentes en el modelo generado, pues la desviación del valor medio para estas interaciones, encontrada por Morris et a/., es de 37% en estructuras cristalográficas de alta resolución. Todos los resultadosde la evaluacióndelascaracterísticasgeométricasdel modelode la quimopapaínacon

los estándaresempleados para juzgar la calidad

estereoquímica en proteínas caracterizadas

por difracción de

rayos X, que se

presentan en la Tabla 3-111, permiten considerar al modelo propuesto en este trabajo como estructura una cubre que satisfactoriamente

los

requerimientos

de buena resolución a los de una proteína

tridimensionales correspondientes cristalogrAfica. -

r + v w3-1II

Análisis estereoquímico del modela d e la quimopapaína Cumple

N o cumple

YO

124

54

70

Angulos X3 en disulhros

3

O

1 O0

Angulo Q, en prolinas

11

Angulos helicoidales

54

Residuos con ángulos 0 y Y en

las zonas nucleares

Enlaces peptídicos trans Residuos en configuración L

216 I

21 8

Energía de puentes de hidrógeno 0

0

(ka//mol)

-6.38 -6.37 -6.47 -6.52

Quimopapaína Papaina Actinidina Proteinasa R

Resolución

2.9

Factor R

0.28

A

34

Análisis d e la estructura del modelo d e la quimopapaina

De la revisión del modelo propuesto para la quimopapaína se puede apreciar que la arquitectura cumple las características generales observadas en proteínas. Esto es, la mayorparte de suscadenaslateraleshidrofóbicas

se encuentrandirigidas al

interior de la molécula, mientras las hidrofilicas se localizan fundamentalmente en la superficie (Fig. 3-1 1). Adicionalmente, el modelo resultó ser consistente con algunos resultadosexperimentalesquereflejandirectamenteciertascaracterísticasde

la

estructura tridimensional de esta proteína, como son:el ambiente polar del triptofano 181 (Dubois et a/., 1988b); la exposición al disolvente de la cisteína 1 17 (Watson et a/., 1990) que se observa en

la figura 3-1 2; la distanciamayor de 20 A entre ese residuo y la otra cisteína libre en la molécula (Topham et a/., 1990a); y la semejanza de regiones interdominio (0alter 8, Drenth, 1987; Fig. 3-1 3) y de la geometfía del

sitio activo (Carey et a/., 1983) con los otros miembros de las PSV. Respecto a este último punto,

la Tabla 3-1V muestra comparativamente algunos valores

de

parámetros geométricos entre las cadenas laterales de los residuos del sitio activo, determinados en el modelo de

la quimopapaína y en las estructuras cristalográficas

de las tres proteasas caracterizadas.

En la parte superior de la figura 3-14, se puede observar la representación del subsitio S2 de las PSV (según la numeración depapaína),

los residuos del sitio

catalítico y también un fragmentodelsustratoenelque

se indicaelenlace

hidrolizar

(p). En

la parteinferiorde

la mismafigura

a

se apreciaelalineamiento

múltiple de las secuencias de seis de estas proteasas. Se han señalado con asteriscos las posicionescompletamenteconservadasen

la familia y conpuntosaquellos

aminoácidos que presentan características similares en sus cadenas laterales. También se han marcado los residuos correspondientes al subsitio S2 triada catalítica

(#). Se aprecia que,

a excepciónde

(0)

y los de la

la lisina que aparece en

bromelaína de talloen la posición 175, todos los miembros de la familiamantienen del sitio activo (Cys, His conservados los residuos sorprendenteelcasodelaminoácido propuesto la existenciade

y Asn). Es de tal manera

175 en la bromelaína,queincluso

se ha

un error (Topham et a/., 199015)en la secuencia de

aminoácidos de esta enzima queha sido reportada por Ritonja et a/. ( 1 989a).

35

9

i

b

-

Figura 3-11. Residrtos hidrofóbicos (a) e hidrofilicos (b) en el modelo de la quimopapaína. La línea continua representa la cadena cx de la proteína.

~~

Figura 3-12. Exposición de la cisteína 117 en el modelo de l a quinqxlpaína. Se presentan también los tres enlaces disulfuro y l a cisteína 25 del sitio activo.

GL*

$15.

54 -LPSYVDWRSAGAVVDIKSQGECGGCWAFSAIATVEGINKITSGSLISLSEQELI -1PEYVDWRQKGAVTPVKNQGSCGSCWAFSAVVTIEGIIKIRTGNLNEYSEQE~~ 54 54 P R O TO.M E G A LPENVDWRKKGAVTPVRHQGSCGSCWAFSAVATVEGINKIRTGKLVELSEQELV 54 PAP.PROT.IV -LPESVDWRAKGAVTPVKHQGYCESCWAFSTVATVEGINKIKTGNLVELSEQELV Q U I M O P A P A ~ N A- Y P Q S I D W R A K G A V T P V K N Q G A C G S C W A F S T I A T V E G I N K I V T G N ~ L E L S E Q E L V5 4 55V L BROMELAÍNA AVPQSIDWRDYGAVTSVKNQNPCGACWAFAAIATVESIYKIKKGILEPLSEQQ

ACTINIDINA

PAPAÍNA

~

*

.*** ***. _ . * * *..****.".

x**.*

**

*

* *

x**.*.

h 7 ,, ACTINIDINA PAPAÍNA P R OOTM. E G A PAP.PROT.IV QUIMOPAPAÍNA BROMELAÍNA

DCGRTQNTRGCDGGYITDGFQFIINDGGINTQENYPYTAQDGDCDVALQDQKYVT DCDR--RSYGCNGGYPWSALQLVAQYG-IHYRNTYPYEGVQRYCRSREKGPYAAK DCER--RSHGCKGGYPPYALEYVAKNG-IHLRSKYPYKAKQGTCRAKQVGGPIVK DCDL--QSYGCNRGYQSTSLQYVAQNG-IHLRAKYPYIAKQQTCRANQVGGPKVK DCDK- -HSYGCKGGYQTTSLQYVANNG-VHTSKVYPYQAKQYKCRATDKPGPKVK DCAK---GYGCKGGWEFRAFEFIISNKGVASGAIYPYKAAKGTCKTDGVPNSAY-

**.

. * * . *.

...

.

109 106 106 106 106 106

*** . . * 157,

.133

li,lCK)

ACTINIDINA

IDTYDNVPYNNEWALQTAVTYQPVSVALDAAGDAFKQYASGIFTGPCGTAVDHAI

PAPA~NA

TDGVRQVQPYNEGALLYSIANQPVSVVLEAAGKDFQLYRGGIFVGPCGNKVDHAV

164 161 P R OOTM. E G A TSGVGRVQPNNEGNLLNAIAKQPVSVVVESKGRPFQLYKGGIFEGPCGTKVDHAV 161 PAP.PROT.IV TNGVGRVQSNNEGSLLNAIAHQPVSVVVESAGRDFQNYKGGIFEGSCGTKVDHAV 161 QUIMOPAPAÍNA I T G Y K R V P S N C E T S F L G A L A N Q P L S V L V E A G G K P F Q L Y K S G V F D G P C G T K L D H A V1 6 1 BROMELAÍNA I T G Y A R V P R N N E S S M M Y A V S K Q P I T V A V D A N A N - F Q Y Y K S G V F N G P C G T S L N 1H6A0V

...

.*.

* ..

. . . **..* ...

. *. * . * . * *.**. ..**. 205,

,207

ACTINIDINA

VIVGYGTEGGVDYWIVKNSWDTTWGEEGYMRILRNVGGA-GTCGIATMPSYPVKYNN

PAPAÍNA

A A V G Y G P N - - - - Y I L I K N S W G T G W G E N G Y I R I K R G T G N S Y G V C G L Y T S S F Y P V K N - -212

220

P R OOTM . EGA T A V G Y G K S G G K G Y I L I K N S W G T A W G E K G Y I R I K R A P G N S P G V C G L Y K S S Y Y P T K N - - 216 PAP.PROT.IV TAVGYGKSGGKGYILIKNSWGPGWGENGYIRIRRASGNSPGVCGVYRSSYYPIKN-- 216 Q U I M O P A P A Í N AT A V G Y G T S D G K N Y I I I K N S W G P N W G E K G Y M R L K R Q S G N S Q G T C G V Y K S S Y Y P F K G F A2 1 8 B R O M E L A Í N AT A I G Y G Q D S - - - I I Y P K K W G A K W G E A G Y I R M A R D V S S S S G I C G I A I D P L Y P T L E E2 -1 2

. . *** .

.

. . * . . *** **.*. *

. . . *.**.

**

FiLwra 3-14. Residuos del sitio acti\.o (#) y del subsitio S2 (o) en PSV. segiln l a numeración de papaína, sobre el aliuealuieuto mílltiple de las proteasas completanlenle secuenciadasde l a familia. También se indica el enlace que sufre hidrólisis en el sustrato ( b y ) .

TABLA 3-IV Geometría del sitio activo en las PSV.

PAPAíNA

ACnNlDlNA

PROTEINA5A a

QUlMOPAPAíNA

a (A)

3.65

tJ(8)

2.77 7.25

3.30 2.79 6.99

3.91 2.72 7.36

3.91 4.64 6.96

116.01

71.22

117.44

87.05

134.19

60.03

124.15

97.68

c (A)

5N10 ("1 5N2O ("1

Comparación estructural del modelo con otros miembros de las PSV

De la figura 3-14, y siguiendo con la numeración de papaína,puede apreciarse también que la tirosina 67 se conserva en cinco de las proteasas, con la bromelaína nuevamente como la única excepción. La posición 68 muestra gran variabilidad e n la familia siendo un residuo no polar el que ocupa esta posición en los casos de actinidina, papaína y proteinasa i 2 ; polar en proteinasa IV y quimopapaína e incluso;cargadoeléctricamente

en la bromelaína. Por su parte, la posición 69

muestra también la sustitución de cadenas laterales con características

muy

diferentes; en tamaño, desde la pequeña serina hasta el triptofano, y en polaridad, desde la fenilalaninahasta la treonina. Las posiciones 133, 157 y 160 conservan la

36

naturaleza hidrofóbica de sus residuos, manteniendo completamente invariante a la alaninaen esta última posición. Finalmente, los residuos 205 y 207 en las proteasas analizadas presentan un gran carácter polar e hidrofóbico, respectivamente, excepto en el caso de la actinidina. A juzgar por la naturaleza de los residuos del subsitio 52, esta cavidad parece tener el mayor volumen en

esta última enzima, mientras que en

la bromelaína se distingue por la presencia de dos cargas negativas.

de la quimopapaína y de las estructuras

Mediante el uso del modelo

tridimensionales de actinidina, papaína y proteinasa R , se determinaron las áreas de las cadenas laterales de los residuos que conforman a los subsitios S2 en cada una de estasproteínas

y que se anotanen

representadaconpuntos,

la tabla 3-IV. La superficiedelsubsitio

se muestraen

la figura 3-15 para elmodelode

S2 la

quimopapaína.

Area de la superficie del subsitio 52

332.0 302.2 341.2 266.4

Quirnopapaína Actinidina Papaína Proteinasa il

Puedeapreciarsequelosvaloresobtenidosen

la tablaanterior,sonmuysimilares

entre sí y que el mayor volumen, esperado para la actinidina, no es evidente de este análisisdeáreassuperficiales.

Deaquí se hace patente la necesidad de estimar los

volúmenes libres del subsitio S2;un trabajo que no resulta

trivial, pues requiere entre

otras cosas, de la definición precisa y sistemática de los límites de estas regiones. El análisis del modelocontinuócon

la comparaciónde

las características

topológicasde los miembrosde la familiade las proteasassulfhidrílicasvegetales

la presencia,típicaen la familia, de dos dominios estructurales, y su cadena principal es muy semejante a la encontrada por Baker y Drenth ( 1 987) para papaína, arquetipo de las PSV (Fig. 3-16). Las estructuras de estas dos enzimas pueden superponerse fácilmente, aunque se observan pequeñas porciones de la cadena principal que divergen. Para ubicar esas zonas, se

caracterizadas. La quimopapaínamuestra

37

L

calculó la diferenciaenposiciónde

los carbonos a de la cadenaprincipalde

la

a la papaína, y tambiénrespecto a la proteinasa SZ. Esto último se realizóconel objetodeidentificarcualquierposibleinfluencia de la estructura de basesobre laconformación final delmodelo. Los resultadosseñalan (Fig. 3-17a) que la estructura obtenida para la quimopapaína es incluso, en algunas porciones de la molécula,máscercana a la papaínaque a la propiaproteinasa 0; esto es, no se observantendenciasgeométricas en elmodelo que indiquen la permanencia de la conformación de la estructura de base en la quimopapaína. Por su parte, es notable la gransimilitudenubicación y magnitudes relativas de las zonas

quimopapaínarespecto

de mayor variabilidad presentes en la figura 3 - l 7 a , con las desviaciones encontradas por Baker B Drenth (1987) en la posiciónde

la cadenaprincipal

de papaína y

a la molécula,desde el espacioconformacionalcorrespondiente a la estructurade la proteinasa R , hastaunaposiciónquereflejarazonablementeelcompromisode las actinidina (Fig. 3-17b). Este último resultado indica que el modelado logró llevar

interacciones que experimentan los grupos químicos enla quimopapaína. Un criterio adicional de comparación topológica consistió en el cálculo de las diferencias en los ángulos Q, y Y, entre el modelo, la papaína y la proteinasa S2 (Figs. 3-18 y 3-19). En estecaso

se observó la concordanciaexistenteentre

las regionesde

principalquevenalteradossusángulosdiedros posición de sus carbonos a. De esta manera,

la cadena y losquedivergenmásen la se tienen ya dos evidencias

independientesqueidentifican,enelmodelode

la quimopapaína,características

geométricas particulares que permiten su consideración como

una estructura

tridimensional más de la familia de las proteasas sulfhidrílicas vegetales. La figura 320 muestra la superposición de las cadenasprincipalesdetodas

las estructuras

conocidas de miembros de las PSV. Aplicaciones del modelo propuesto

En un estudioexperimentalrecientedonde dicroísmocircularsobrepapaína,quimopapaína

se aplica la espectroscopíade y proteinasa S2 (Solís-Mendiola et

ai., 1992), se advierte la existencia aparente deun diferente contenido de estructuras secundariasentreestastresproteasas, y se encuentra un contenidomayor de a enquimopapaína.Además,estosmismos residuosenconformacióndehélice autores indican que las variaciones en los espectros de dicroísmo circular sugieren la presencia de un patrón de doblado distinto para la quimopapaína respecto al que se ha encontrado para las otras dos enzimas estudiadas e incluso, la posibilidad de que

38

O

Sr

aJ

co

c3

O 0

-cv

i

O

co

O

00

O

O

00 I

O

co 7

I

L

O CD

7

O

03

O

O 00 I

O

CD 7

I

I

esta enzima pertenezca a una clase estructural diferente (alp,segmentos alternados de hélices a y hojas+). El hecho de que la quimopapaína pudiera tener un patrón de

dobladodistinto o pertenecer a una claseestructuraldiferente

a las otrasdos PSV

estudiadas, resulta inesperado dada la alta homología en secuencia existente entre estas proteínas (más del 50%) como se mencionóen ese trabajo. En un intento por explicar esta situación, se construyóla red de puentes de hidrógeno entrelos átomos de las cadenas principales de

las tres PSV consideradas,cuyosesquemasde conectividad se muestranen la figura 3-21. Estasrepresentaciones se basanen un estudio similar practicado sobre actinidina (Baker 8, Drenth, 1987) elcual se incluye también en la figura 3-21 citada, para su comparación. Los esquemas de puentes de hidrógeno definen claramente la extensión de cada una de las estructuras secundariaspresentesen las moléculas, y pueden dar una indicaciónde la clase estructural a la quepertenececadaproteína. La construcción deesta red de interacciones Fue posibleenquimopapaína sólo debido a que se contabacon un modelodesuestructuratridimensional,enelquepuedendefinirse los puentes de hidrógeno de la misma manera en que se efectúa sobre una estructura determinada que la cristalográficamente. Del análisis de esta información se haceevidente quimopapaína mantiene el patrón general de doblado presente en las PSV, y ademds conserva la clasificación estructural de la familia (a+P,regiones predominantemente helicoidales y zonasricasenhojas-Penporcionesseparadasde

la molécula). Es

interesante notar aquí, que la papaína posee un par de cadenas en conformación de hoja-p de menor longitud respecto a las otras PSV (que correspondea la inserción de cuatro residuos entre las posiciones 169 y 170 de papaína) y que todas las hojas p presentes en la familia son antiparalelas. Respecto al punto del diferente contenido en estructura secundaria particularmente a la mayorincidencia

y

en

de residuosenconformaciónhelicoidal

quimopapaína,en la figura 3-22 se presentaelalineamientode

las secuenciasde

esta enzima junto con las de la papaína y la proteinasa !2 y se señalan las diferentes estructurassecundariaspresentesencadaproteína.Estasestructurassecundarias fuerondeterminadastantoporelcriteriodepuentesdehidrógenocomo por el de ángulos Q, y Y. Es evidente la gran semejanza en localización y extensión de hélices a y de hojas+ en estastresproteasas,siendo

longitudde

las dosprimerashélices

la únicadiferencia

detectable la

(A y B). Deaquípuedeproponerse

contenidodeestructurasecundariaenestasenzimas,no

que el

es capazdeexplicar

39

N N

V

N

N

I

c

N

U

f

6

uW

4

Z

w

t-

O CLI a.

...

.

-

A

1

B

P A P A Í NA

IPEY~RQKGAVTPVKNQGSCGSCWAF~AWTIEGIIKIRTGNLNEYSEQELLD

55

PROT.OMEGA

LPEN~RKKGAVTPVRHQGSCGSCWAF~AVATVEGIN~I~TGKLVELSEQELVD

55

QUIMOPAPAÍNA

Y P Q S ~ R A K G A V T P V K N Q G A C G S ~ ~ S ~ ~ ~ E G I 55 N K I V

2

C P A P NAAÍ

CDRRSYGCNGGYPWSALQLVAQYGIHYRNTYPYEGVQRYCRSREKGPYAAKT~

110

PROT.OMEGA

CERRSHGCKGGYPPYALEWANGIHLRSKYPYKAKQGTCRAKQVGGPIVKT~

110

QUIMOPAPAÍNA CDKHSYGCKGGYQTTSLQWANGVHTSKVYPYQAKQYKCRATDKPGPKVKI~

2

D

3

E

110

4

P A PN A A Í

~QPYNEGALLYSIANQPVSVVLEAAGKDFQLYRGGIFVGPCGNKVDHAVAAVG

165

PROT.OMEGA

~QPNNEGNLLNAXAKQPVSWESKGRPFQLYKGGIFEGPCGTKVDHAVTAVG ~PSNCETSFLGALANQPLSVLVEAGGKPFQLYKSGVFDGPCGTKLDHAVTAVG

165

QUIMOPAPAÍNA

4

5

165

7

6

P A PNA AÍ

YGPN----YILIKNSWGTGWGENGYIRIKRGTGNSYGVCGLYTSS~KN

212

PROT.OMEGA

BGGKGYILIKNSWGTAWGEKGYIRIKRAPGNSPGVCGLYKSS~KN

216

QUIMOPAPAÍNA =DG_KNYIII~NSWGPNWGEKGYMRLKRQSGNSQGTCGVY

-

KSSYYPFKGFA

218

Figura 3-22. Estnlcturassecundariasmarcadassobrelassecuencias de aminohcidos de papaína, proteinasa l2 y quimopapaína. Las hélices a sedenotan con letras y las hojas B con nilmeros.

completamente las diferencias observadas en los espectros de dicroísmo circular de

las tresproteínasestudiadas.Talesdiferencias cercanía de los 200 nm, donde unaseñal

se presentanprincipalmenteen

la

que resulta muy evidente en papaína,

desaparece en quimopapaína y ademds, para éSta última, la magnitud relativa de las señales cercanas a 210 y 220 nm se encuentra invertida (Fig. 3-23). Por otra parte, al observar los espectros de dicroísmo circular de la bromelaína de tallo (Arroyo-Reyna, 1993), la actinidina(Valle-Guadarrama,

1993) y la ficina(López y Celis, 1993), se

encuentra que todasestasproteasassulfhidrílicasparecenposeerespectroscon características intermediasa las que se presentan en los correspendientes a papaína y quimopapaína. Estos espectrosse incluyen en la figura 3-24, con fines comparativos. AI intentardarunainterpretación

desaparicióngradualde

a lo queaparentemente se tratade

una

la señalde 200 nm en los espectosdedicroísmocircular

obtenidos para las PSV en la regióndeenlacespeptídicos

(180-250 nm), que se

observaen la figura 3-24, y considerandoque las estructurassecundariasdeesas enzimas se encuentran ampliamente conservadas

(al menos en

las estructuras

tridimensionales conocidas), se pensó en atribuir tal desvanecimiento de la señal de 200 nm a la presencia de algún cromóforo no peptídico que hubiese sido obviado en trabajos previos. Debido a que la cantidad de cadenas laterales con grupos químicos aromáticos, específicamente triptofanos, varía sin seguir

una tendenciaparticular al

pasar de una proteína a otra de la familia, se decidió realizar un análisis comparativo de la geometríade los trespuentesdisulfuroque se encuentrancompletamente conservados en las PSV. Esta decisión se tomó en base a lo reportado por Perczel et al. (1992) acerca de la contribución de estos elementos estructurales a las señales de dicroísmo circular en la regióndelultravioletalejano, y a los reportesdeCasey 8, Martin (1972) y Ottnad et al. (1975) quienes encuentran una señal de signo negativo alrededor de los 200 nm para compuestos modelo que contienen enlaces disulfuro. Los resultados de este análisis se presentan en la figura 3-25, donde se aprecian los valoresde

los ángulosdiedrosCp-S-S-Cpde

los puentesdisulfuro

proteinasa 0, actinidina y quimopapaína. Puede notarse que en valores de los ángulos muestran una tendencia Suave

para p a p a h ,

los cuatro casos, 10s

a cambiarenelmismoorden

en que disminuye la señal de 200 nm de sus espectros (proteinasa omega seguida de papaína,actinidina y por últimoquimopapaína), lo quehace muy razonable la asignación de esa banda en dicroísmo circulara la geometría de las tres interacciones covalentes entre residuos de cisteína en

las PSV. Los resultadosdelan&lisisanterior

40

IO

O0

5

50

O

O

T

-5

’50

-10

.IO0

IO

O0

5

50

cn al a

L

m

O

O

o, U

Y

-50

-5

r’ L

E 10

-100

n

CD

Y

IO

IO0

5

50

O

O

-5

-30

-10

-100 1

200

240

1

1

260

1

1

280

1

1

1

300

WAVELENGTH ( n m 1

Figura 3-23. Espectros de dicroísmo circular de papaína ( a ) proteinasa S2 (b) y quimopapaína (c), de acuerdo con Solís-Mendiola et o/. (1990).

Elipticidad molar (grad cm2 dmol")

x IOe3

10

5

O

-5

-10 180

2 0109 0

2102 5204203202 0

Longitud de onda

I

(nm)

Fip;ura 3-24. Espectros de dicroísmo circular para seis PSV en la zona del ultravioletaleiano.

Ángulo d edro

(O)

-85

120

- 90 110

-95

1O 0

- 100

- 105

90

-110 80 -8-

S-S 1

+ S-S

+;

-115

2C!

- 120

70 OMEGA

PAPAíNA

ACTIN ID

Figura 3-25 Ángulos diedros Cp-S-S-Cp de los tres enlaces disulfilro para proteinasa R,papaína, actinidina y quimopapaina.

sugieren a esta familia como un sistema que permitiría estudiar por primera vez, influencia de la conformaciónde

los puentesdisulfuroen

dicroísmocircularenproteínas,en

la

la espectroscopía de

la regióndelultravioletalejano.Esinteresante

señalar que la orientación relativa de algunas estructuras secundarias cambia de una PSV a otra, siguiendo la misma tendencia de las señales de dicroísmo circular a 200

nm. Estosignificaque

las posicionesrelativasdeestructurassecundariaspodrían

contribuir significativamente a la forma de los espectros (Fis.3-26). También se han

realizado estudios de estabilidad sobre papaína

y

quimopapaína (Solís-Mendiola et a/., 1993) en los que se han identificado variaciones de los parAmetros termodinámicos para el proceso de desnaturalización térmica en ambasenzimas.Estoresulta

muy llamativo,puesconstituyeelsegundogrupode

resultados experimentales queapuntan en la dirección de la existencia de diferencias

a pesar de su cercanía filogenética. La interpretación de las diferencias observadas, como se mencionó en el primer artículo citado de estos autores (Solís-Mendiolaet a/., 1992),sólo sería posible a través de un estudioestructuraltopológicodetalladodecadaproteínainvolucrada, y elcontar ahora con un modelo tridimensional de la quimopapaína nos permitirá intentar esta interpretación. De acuerdocon los resultadoscalorimétricoscomparativosentre quimopapaína y papaína que se obtuvieron en el trabajo de Solís-Mendiola et a/. en el año de 1993, la quimopapaína presenta una mayor cooperatividad en su proceso de desnatruralización térmica,un menor cambio en su capacidad calorífica durante la transición, y una mayor entalpía de interacción entre sus dominios estructurales.

estructurales entre estas enzimas,

En relación a la mayorcooperatividadenelprocesodedesnaturalización

térmica de quimopapaína respecto a papaína, Solís-Mendiolaet a/.,( 1 993) proponen la existencia de una mayor interacción entre los dominios estructurales de la primera de estas enzimas; de acuerdo con

desarrollado por ellosmismos.

un mecanismodedesnaturalizaciónplanteado La interpretaciónestructural

y

deestaconclusión,

a través de la estimación de la cantidad de interacciones interdominio y de su energía correspondiente, mediante el empleo de las coordenadas espaciales atómicas de la estructura cristalográfica de la papaína y del modelo obtenido para la quimopapaína. derivada de los datos experimentales, fue hecha en el presente trabajo

Las interaccionesinterdominioconsideradasaquí,

hidrógeno entre diferentes grupos de

se refirieron a los puentesde

la cadena polipeptídica y entre moléculas de

41

Ángulo diedro

(O)

T

175

40

165 35 155

30

145

135 .25 125

115 OMEGA

~

1

m ~

PA

í NA

HéliceA-Hoja4a

+

1

20

ACTlNlDlNA QUIMOPAPAiNA

HéliceA-Hoja4b 4-

HéliceA-HéliceB 4-

Figura 3-26. Ángulos diedros entre estructuras secundarias en proteinasaR , papaína, actinidina y quimopapaína; 421 y 4b se refieren a la primera y segunda porciones de l a cuarta hoja p.

agua que se enlazaban directamente con átomos de ambos dominios en

la proteína.

Otras interacciones interdominio consideradas heron los contactos vander Waals y las fuerzaselectrostáticas(queincluyenpuentessalinos).

La Tabla 3-VI muestra

de hidrógeno y puentes salinos

comparativamente número el de puentes

interdominio para quimopapaína y papaína. Se observa que existe un número mayor de interacciones de ambos tipos para el caso del modelo de la quimopapaína, donde

la mayor contribución es debida a los puentes de hidrógeno entre cadenas laterales. Es interesantenotarqueenelcaso deesta última proteasa se encontrarondos puentes salinos entre grupos químicos de dominios diferentes, mientras que para la papaína no se detecta este tipo de interacciones.

TARLA 3-VI Número de interacciones interdominio. PAPAÍNA

QUIMOPAPAfNA

Entre átomos de la cadena principal

5

5

Entre átomos de cadenas laterales

2

7

Entre cadena lateral y principal TOTALES

5

4

12

16

O

2

PUENTES DE HIDRóGENO

PUENTES SALINOS

Cabe resaltar que el número de interacciones considerado en la Tabla 3-VI, no es necesariamente un reflejo de

la energía de atracción entre

estructurales,peroaúnencasoafirmativo,existiría interaccionesvander

Waals, cuyo número

los dominios

la participaciónadicional de las

es difícil estimar.Por

presenta en la Tabla 3-VI1 la contribucióndecadatipo

esta razón se

de interacción a la energía

potencial total de la región interdominio. Es importante señalar que en estos ~ l c u l o s se utilizó mismo el campo de Fuerzas empleado para modelado el de

la

quimopapaína, y puestoquecadacampotienesuparametrizaciónparticular,fue necesariorelajar

la estructuracristalográficade

la papaínamedianteelprograma

En esta tabla se anotan las estimaciones energéticas realizadas sobrela papaína antes y después dela relajación. BIOGRAF para que los resultadosfuesencomparables.

-

r A B a 3-VII

Enersía de interacción interdominio. Papaína

Papaína

Cristaloqráfica

Minimizada

-101.71 -54.42 -03.99

-132.01 +12.40 -15.39

-100.02 -94.23 -107.73

-239.20

-75.80

-309.37

Quimopapaína

Tipo de Interacci6n

(kcal/mofl

Van der Waals Electrostática Puentes de Hidrógeno Energía Potencial Interdominio Total

Es muy interesantenotarenesta

tabla que los dominiosde

encuentranmásfirmementeunidosentre

sí queenelcasode

la quimopapaína se la papaína (tanto

a juzgar por la menor energía potencial interdominio total encontrada aquí (mayor valor absoluto).

cristalográfica como minimizada),

En la Fig. 3-27 se ha señalado, sobre

las secuencias de papaína y

quimopapaína, la posiciónde los residuosqueintervienenen puentesdehidrógenointerdominio,

la formaciónde

los

a que se refiere la Tabla 3-VI. Es notableel

papelprotagónicoquedesempeñanel

W7 enambasenzimas,

así como la S29 en

papaína y la Q19, Yl66,y S180 enquimopapaína, ya queintervienenenmásde un tipo de interaccióninterdominio a la vez. Porotraparte,en

enlistan las moléculasdeaguaqueenlazan

la Tabla 3-VI11 se a los dominiosestructuralesen las

las determinadas

enzimas estudiadas. Estas moléculas de agua son tanto cristalográficamenteenel quesirviódebaseen permanecieron después de

caso de la papaína,como las presentesen la estructura la construccióndelmodelode

la quimopapaína y que

las múltiples etapas de minimización

y dinámica

molecular.Dadoqueensolución,ambasproteínaspodríantener

un mayornúmero

demoléculas de agua queinteraccionaransimultáneamentecon

los dosdominios

estructurales, debe tomarse con cautela el hecho de que exista un número mayor de

43

QUIMOPAPAÍNA PAPAÍNA

YPQSID@AKGAVTPVKNQACGSCWAFSTIATVEGINKI

40

IPEYVD~QKGAVTPVKN~GSCGSCWAFSAWTIEGIIKI40 -

= =

QUIMOPAPA~NA VTGNLLELSEQELVDCDKHSYGCKGGYQTTSLQYVANNGV PAPAÍNA RTGNLNEYSEQELLDCDRRSYGCNGGYPWSALQLVAQYGI

80 80

QUIMOPAPAÍNA PAPAÍNA

HTSKVYPYQAKQYKCRATDKPGPKVKITGYKRVPSNCETS 120 HYRNTYPYEGVQRYCRSREKGPYAAKTDGVRQVQPYNEGA 120

QUIMOPAPAÍNA PAPAÍNA

FLGALANQPLSVLVEAGGKPFQLYKSGVFDGPCGTKLDHA

160 LLYS~ANQPVSVVLEAAGKDFQLYRGGIFVGPCGNKVDHA160

QUIMOPAPAÍNA PAPAÍNA

VTAVG~GTSDGKNYIIIKNLWGPNWGEKGYMRLKRQSGNS 200

QUIMOPAPAÍNA PAPAÍNA

QGTCGVYKSSYYPFKGFA - 218

= i

VAAVG~GPN----YILIKNSWGTGWGENGYIRIKRGTGNS 196 =

YGVCGLYTSSFYPVKN

=

=

212

Figura 3-27. Conqxlración de los residuos involrlcrados en l a formación de puentes de hidrógeno

interdominio en quimopapaina y papaina. Se utilizaron las siguientes convenciones para distinguir los diferentes tipos de puentes de hidrógeno: entre cadena principal, subrayado; entre cadenas laterales, negritas; y mixtos, itdicns.

los

estos puentes de agua en quimopapaína, como era de esperarse según resultados experimentales.

TABLA 3-VIII Moléculas de agua del interdominio en papaína y quimopapaína.

r

PAPAINA Dominio 1

Dominio 2

Agua

E50 303-307 305 133 E35, K17306+307 E50 306-307 307 E35 300 K17 F20 320-+300 F20 320-313 320 L72 E3 322 v35 392-340 G20 400-343 R41 339-353 R41 446-353 VI 6 359-361 D6 384-360 R0 370-364 R0 370 R0 402+370 K106 372 W69 412-390 R41 339-453 v35 392+335

(

Dominio 1

UIMOPAPAI iA Agua

54 210 tí174 54 219 Q120, PI29 K174 VI3 264 P15,E35 K174 225 G66 K174 289-229 G66 N175 289-230 N175 241 Q60 VI6 K174 251-247 G109,1107 VI6 251+250 253 R191 R0 5205 R0 253-254 w177 Q60 250-274 Q120 Q60 250-+326 VI3 Q120 264-221 N104 V13,54 265-219 Y170 E35, A32 267 El03 169 276 El03 169 275+276 El03 133 204 K211 N10 206 5205 142 292 K211, N212 G20,N10 302-206 Y106 N10 312 341 Q3 Y1 342

Dominio2

1160, Y174 Y166,Y174

Y190 K170 K157 d150 5131

Y190 K100

El07 El07 Y211 5209

Y190 Y166,Y174 K170

Y110 Y110 P129,

N120

w101 G216

w101 N104 TI60 E110

Los resultados para la regióninterdominio de papaína y quimopapaínaque son mostrados en

las Tablas 3-VI a 3-VIII (número de interacciones,energía

potencial y puentesdeagua),

indican que los dominiosestructuralestienenuna

44

mayorinteracción

en quimopapaínaque en la papaína,como se esperaba de los

resultados calorimétricos mencionados previamente. Para continuar con

la utilización del modelo de quimopapaína e n la

interpretación estructural

de

la

información termodinámica obtenida

experimentalmente por Solís-Mendiola et d., (1993), se emplearon las ideas propuestas por Privalov (1979) respecto a la correlaciónlinealpositivaentre

el

cambio e n la capacidad calorífica (ACp) de una solución de proteína, inducido por su desnaturaliución,y la cantidad de contactoshidrofóbicos en la estructuranativa. Paraello se determinaron las densidadesmoleculares en papaínayquimopapaína,

las cuales se presentan en la Tabla 3-1X, y donde se aprecia una densidad mayor e n cada uno de los dominiosestructuralespara el caso de la papaína,comosería de esperar para un número más alto de contactos hidrofóbicos en esa enzima, responsables de un mayor ACp.

1-ABM3-IX Propiedades físicas por dominio. Volumen

(A3)

Masa molar

5uperSicie

Densidad

(A2)

(glmol)

(&m3)

10090.6

10737.0

12050

1.9021

9425,9

10077.6

11295

1.9905

Dominio 1 (1-1 07)

9026.0

10762.2

11703

1.9704

Dominio2 (108-2 18)

10115.9

11092.7

11972

1.9659

PAPAiNA Dominio1 ( 1- 107) Dominio 2 ( 108-212)

QUlMOPAPAiNA

en la capacidadcaloríficadebidoal proceso de desnaturalización térmica en proteínas, ha sido propuesta por Murphy et Unanuevainterpretacióndelcambio

al. (1992) ySpolar et al. (1992), quienesencontraronque

proporcional al incremento generadapor

del área hidrofóbica accesible

el ACp es directamente al disolvente (AAhf)

el desplegamiento de la cadenapolipeptídicasegún

la siguiente

expresión:

45

-

.

.. -

" " 1 "

ACp

=

(26)

0.24 AAhf

AI calcularel

AAhf para papaína y quimopapaína, se obtuvieronvalores de 12,393.7 y 1 1,625.8A’, respectivamente. A partir deestosdatos y con la ecuación (26),se encontraron los valores de ACp para ambas proteínas que se anotan en la Tabla 3-X.

TABLA 3-X Valores de ACp teórico y calorimétrico. I

I

I

I

PAPAíNA

QUlMOPAPAíNA

Valor Estimado (kcal/mol K)

3.0 iz 0.37

2.8 f 0.35

Valor Experimental (kca//mol K)

3.3 f 0.45

2.3 iz 0.50

Como se observa, los resultados teóricos y calorimétricos coinciden razonablemente bien, dentro del error experimental estimado.La discrepancia entre estos dos grupos devalores,

es quizádebida

a la orientación particular de las cadenaslaterales

superficiales de estas moléculas,en los confórmeros utilizados para estimar el AAhf.

46

...

CONCLUSIONES

Uno de los objetivos más importantes en el estudio asignar una estructuratridimensionalprecisa

de proteínas, es el poder

a cualquiersecuencia de aminoácidos

particular.Como se ha mencionado, actualmente se realizan grandes esfuerzos para incrementar las bases de datos de estructuras tridimensionales de técnicas experimentales como ocasiones, lanaturaleza

la difracciónderayos

X y

de proteínas a través

RMN,peroenmuchas

de las macromoléculashaceimpracticable

lautilización

de

los métodos experimentales mencionados. Una alternativaviablequehamostrado

serexitosa en la determinacióndeestructurastridimensionales

es la simulación o

modelado molecular, el cual ha tenido un creciente impacto en la comunidad sólo en años recientesdebido a la asequibilidaddeprocesadoresmásveloces

y demayor

capacidad.

una

Es importante mencionar que cualquier modelo tridimensional de proteína representa por

sí mismo sólo una propuesta estructural

considerarse completamente equivalente

a la geometría 'real

modelada, a menosquedemuestreampliamente

y no debe

de la molécula

la validezdelmodelo.

trabajo se propone un arreglotridimensionalcondetalleatómico

En este

de un integrante

de la familia de las proteasas sulfhidrílicas vegetales, la quimopapaína. Este modelo

fue sometido a dos criterios de evaluación geométrica independientes: la aplicación de las pautas utilizadas para aceptar estructuras cristalográficas de alta resolución en elBancodeDatosCristalográficosdeProteínas,

y la comparaciónconinformación

experimental publicada por diferentes autores que indirectamente con la estructura tridimensional de resultados del análisis

se relaciona directa

o

esta proteasa. De acuerdo con los

geométrico practicado, el modelo

de la quimopapaína

obtenido en este trabajo cumplió satisfactoriamente los requerimientos estructurales impuestos por ambos criterios. Cabe señalar que el criterio de calidad estereoquímica empleadoen

estetrabajo,es

muy estricto y, aún ciertasestructurascristalinas

proteínas que se encuentran accesibles en el Banco de Datos, estándares. Porotraparte,

es importantemencionarqueen

de

no logran cumplir los

este primermodelado

molecularde la quimopapaínanunca se incluyeron restricciones sobre la geometría inicial, que condujeran a la estructura a cumplir con las observaciones experimentales que sobre la arquitectura de las proteasas sulfhidrílicas vegetalesse dispone.

Los resultadosobtenidosenelpresentetrabajopermiten objetivo de proponer un modelotridimensionalpara

afirmar queel

la quimopapaína, que contara

con la calidad suficiente para ser empleado como una estructura más en la familia de las PSV, Fue convenientementealcanzado. En unasegunda

quimopapaínafueutilizado

a nivel espectroscópicos.

la

para realizarunarevisióncomparativaconlosdemás

miembros de la familia caraterizados interpretación

etapa, elmodelode

molecular

y posteriormente se le empleó de

En la interpretación estructural de

e n la

algunos resultados calorimétricos

los resultados espectroscópicos

y

de

dicroísmo circular sobre los miembros de la familia de las PSV, se proponen en este trabajodosposiblesexplicaciones

a las inesperadasdiferenciasobservadasen

los

espectros de estas proteasas de gran homología en secuencia de aminoácidos. Una de las interpretaciones involucra el cambio simultáneo y gradual en la geometría de

los tres enlaces disulfuro presentes en cada una deestasproteasas. La otra explicación está relacionada con el cambio paulatino en la orientación relativa de las estructuras secundarias prácticamente invariantes en esta familia de enzimas vegetales. Aunque las dos exégesis porseparadopodríanexplicarelefectoen los espectros de dicroísmo circular, también es posible que la combinación de estas dos interpretaciones fuese compatible con una explicación más general, que correlacionaraunadistorsiónglobalprogresivade las estructurascon los cambios espectroscópicos. Estosignificaque las modificacionesen la geometríade los enlaces disulfuro y e n las interacciones entre estructuras secundarias, podrían sersólo consecuenciadetaldistorsióngeneralizada

y no la causa per se quegenerara las

diferencias en la forma de los espectros de dicroísmo circular. Para poder discriminar de entre los posiblesorígenesde

las disparidadesespectroscópicas se requierede mayor información, por lo queen lo sucesivo se analizará con particular atención la incidenciadecromóforosnoconvencionalesen las estructurastridimensionales de estas proteínas, que pudieran ser responsables dela aparición de señales en la región del ultravioleta lejano e n dicroísmo circular. Con relación

a la aplicación del modelo propuesto

informacióncalorimétricasobrepapaína quizá, la explicaciónmolecularsobre

para interpretar la

y quimopapaína,elhechomásnotable

es,

la diferentecooperatividad en elprocesode

alteración estructural inducida térmicamente en estas proteínas. Según el mecanismo propuesto para la desnaturalizacióndeambasenzimas,lasinteraccionesentresus

78

dominiosestructuralesjuegan

un papel determinante en

la cooperatividaddel

para el caso de la quimopapaína. AI analizar las

fenómeno,debiendosermayores

regionesinterdominio e n la estructura de la papaína y las correspondientesen el modelo, se encuentraquebajotodos

los criteriosempleadosaquí,(puentesde

hidrógeno, puentes salinos, energía de interacción no covalente

y puentes de agua)

el modelo de la quimopapaína resulta ser congruente con el mecanismo de desnaturalización mencionado y que fue sugerido

por otros autores (Solís-Mendiola

et al., 1992). Por otro lado, de la estimación del cambio en el Area hidrofóbica expuesta

al

solventecausada por ladesnaturalizacióntérmica en papaína y quimopapaína, se logró estimar en este trabajo el ACp para ambas proteasas con resultados comparables, dentro del error experimental, con los valores determinados por Murphy et a/. calorimétricamente. Estos resultados corroboran las ideas sugeridas

(1992) y Spolar et a/. (1 992), relativas a la dependencia lineal entre los cambios de áreahidrofóbicaexpuestacon

la capacidad calorífica delasmoléculas

al sufrir la

pérdidadelaestructuranativa.

Un trabajofuturointeresantepodríaserlainclusión

delcambioenelArea polar o hidroh'lica,inducida por la desnaturalización,en la estimación del ACp como lo han sugerido los autores arriba mencionados, y también podríaser

de utilidad elempleardiferentesconfórmeros

estudiadas y observar la influenciaque

estotenga

de las dosproteínas

en los valoresdelparámetro

termodin6mico mencionado. Dentrodelasperspectivasparacontinuarcon

la línea de investigacióndel modeladomolecular de proteínas,enelAreadeBiofisicoquímica se pretende la simulaciónestructural que comprenden emplearestrategiasmássofisticadasen entreotras: la inclusiónexplícitademoléculasde disolvente, el análisis de las trayectorias obtenidas en la dinámica molecular, simulaciones más prolongadas en el tiempo, uso de las técnicasderecocido y templado para un mejormuestre0del espacio conformacional y uso nuevos de algoritmos para construir las conformaciones iniciales que sirven de molde a la molécula de estructura la finalidaddeobtenerestructuras que tridimensionaldesconocida.Todoestocon reflejen más fielmente los detalles geométricos que establecen las diferencias entre la estabilidad y lafuncióndemoléculastancomplicadamenteprecisascomosonlas proteínas.

BIBLIOGRAFíA Abola E., Bernstein F.C., Bryant S.H., Koetzle T.F. y Weng J. (1987) (En)

Crystallographic Da tabases-lnfonna tion Content, Software systems, Scientific Applications. (Allen F.H., Bergerhoff C. y Sievers R , eds). Data Commission of the International Union of Crystallography. pp. 107-1 32.

Altamirano M.M. y Calcagno M.L. (1993) Mensdje Bioquímico Vol. XVII, Fac. de Medicina, UNAM. Arroyo-Reyna A. (1993) UAM-lztapalapa. Comunicacicjn personal. Baker E.N. (1980)f . Mol. Bol. 141:441-484. Baker E.N. y Drenth J. (1987) (En) Biological Macromolecules andAssemblies (Jurnalc F.A. y McPherson A., eds.), vol. 3 , pp. 31 3-368. John Wiley 8, Sons, N.Y. Bernstein F.C., Koetzle T.F., Williams G.J.B., Meyer E.F., Brice M.D., Rodgers J.R, Kennard O., Shimanouchi T. y Tasumi M. ( 1 977) /. Mol. Biol. 1 12: 535-542. Biosym Technologies (1993) Discover User Cuide,Versión 3.1, California. Blundell T.L. (1991) (En) Protein Conformation. Ciba Foundation Symposium 161, pp. 28-51. John Wiley 8, Sons, Chichester. Blundell T.L., Sibanda B.L., Sternberg M.J.E. y Thornton J.M. ( 1 987) Nature 326: 347352. Blundell T.L., Carney D., Gardner S., Hayes F., Howlin B., Hubbard J.T., Overington J . , Singh D.A., Sibanda B.L. y Sutcliffe M. (1988) Eur.1. Biochem. 172: 513-520. Born M. y Oppenheimer J.R (1927) Ann. Physik 8

4 :

457.

Branden C. y Tooze J. (199 1) Introduction to Protein Structure.Garland Publishing, Inc., N.Y. Brocklehurst I

MODELADO MOLECULAR DE QUIMOPAPAiNA

Recommend Stories

Story Transcript

Get in touch

Social