Aplicación de Técnicas Gráficas en el estudio de Tiempos de Supervivencia

ESTADISTICA ESPAÑOLA Vol. 38, Núm. 141, 1996, págs. 5 a 18 Aplicación de Técnicas Gráficas en el estudio de Tiempos de Supervivencia por RAFAEL PÉREZ

Author: Irene Aguirre Villalobos

0 downloads 89 Views 1MB Size

Report

DOWNLOAD PDF

Recommend Stories

SUPERVIVENCIA EN EL MAR

SUPERVIVENCIA EN EL MAR Antes de abandonar el buque recuperar y abastecerse de todo lo que pueda ser útil y podamos transportar en la balsa salvavidas

Sistemas de Potencia: Estudio de tiempos

ORIGINAL ESTUDIO CUASI-EXPERIMENTAL DE UN PROGRAMA DE SUPERVIVENCIA EN EL MEDIO NATURAL

EL MEJOR DE LOS TIEMPOS EL PEOR DE LOS TIEMPOS

EL MEJOR DE LOS TIEMPOS EL PEOR DE LOS TIEMPOS Viernes 26 de septiembre de 2014 Hechos 7:54 Escuchando estas cosas, se enfurecían en sus corazones y

En Tiempos de Avivamiento

1 2 En Tiempos de Avivamiento Por: Cornelio (Neal) Hegeman Ph.D. 3 4 En Tiempos de Avivamiento Índice Introducción 7 1. Comenzando a conoc

EL COOPERATIVISMO EN TIEMPOS DE CRISIS

WORKING PAPER N. 037 | 12 EL COOPERATIVISMO EN TIEMPOS DE CRISIS Gianluca Salvatori JEL classification: P13, L33, D63, N30, A14 Fondazione Euricse,

El AMAR en los Tiempos de Corinto

EL AMOR EN TIEMPOS DE CRISIS

EL AMOR EN TIEMPOS DE CRISIS Willie Alvarenga EL AMOR EN TIEMPOS DE CRISIS P.O. BOX 210667 BEDFORD, TEXAS 76095 2010 Willie Alvarenga Hbuscandoalpe

MANUAL DE SUPERVIVENCIA

Story Transcript

ESTADISTICA ESPAÑOLA Vol. 38, Núm. 141, 1996, págs. 5 a 18

Aplicación de Técnicas Gráficas en el estudio de Tiempos de Supervivencia por RAFAEL PÉREZ OCÓN, M. LUZ GÁMIZ PÉREZ y JUAN ELOY RUIZ CASTR(J Departamento de Estadística e Investigación Operativa Facultad de Ciencias. Campus de Fuentenueva 18071 Granada. España Teléfono : (+58) 24 31 55 Fax : (+58) 24 32 67 E-mail :

RESUI^VIEN EI análisis de tiempos de supervivencia lleva cansigo la aplicación de técnicas paramétricas y no paramétricas. Entre estas últimas, los procedimientos gráficos juegan un papel fundamental en la identificacián de la clase de supervivencia a la que pertenecen los datos. En este trabajo se aplican estas técnicas en dos dominios distintos de aplicación: supervivencia y fiabilidad. Se estudian las cambios de tendencia en el riesgo de fallo para un conjunto de datos observados de tiempos de supervivencia al cáncer de mama y se calculan cotas para ia función de supervivencia. Se pone de manifiesto que no es conveniente usar solo métodos paramétricos en problemas de supervivencia. En el dominio de la fiabilidad, se simula el tiempo de supervivencia de un dispositivo sujeto a choques y se clasifica la funcián de supervivencia del mismo. Un programa computacional es elaborado para obtener una muestra del tiempo de falio del modelo. Palabras c/ave: Clases de supervivencia, Transfarmación TTT, Transformación de Lorenz, Modelos de choques Clasificación AMS: 62N05

t^ ^ ^ ^r^i^ r^ic^ .1 t ^^^:^^^,E -^,

lNTR©DUCCIÓN EI estudio de los tiempos de supervivencia ha dad© lugar en los últimos años a gran número de publicaciones. Ivlétodos paramétricos y no paramétricos, introducción de covariables y aplicaciones de la teoría de procesos estocásticos, son procedimientos habituales en el estudio de los tiempos de vida. EI concepto de envejecimiento o desgaste se define a partir de la función de riesgo, que pone de manifiesto la tendencia al fallo con el paso del tiempo. La descripción del modo de desgaste viene expresada en términos de unas clases no paramétricas de distribuciones que #ienen gran utilidad en las aplicaciones. Las definiciones y propiedades de estas clases pueden verse en las referencias. Una ventaja de estas ciases es que algunas pueden ser caracterizadas mediante transformaciones, cuyas versiones empíricas s©n una herramienta especialmente útil para identificar modelos de distribuciones de tiempos de vida. Estas transformacíones permiten detectar diferentes propiedades relativas ai desgaste. En este trabajo se tratan dos problemas prácticos, uno en supervivencia y otro en fiabilidad, mediante estas técnicas gráficas, determinando las propiedades de desgaste y clasificando las correspondientes funciones de supervivencia. En el dominio de la supervivencia trabajamos con da#os de cfincer de mama. ^os datos han sido recogidos en el Hospital Clinico de Granada durante los años 1973 a 1995, y corresponden a tiempos de supervivencia para enfermas operadas de cáncer. Fueron abservadas 518 pacientes. Dentro de este grupo, hemos seleccionado un subgrupo de pacíentes que tienen recaida y fallecen. Este grupo presenta interés desde el punto de vista mádico, ya que las enfermas que recaen no retornan al estado inicial del que partieron (postoperatorio) y el porcentaje de muertes es elevado. EI estudio de supervivencia para estas pacíentes ha sido Ilevado a cabo utilizando dos procedimientos. En primer lugar se ajusta a los datos una distribución teórica, y posteriormente estudiamos !a tendencia al riesgo de fallo de estos datos, caracterizando la clase de distribución no paramétrica a la que pertenecen. Se discuten las gráficas que se obtienen. Comprobamos que las datos proceden de una distribución de la clase NBUE y calculamos cotas para la funcián de supervivencia basadas en esta clase. Se tiene así una medida de la supervivencía para este tipo de cáncer en ia cohorte observada. La comparación de ambos métodos, paramétrico y no paramétrico, pone de manifiesto la limitación que supone e! uso exclusivo de los primeros. En el ^lominio de la fiabilidad, estudiamos la función de supervivencia del modelo de choques, y damos un procedimiento para simular muestras de tiempos de fallo de dispositivos gobernados por dícho modelo. Construimos un programa computacional para elaborar dichas muestras. Se comprueba que una muestra

PLI(' ^l{^IC)^ I)E I^^F( ^til( ^-i^, (^R;11^^ i(^^^^, f^.ti t-:l E^ ^; fl ^UlO l)E^ ftf^ ti1F'(_)^ Ut^^ ^l ^{'f .1Z^^l^^F^-^(^1 ^1

simulada pertenece a la clase de supervivencia caracterizada por tener la función razón de fallo en forma de bañera invertida. Gráficas de este tipo son frecuentes en bioestadística, donde el riesgo de fallo aumenta al principio de contraer una enfermedad y posteriormente decrece. Antecedentes sobre !as clases de supervivencia se encuentran en Barlow y Praschan {19751, donde las más usuales de estas son definidas. La clase HNBUE fué introducida por Rolski {1975), y es la más amplia de las que tratamos en el sentido que comprende a las demás como subclases. Las técnicas gráficas que utilizarnos son la transformación TTT, introducida por Barlow y Campo (1975}, que permite caracterizar diferentes nociones de desgaste, y la transformación de Lorenz. Referencias sobre estas caracterizaciones han sido estudiadas por Barlow (1979}, Bergman (1979), Lanberg (1980), Klefsjb (1982). Actuaimente, otras técnicas gráficas están siendo utilizadas para estudiar obtener información acerca de la fiabilidad de sistemas reparables (Walls, 1996}. Las aportaciones de este trabajo están contenidas en la discusión de la aplicación de herramientas gráficas no paramétricas y su comparación con la estimación paramétrica en la distribución de Weibull, y la simulacián de muestras de tiempos de fallo a partir de los madelos de choque, con la correspondiente implementación computacional. EI trabajo está organizado como sigue. En la Sección 2 se discuten los procedimientos paramétricos y no paramétricos y se aplican estos a un conjunto de datos de supervivencia al cáncer de mama. En la Sección 3 se indica el procedimiento de simulación de una muestra de tiempo de fallo utilizando 1os modelos de choques y se aplican las técnicas gráficas a esta muestra simulada para caracterizar la supervivencia del modelo. Estos procedimientos gráficos y la obtención de tiempos de fallo del modelo han sido implementados cornputacionalmente.

2.

SUPERVIVENCIA AL CÁNCER DE MAMA EN PACIENTES CON RECIDIVA

Hemas seguido la evolucián de una cohorte de 518 pacientes sometidas a mastectomía, entre los años 1973 y 1995 en el Hospital Clínico de !a Universidad de Granada. EI seguirniento de estas se hizo mensualmente. Se consideran datos censurados todos aquellos que al término de la observación continuan vivos, los que han fallecido por otra causa distinta al cáncer de mama, y los que no han podido ser seguidos en la observación.

^{

F^ I tl)!^+ l l( 1 1^I' tti^ ^ ! 1

Dei total de pacientes, 105 (20.27%) recaen y 413 no recaen. De este primer grupo de pacientes que recaen, 88 mueren y 17 (16.19%) son censurados. La edad media de las pacientes que recaen es de 53.762 años, con desviación típ'rca de 11.342. EI rango de edad de este grupo está comprendido entre 80 y 30 años. Se observa una gran dispersión en términos estadísticos. EI tiempo medio de supervivencia, usando el estimador producto límite {Kaplan-Meier, 1958} es de 77.16 meses. Como ejempfo ilustrativo de ios procedimientos gráficos que vamos a utilizar consideramos el grupo de pacientes que recaen y fallecen, un total de 88. La funcián de supervivencia empírica correspondiente a estos datos se ilustra en la Figura 1.

2.1.

Estimación paramétrica de la función de supervivencia

Una primera aproximación para la modelización de este conjunto de 88 pacientes que han faliecido despu^s de haber recaido es ajustarle una distribución paramétrica. Hemos ajustado distintas distribuciones de tiempos de vida coma la distribución exponencial y la distribución gamma, pero estos ajustes no son buenos. EI mejor ajuste corresponde a una distribución de Weibull. Esta distribución tiene funcián de supervivencia F (t) = exp{(-t/c^c)^^},

t>0,

donde ^i es el parámetro de forma y cx el parámetro de escala. Si ajustamos a nuestros datos una distribución de este tipo, los parámetros es^ timados por e! método de máxima verosimilitud son ^i = 2.81323 y á = 1146.11. Aplicando el test de ajuste de Kolmogorov-Smirnov de esta distribución teórica a 1os datos observados, el p-valor es O.ú64685, por lo que se puede considerar un ajuste relativamente bueno, y por tanto afirmar que los tiempas de vida de esta coharte de pacientes se ajustan a una distribución de Weibull. La camparación de las funciones de supervivencia empírica del conjunto de datos y la función de supervivencia de Weibull con los parámetros estimados antes viene dada en la Figura 1. Por tanto, sin otra información sobre los datos, la distribución que mejor se aproxima a los rnismos es la de Weibull con los parámetros estimados antes. Tal distribución tiene raz©n de fallo creciente por ser el parámetro de forma estimado mayor que uno, de modo que esta distribución pertenece a la clase IFR.

.^^PI.IC"A('IOti [)E. I l•:(^ti.l( Ati (^[Z:^f [(`;^^ 1_ti f[. [.Sf['[)[U C)[. f[f ^1f'( ^ ti [)[ Sf PE R^'[^'[ ti(`[:1

Figura 1 FUNCIONES DE SUPERVIVENCIA EMPÍRICA (ESCALONADA) Y DISTRIBUCl^N DE WEIBULL AJUSTADA A LOS DATOS

soa

2.2.

^ o00

^ sno

^ooo

Técnicas gráficas para el análisis de datos

Sean 0= to < t^ 1(1 [>t I I! 11}'t)ti I)f ^i 1^t^K^ I^l^^( I-1

^_^

vencia, es aconsejable una combinación de ambas técnicas para abtener una mejor infarmacián del con^ unto de datos. Desde el punto de vista práctico, el hecho de que los datos no pertenezcan a una distribución de la clase lFR indica que con el paso del tiempo no aumenta el riesgo de muerte en estos pacientes. Como resulta que tampoco es DFR, este riesgo tampoco disminuye. Presenta por tanto oscilaciones la función razón de fallo, de modo que se impone un estudio más detallado de este tiempo de vida para explicar estas oscilaciones.

3.

3.1.

OBTENCI(JN DE MUESTRAS PERTENECIENTES A LAS CLASES USUALES DE SUPERVIVENCIA EI modelo de choques con umbral de fallo

Un problema práctico que apar+ece frecuentemente es el estudio general de tiempos de fallo de dispositivos sometidos a choques y desgaste. EI modo de envejecimiento del dispositivo viene dada por la clase de supervivencia del mismo, que indica la tendencia de la razón de fallo. Este es un problema clásico en ingeniería. Generalmente, es difícil de calcular de forma explícita la distribución del tiempo de fallo, pero resulta bien conocido la clase de supervivencia del mismo si se tiene informacián sobre la Ilegada de fos golpes. Diferentes autores han estudiado este problema {Esary, et a1.,1973; A-Hameed y Proschan, 1973, 1975; Block y Savits, 1978; Klefsjé, 1981; Cao et al. 1991). Si un dispositivo se encuentra sujeto a choques, cada uno de ellos ie produce un daño aleatorio, y el falio del dispositivo se produce cuando el daño acumulado sobrepasa un umbral, se tiene así un modelo de choques general. En el caso que nos ocupa, supondremos que los choques vienen gobernados por un proceso de nacimiento puro, que los daños producidos por estos están idénticamente distribuidos con media 1/^1, y que el fallo se produce cuando el daño acumulado sabrepasa un umbral fija x. Si X(t) designa el daño acumulado en el tiempo t, {N{t), t?©} el proceso de nacimiento puro de Ilegadas de choques y F(^) es la distribucián del tamaño del daño, el tiempo de supervivencia del dispositivo se expresa r

H(x, t) = P{X(t) { x} _^ P{N(t) = k}Fk* ( k= 0

F ti f-\i)Iti I[( A t-tiP.^ti()( l

donde F"* designa la convolución de F consigo mismo n veces. Considerando como proceso de Ilegada de golpes el proceso de nacimiento puro con razones de nacimiento ^.k =^(k+1), k=0,1,2,... {proceso de Yule) para cualquier distribución F, la distribucibn H(x,t} es ia distribución del tiempo de failo de un dispositiva sometido a choques. Es posible obtener funciones de supervivencia dando valores a los parámetros ^, y µ y el umbral de fallo x. Entonces ia función de distribución H(t,x) depende solamente de t. Una buena aproximación para tal función puede ser tomar el número de sumandos k= 50. Si no particularizamos los parámetros tenemos clases paramétricas de distribuciones de tiempos de fallo. 3.?.

Simulación de muestras de tiempos de fallo

Si en el modelo anterior se toma como función de distribución F la distribución exponencial, y se dan valores a los parámetros y al umbral de failo, es posible obtener muestras de tiempos de fallo de un dispositivo sometido a choques según el modelo clásico de Esary, Marshal! y Proschan (1973). La transformación TTT permite averiguar si esta muestra pertenece a alguna de las clases usuales en fiabilidad. Con ello se tiene información sobre la forma en que el dispositivo se aproxima al fallo. Para ilustrar lo que acabamos de decir, tomando como valores de los parámetros ^=1, µ=1, x=5, tenemos una función de distribución H(t,x). Si consideramos una muestra de diez dispositivos idénticos sometidos a choques con estos parámetros y estudiamos las tiempos de fallo para cada uno, se tiene una muestra de una distribución de tiempo de fallo. Queda por determinar si esta muestra pertenece a alguna de !as clases usuales de supervivencia. La transformación TTT permite clasificar i a clase a la que pertenecen estos datos. Representamos la gráfica TTT que se obtiene en la Figura 5.

^^Pl.lt',^1('1Oti^ f^F^: fF:(.^til(^,titi (^k,^^F^l(^A^i E:ti ^-:L ES^f^I'DlE) DF: ^ilE^^.!^1POS UF S( ^PE^:R^'I^`t•:tiC^lr>

!^

Figura 5 CR^FICA TTT PARA LOS DATOS SIMULADQS (^.=1, µ=1, X=S, N=10) ^ 0.9

Esta gráfica indica que 1a razón de fallo del dispositivo no es creciente (iFR) ni es decreciente (DFR). Se tiene así, aproximadamente, ya que el tamaño de la muestra es pequeño, una muestra de la clase de distribucianes con razón de falla en forma de curva bañera invertida. Esta clase de supervivencia aparece frecuentemente en bioestadístíca, donde el riesgo de fallo aumenta al principio de contraer una enfermedad y posteriormente decrece. También es de frecuente uso en ingeniería, donde la aparición de tiempos de fallo de esta clase ponen de manifiesto que el riesgo de fallo al principio de la vida del dispositivo crece, por lo que se hace preciso aumentar el control de calidad en el proceso de fabricación. EI intervalo de tiempo en el que la función razón de fallo crece permite dar una idea del tiempo de garantia de dichos dispositivas. En este ejemplo se pone de rnanifiesto de nuevo la necesidad de aplicar métodos no paramétricos en el ajuste de tiempos de fallo. Entre las distribuciones que tienen la función razón de fallo en forma de bañera invertida están la distribución

F:tiT,^U14Tlt'A I.tiPAti()I ^1

lognormal y la distribución inversa gaussiana. Las distribuciones con este tipo de razón de failo han sido estudiadas por Glaser {1980).

4.

AGRADECiMiENTOS

Los autores agradecen al evaluador las sugerencias que han mejorado notabiemente la versián final de este trabajo. También agradecen al Prof. Dr. Pedraza, Director del Departamento de Radiología y Medicina Fisica de la Universidad de Granada, el haber facilitado los datos s©bre el c^ncer de mama para la realización de este trabajo.

REFERENCIAS A-HAMEED, M. S. y PROSCHAN, F. (1973). «Nonstationary shock models», Stoch. Proc. Applic. , 1, 383-444. A- HAMEED , M. S . ^/ PR^SCHAN , F. (1975). ?, ©per. Res., 32, 596-606.

BLOCK ,.I^i.W . y SAVITS ,

T.H. (1978). «Shock models with NBUE survival», J. Appl.

Prob. , 15, 621-628. CAO, J. y WANG, Y. {1991). «The NBUC and NWUC classes of life distríbutions», J. Appl. Prob. , 28, 473-479.

:^f'f.lt ^^('IO!ti O1. ( E('til( -1ti (ifZ,r^FI(' ^ 1ti E^ti E^l. E.S f l'[)Ii) C)E^. 11F^:?01F'OS f.)f- til'F't:R^'Iti'l^:ti('I.^ ^

ESARY, .J.D. , MARSHALL, A.W. y PROSCHAN ,

^ 7

F. (1973). «Shock models and wear

processes» , Ann. Prob. , 1, 627-649. FELLER, W. (1966). «An Introduction to Probability Theory and its Applications», J. Wiley, Vol.1. GLASER, R.E. (1980). «Bathtub and Related Failure Rate Characterizations», J. Am. Statist. Assoc. , 75, No. 371, 667-672 . KAPLAN, E. L. y MEIER, P. (1958). «Non-parametric Estimation from Incomplete fJbservations», J. M. Statíst. Assoc., 53, 457-481. KLEFSJÓ, B. (1981). «HNBUE Survival Under Some Shock Models», Scand. J. Statist. , 8, 39-47. KLEFSJ^, B. (1982}. «The HNBUE and HNWUE Ciasses of Life Distribution», Naval ^?es. Logist. Quart., 29, No. 2, 331-344. LANBERG ,

N.A., LEONE , R.V . y PROSCHAN , F.(1980). «Characterization of Nonparametric Classes of Life Distributions», Ann. Prob., 8, 1163-1170.

PHAM, T.G. y TURKAN, N. (1994). «The Lorenz and the Scaled Total-Time-on-Test Transform Curves: A Unified Approach,» IEEE Transactíons on Reliability,43, 76-83. ROLSKI, T. (1975). «Mean Residual Life», BuII. Int. Stat. Inst., 46, 266-270. SENGUPTA, D. (1994). «Another Look at the Mornent Bounds on Reliability» Appl. Probab. Trust. , 777-787 .

WALLS, L. (1996). «A graphical approach to identification of dependent failures», The Statistician, 45, No.2, 185-196.

^ K

F-.S1 ^1I)!ti"I!( ,^ E:^PA`^()1.-^

GRAPHICAL PROCEDURES IN LIFETIME DATA SUMMARY Parametric and non parametric lifetime data analysis in practical situations requires the use of procedure to know the ageing praperties. The graphics procedure are very useful to identify the survival classe to which the data belongs to. We study the changes in the trend of the hazard rate in two application fields: survival and reliability. A data set relative to breast cancer is studied, and bounds for survival function are calculated. In this example, we show the advantage of the non parametric rnethods in survival, and the convenience to use both tecniques, parametric and non parametric, in this field. 1n the domain of reliabiiity, using the shock models, a sampfe of failure time is simulated, applying computational methods to the theoretical results for applications. The survival class of the data is classified.

Key wards: Survival classes, Scaled TTT Transform, Lorenz Transform, Shock Models Clasification AMS: 62N05