Resumen de los Días 1 y 2 1. TEST DE COMPARACIÓN DE DOS PROPORCIONES INDEPENDIENTES (H 0

Resumen de los Días 1 y 2 1. TEST DE COMPARACIÓN DE DOS PROPORCIONES INDEPENDIENTES (H0 ≡ p1=p2 vs. H1 ≡ p1≠p2) Dos muestras independientes (de tamaño

12 downloads 79 Views 196KB Size

Recommend Stories


0. RESUMEN EJECUTIVO...1
SOCIEDAD PORTUARIA DE CÓRDOBA S.A. PUERTO MARÍTIMO EN LA COSTA CORDOBESA 0. HASKONING B.V. RESUMEN EJECUTIVO ......................................

% 3 1 %)0 "2# %)0 % +, - -. % &'% ( %)
! " % # $ 3 1 + , - - . / % 0 % 0 1 # 2 % 0 % )0 % )0 % ) 0 % &' # # " 2 # % % ( & %) * 1 ! " % &' # % $ (

AGUASSUBTERRANEAS H 1(04-0
m la estas Le la la en e los .gilar eden de la s seis ~s, se tjeres 19uas ') que a vez unos para su cada ::ledor desu tomas lrenes ,ien se canal fl

1 Razones y Proporciones
1 Razones y Proporciones 1 1 Razones y Proporciones En la vida real surgen muchas ocasiones en las que deseamos comparar dos cantidades. Para comp

Story Transcript

Resumen de los Días 1 y 2 1. TEST DE COMPARACIÓN DE DOS PROPORCIONES INDEPENDIENTES (H0 ≡ p1=p2 vs. H1 ≡ p1≠p2) Dos muestras independientes (de tamaños n1 y n2) Respuesta se clasifican según que sus individuos SÍ o NO verifiquen SÍ NO una cierta característica. Con la notación de la derecha y Muestra 1 x1 y1 n1 con E = Mín(n1; n2)×Mín(a1; a2)/N: Muestra 2 x2 y2 n2 a) Tests condicionados: i) Test Aproximado Chi-cuadrado: Válido siempre: a1 a2 N Calcular el estadístico de Yates

χ Y2 = N { x1 y 2 − x 2 y1 − N/2} / {a1a 2 n1n 2 } y P=P(z ≥ χY )=1−F( χY ) por la TABLA 1. 2

• Cuando n1=n2 o a1=a2, hacer P′ =P. En otro caso, determinar una nueva tabla con

x1′ = [2n1a1/N−x1], en donde [x] alude al redondeo de x en el sentido de alejarse de x1, y en la que deben respetarse los marginales ni y ai. Si x1′ no es lícito, P′ = 0. Si sí lo es, proceder como en el paso anterior hasta obtener el nuevo P′ . • El valor P final es la suma de los dos valores P así obtenidos: Pfinal = P+ P′ . NOTA: Lo tradicional es comparar χ Y2 con una χα2 de la TABLA 7 (o χY con una zα de la TABLA 2), lo que da lugar a resultados conservadores (menos significaciones de las debidas). La condición E>5 es la tradicional, aunque no es correcta.

ii) Test Exacto de Fisher: En otro caso, proceder como en la TABLA 16. b) Tests incondicionados (preferibles por ser más potentes): i) Test Aproximado Chi-cuadrado: Si E≥14,9 o

{N ≤ 500 y E ≥ 7,7}, calcular

χ = N { x1 y 2 − x 2 y1 − c} / {a1a 2 n1n 2 } con c=1 (2) si n1≠n2 (n1=n2). Entonces 2 II

2

P=2{1−F(χII)} en TABLA 1 o bien P se obtiene comparando χII con la TABLA 2 o χ 2II con la TABLA 7 (con g.l.=1). ii) Test Exacto de Barnard: En otro caso, proceder como en la TABLA 17. 2. TEST DE INDEPENDENCIA EN TABLAS 2×2 (H0 ≡ A y B son independientes vs. H1 ≡ A y B son dependientes) B Una muestra de N individuos se clasifica SÍ NO A según que estos SÍ o NO verifiquen dos y1 n1 SÍ x1 características dicotómicas A y B. Con la NO x2 y2 n2 notación de la derecha: a1 a2 N a) Tests condicionados: Proceder como en el apartado 1.a). b) Tests incondicionados: i) Test Aproximado Chi-cuadrado : Si E≥6,2 o {N ≤ 500 y E ≥ 3,9}, calcular χ 2I = 2 N× { x1 y 2 − x 2 y1 − 0,5} / {a1a 2 n1n 2 } . Entonces P = 2{1−F(χ1)} en TABLA 1 o bien P se obtiene comparando χ1 con la TABLA 2 o χ 2I con la TABLA 7 (con g.l.=1). ii) Test Exacto de Barnard: En otro caso, proceder como en la TABLA 18. ˆ = x1y2/x2y1 < Cuando el test da significativo, la asociación encontrada es positiva si O ˆ ⎟ 2 ⎝ 2⎠ en donde PSG (δ0) y PIG(δ0) aluden al valor P de los tests SG (H0 ≡ d = δ0 vs. H1≡ d>δ0) e IG (H0≡ d = δ0 vs. H1≡ dα en donde PSG2(δ0) alude al valor P del test SG2 (H0≡δ=δ0 vs. H1≡δ≠δ0). La dirección electrónica donde copiar todos estos tests se da al final. 4. ANÁLISIS DE VARIAS TABLAS 2×2 Cuando se estudia la asociación entre una Enfermedad (E) y un Factor de Riesgo (FR) en diversos (K) Estratos (ES) como el sexo, edad agrupada, etc., no debe colapsarse los K estratos pues ello puede dar lugar a dos tipos de sesgos (de confusión y de interacción), sino que deben analizarse las tablas individual y globalmente por uno de los dos métodos que siguen. Sean O1, O2, ..., OK las razones del producto cruzado poblacionales en cada uno de los K estratos. Lo que sigue es válido si: Fi × C j MinFi × MinC j E ij = ∑ >5 > 5 ∀i,j aunque es suficiente con ∑ ∑ T T ESTRATOS ESTRATOS ESTRATOS a) Test de Gart: (aconsejable cuando hay pocos estratos con muchos datos). Calcular por estrato: −1 −1 ˆ' y ˆ = ln O w i = {∑(Oij + 0,5) } δ1 ≤ δ ≤ δ2 con δ1 (δ2 ) = Mín (Máx) δ0 en que PSG (δ0 ) >

θi

i

entonces (en lo que sigue, zα en la Tabla 2 y χα2 en la Tabla 7): i) Test de homogeneidad: Para contrastar H0 ≡ O1=O2=...=OK (=O), comparar: 2 ∑ w iθˆi ) ( 2 2 ˆ vs. χα2 (r − 1) . χ HOMOGENEIDAD = ∑ w iθi − ∑ wi ii) Test de independencia: Si el test de i) no es significativo, tiene sentido contrastar H′0 ≡ O=1 2 = ( ∑ w iθˆi ) /(∑ w i) vs. χα2 (1) . De dar este último significativo, una comparando χ ASOCIACIÓN ˆ = exp (θˆ ), con θˆ = (∑ w ˆ ) /(∑ w i) , y un intervalo de estimación de la O global es O i θi confianza para tal O global es O ∈ exp θˆ ± zα / ∑ w i . 2

{

}

iii) Análisis individual tabla a tabla: Si el test de i) sí es significativo, entonces solo cabe analizar las tablas individualmente por los métodos de la sección 3. Alternativamente, y para aprovechar los cálculos ya realizados, el test para H0 ≡ Oi=1 se hace comparando zi = | θˆi | w i vs. zα, en tanto que el intervalo de confianza para de las Oi individuales es:

{

}

Oi ∈ exp θˆi ± zα / w i . b) Test de Mantel-Haenszel: Es el aconsejable cuando hay muchos estratos con pocos datos. ˆ en los diferentes estratos. Si ellos dan asociaciones de i) Paso previo: Calcular los valores de O i distinto signo (unas positivas, otras negativas), debe hacerse un análisis individual de cada estrato como en la sección 3. En otro caso, seguir. ii) Test de homogeneidad e independencia global: Para contrastar H′′0 ≡ O1=O2=...=OK=O: 2

comparar χ

2 MH

⎧ O O − O12 O 21 ⎫ ⎧ F1F2C1C2 ⎫ 2 = ⎨∑ 11 22 ⎬ / ⎨∑ 2 ⎬ vs. χα (1) T ⎩ ES ⎭ ⎩ ES T (T − 1) ⎭

ˆ global es: De dar significativo el test anterior, el O ˆ = ⎧⎨ O11 O 22 ⎫⎬ / ⎧⎨ O12 O 21 ⎫⎬ O ∑ T ⎭ ⎩∑ MH T ⎭ ES ⎩ ES

4

Resumen de los Días 5 y 6 5. MEDIDAS DE CONCORDANCIA B Si dos observadores A y B clasifican 1 ··· j ··· K Total A independientemente a T objetos en K F1 1 O11 · · · O1j · · · O1K clases, los resultados pueden presentarse : : : : : como en la tabla de frecuencias de la O i · · · O · · · O F i1 ij iK i derecha (la clasificación de A en filas, la : : : : : de B en columnas). El objetivo es medir K OK1· · · OKj · · · OKK FK el grado de concordancia (o de acuerdo) existente entre ambos, lo que se hace a Total C1 · · · Cj · · · CK T través de los dos índices que siguen. 6.1. Índice Kappa El coeficiente de Concordancia Kappa se define como: I −I κˆ = o e 1 − Ie con Io (Ie) el índice de concordancia observado (esperado) que se define más abajo. Tiene el problema de que se comporta mal cuando los marginales Fi y Cj están muy desequilibrados en el mismo sentido. a) Kappa normal: Usualmente Io = ΣOii/T e Ie = ΣFiCi/T2 con lo que : T O − FC O O − O12O 21 ⇒ para K=2: κˆ = 2 × 11 22 κˆ = ∑2 ii ∑ i i T − ∑ FC F1C2 +F2C1 i i b) Kappa ponderado: En ocasiones conviene dar un peso wij a cada frecuencia Oij, que refleje la importancia de la concordancia (si i=j) o discordancia (si i≠j) ocurrida, con tal de que wii=1, wij=wji y 0≤wij≤1. Ello es especialmente adecuado cuando las clases son ordinales (en cuyo caso ha de ocurrir también que wK1=w1K=0), soliendo ser habitual que: 2 i− j ⎛ i− j ⎞ w ij = 1 − (ponderación lineal) o w ij = 1 − ⎜ ⎟ (ponderación cuadrática) K −1 ⎝ K −1 ⎠ En cualquier caso κˆ p se obtiene a través de:

⎧Io = ∑∑ w ijOij / T FC ⎪ i j i j con E ij = las Cantidades Esperadas ⎨ T ⎪ Ie = ∑∑ w ijE ij / T i j ⎩ c) Interpretación de κˆ (o κˆ p ): Los observadores están de acuerdo en una fracción κˆ del total de posibles acuerdos no debidos al azar. d) Valores posibles de κˆ (o κˆ p ):

κˆ = +1

κˆ = 0 κˆ = − Ie /(1 − Ie ) < 0 Concordancia perfecta Concordancia nula Discordancia perfecta Concordancia Discordancia e) Valoración de κˆ (o κˆ p ): La concordancia (o acuerdo) es: κˆ 2K3) El cálculo del error estándar de κˆ −S.E.( κˆ )− es complicado y conviene efectuarlo con un programa como los que se indican en el apartado 7. Obtenido el mismo, el intervalo de confianza para el parámetro κ poblacional es el clásico: κ ∈ κˆ ± zα × S.E.(κˆ ) con zα en TABLA 2

Ello puede servir también para contrastar si hay concordancia o no (Ho≡ κ = 0 vs. H1≡ κ ≠ 0 ). Cuando “cero” pertenece al intervalo ⇒ conclusión por Ho≡ La concordancia es nula. De igual modo con κ p . En el caso actual, lo usual es hacer intervalos /tests de una cola: κ ≥ κˆ − z 2α × S.E.(κˆ ) con z2α en TABLA 2 g) Análisis clase a clase: Para estudiar el grado de acuerdo que hay en la clase i debe estudiarse la tabla ′ = F1 − O11 , ′ = O11 , O12 colapsada en la clase i. Ello produce una tabla 2×2 con O11 O′21 = C1 − O11 y O′22 = T − F1 − C1 +O11 , cuyo valor de κˆ −llamado κˆ i − se obtiene como más arriba. Esto debe hacerse con todas las clases. 6.2. Índice Delta a) Introducción: El Coeficiente de Concordancia Delta ( Δˆ ) −que está basado en el modelo de respuesta de los exámenes de tipo test− depende del parámetro Δˆ i : la intensidad con que el observador B reconoce a un objeto clasificado como i por el observador A. Tiene la ventaja de no ser sensible a los marginales y de permitir un estudio más detallado del problema. Tiene la desventaja de requerir el uso de una máquina programable y de ser válido solo para cualidades nominales y cuando se verifica el modelo asumido. En general Δˆ  κˆ ´, salvo cuando los marginales están muy desequilibrados. b) Definiciones: En la primera columna de la Tabla 1 se indican diversas medidas observadas (no corregidas por azar) de la calidad o fiabilidad de los acuerdos obtenidos. Como los acuerdos Oii se deben unos al azar (Oii−Fi Δˆ i ) y otros no (Fi Δˆ i ), sustituyendo los Oii de la primera columna de la Tabla 1 por Fi Δˆ , se obtienen los i

valores corregidos por azar de la segunda columna de dicha tabla. Tales parámetros no pueden calcularse siempre, sino que sólo son válidos bajo las condiciones indicadas en la Tabla 2. c) Interpretación y utilidad: Δˆ = % global de respuestas que son concordantes no por azar. Mide el acuerdo global. Fli = % de veces en que B reconoce (no por azar) un objeto clasificado por A como de tipo i. Es útil cuando A es un estándar. l Pi = % de veces en que una respuesta i de B es de tipo i según A no por causa del azar. Es útil cuando A es un estándar. Sli = % de acuerdos de tipo i que no se deben al azar. Permite evaluar la calidad del acuerdo en cada clase (analizando así el acuerdo global Δˆ ). d) Valores posibles de Δˆ y su valoración: Como con κˆ , pero ahora Δˆ puede llegar a valer −1 (e incluso menos) cuando A y B están muy en desacuerdo. e) Intervalo de confianza y test: Como con κˆ , con los cambios oportunos. Por ejemplo: Δ ∈ Δˆ ± zα × S.E.(Δˆ ) . El valor de S.E. se obtiene también por ordenador.

6 Tabla 1 Medidas de acuerdo en la Categoría i (primeras 3 filas) y Global (última fila) NO corregidas por azar

O Pˆi = ii Ci

Capacidad de B para reconocer un objeto clasificado por el estándar A como de tipo i Credibilidad de una predicción de B de que el objeto es de tipo i (si A es un estándar)

2Oii Sˆ i = Fi + Ci

Fiabilidad de un acuerdo de tipo i (no hay estándar)

O Fˆi = ii Fi

SÍ corregidas por azar Fl = Δˆ Conformidad i

Pli = Sli =

i

Fi Δˆ i Ci 2Fi Δˆ i Fi +Ci

(Categoría i) Predictividad (Categoría i) Consistencia (Categoría i)

ΣF Δˆ Concordancia o Acuerdo Δˆ = i i (Global) T Tabla 2 Validez de las medidas de la Tabla 1 en función del muestreo adoptado y de que exista o no un estándar ˆ ΣOii A= T

Acuerdo global observado (haya o no un estándar)

A (filas) = Estándar

B (columnas) = Estándar

Muestreo II

Fli y Δˆ

Δˆ

Muestreo I

Fli , Pli y Δˆ

Poner el estándar en filas

No hay un estándar

Δˆ

Sli y Δˆ

6. INTERVALOS DE CONFIANZA PARA UNA PROPORCIÓN (p1

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.