Herramientas estadísticas (HE)

Herramientas estadísticas (HE) Realizado por: Guillermo Sánchez. Actualizado: 2015-05-19 En este documento se describen las herramientas estádisticas

Author: Esteban Redondo Rivas

2 downloads 182 Views 498KB Size

Report

DOWNLOAD PDF

Recommend Stories

HERRAMIENTAS HERRAMIENTAS HERRAMIENTAS

Herramientas Herramientas

HE-735 E

Herramientas

Golpear. Cortar. Medir. Trazar. Sujetar. Unir. Enroscar y desenroscar. Perforar. Terminaciones

He 01 Madrid

LISTADO DE MÁQUINAS- HERRAMIENTAS Y HERRAMIENTAS

Cap. 6: Listado de Máquinas-herramientas y Herramientas CAPÍTULO 6: LISTADO LISTADO DE MÁQUINASMÁQUINASHERRAMIENTAS Y HERRAMIENTAS Página 49 Cap.

Story Transcript

Herramientas estadísticas (HE) Realizado por: Guillermo Sánchez. Actualizado: 2015-05-19 En este documento se describen las herramientas estádisticas (HE web) disponibles para realizar calculos estadisticos desde la web de ENUSA o bien directamente utizando el programa Mathematica. A la versión web puede accederse desde Gescentro: Inicio > Operaciones Combustible Nuclear > Aplicaciones>WebMathematica>Cálculo/Estadística/Gráfica o desde escribiendo en un navegador web (incluso desde el exterior de la red de ENUSA): http://www3.enusa.es/webMathematica/Estadistica/estadistica.htm Una vez accedamos a la dirección web indicada desplegamos el siguiente menu:

De las optiones que se muestran en la gráfica anterior aqui se describen hasta test de normalidad, excluido ( Las funciones relacionadas con Test de normalidad son objeto de otro documento).

2

ControlCalidad.nb

El paquete Intervalos Las funciones indicadas han sido desarrolladas utilizando el programa Mathematica, con tal fin se ha construido un paquete denominado ControlCalidad . En lo que sigue contaremos las funcionalidades del paquete que pueden ejecutarse con Mathematica al que puede accederse dentro de ENUSA, via terminal server o directamente via web segun se ha indicado al principio. Si se opta por acceder al paquete directamente con Mathematica se dispone de una gran versatilidad pero requiere conocimientos del programa, en el caso de acceder a las HE web los cálculos con muy sencillos pero se tendra menos versatilidad. En este documento mostramos como se utiza el paquete intervalos y en algunos casos se indica como se puede reproducir el mismo caso utilizando HE web. Lo primero que hemos de hace es cargar el paquete. Needs["Estadistica`ControlCalidad`"] ControlCalidad,

version 1.1

2015-05-19

El paquete permite calcular calcular intervalos de confianza de la media y los de tolerancia de poblaciones, asi como el tamaño muestral. En el caso de los intervalos de confianza de la varianza no estan incorporados al paquete, se explica como pueden calcularse utlizando las funciones de Mathematica. Es documento es una ayuda del paquete no obstante pude acceder a una ayuda mas resumida de las distintas funciones disponibles como sigue (pulse sobre la que desee): ? "Estadistica`ControlCalidad`*" Estadistica`ControlCalidad`

g1

limiteBilateral

p1

sizeSample

g2

limiteUnilateral

ProbAlfa

t1

z1

ControlCalidad.nb

3

Intervalos de confianza de la media para varianza conocida _

Sea y la media de cierta medida realizada a una muestra procedente de una población de la que se _

conoce su varianza que es σ 2 . Llamamos intervalo de confianza para y con nivel de confianza (1 α) aquel que tiene una probabilidad de (1 - α)100% de contener la verdadera media μ. El cálculo de intervalo de confianza de la media no requiere que la población sea normal.

Límite unilateral inferior Yp = y -

z(1 - α)

σ

n

Límite unilateral superior Yp = y +

z(1 - α)

σ

n

Límite bilateral inferior Yp = y -

z(1 - α / 2)

σ

n

Límite bilateral superior Yp = y +

z(1 - α / 2)

σ

n _

Calcular los intervalos de confianza unilaterales y bilaterales para: y = 10.34, σ = 1.23, n = 30, y α = 0.05, supuesta varianza conocida z1[10.34, 1.23 , 30, 0.05] {unilateral:, {LS → 10.7094, LI → 9.97062}, bilateral:, {LS → 10.7801, LI → 9.89986}}

Corresponde a :

4

ControlCalidad.nb

ControlCalidad.nb

5

Intervalos de confianza de la media para varianza desconocida _

Sea y la media de cierta medida realizada a una muestra procedente de una población de la que se no conoce su varianza, pero si la varianza muestral. El cálculo de intervalo de confianza de la media no requiere que la población sea normal. Si desconocemos la varianza de la población utilizarmos la distribución t que la que se verifica t = _

(y- μ)/(s/

n ), donde s es la desviación estándar muestral, con la que se obtiene los siguientes

límites para los intervalos

Límite unilateral inferior Yp = y -

t(n - 1, 1 - α) n

s

Límite unilateral superior Yp = y +

t(n - 1, 1 - α) n

s

Límite bilateral inferior Yp = y -

t(n - 1, 1 - α / 2) n

s

Límite bilateral superior Yp = y +

t(n - 1, 1 - α / 2) n

s _

Calcular los intervalos de confianza unilaterales y bilaterales para: y = 10.34, σ = 1.23, n = 30, y α = 0.05, supuesta varianza conocida t1[10.34, 1.23 , 30, 0.05] {unilateral:, {LS → 10.7216, LI → 9.95843}, bilateral:, {LS → 10.7993, LI → 9.88071}}

Corresponde a :

6

ControlCalidad.nb

ControlCalidad.nb

7

Cálculo de intervalos de tolerancia en poblaciones normales Conceptos En control de calidad a veces es necesario definir el intervalo de tolerancia (no confundir con intervalo de confianza). Consideremos una población de la que tomamos una muestra de tamaño n en la que medimos cierta característica y (diámetro, densidad, peso, etc.). Calculamos su media y y su desviación estándar s. El cliente puede requerir que dicha característica esté dentro de un intervalo de tolerancia. Definimos el 100p-ésimo percentil al la valor Yp por debajo del cual está el 100p % de la población, o, lo que es equivalente, aquel valor para el que las observaciones de muestra aleatoria de la población cae con una probabilidad p. En ocasiones nos interesa estimar el valor de Y p asociandole un intervalo de confianza, (1 - α) 100%. Ejemplo: Deseamos calcular el valor por debajo del cual está el 95% de la población con un nivel de confianza del 95%. Problemas similares consisten en calcular límites centrales dentro de los cuales está el 100p% de la población, y límites inferiores por encima del cual está 100p% de la población. Asimismo un límite superior de confianza (1 - α) 100% para el percentil 100p-ésimo es equivalente al límite superior de tolerancia por debajo del cual está al menos una proporción p de la población con una probabilidad 1 - α. Una interpretación similar cabe del límite inferior de tolerancia. Las expresiones específicas para obtener los límites de tolerancia Yp son las siguientes (requiere que la población sea normal)

Límite unilateral inferior Yp = y -

t' n - 1, - z(p)

n ; 1 - α

n

s

Límite unilateral superior Yp = y +

t' n - 1, z(p)

n ; 1 - α

n

s

Límite bilateral inferior Yp = y -

1 n

t' n - 1, - z

1+p 2

n ; 1-α s

Límite bilateral superior Yp = y +

t' n - 1, z 1-p  2 n

n ; 1 - α

s

8

ControlCalidad.nb

donde t ' es la distribución t - Student no central Debajo se muestra ejemplos de la la función de densidad (PDF) y la distribución acumulada (CDF) para la NoncentralStudentTDistribution [ν,δ]) con ν grados de libertad y un parámetro de no centralidad δ. Plot[Evaluate @ Table[PDF[NoncentralStudentTDistribution[25, δ], x], {δ, {- 2, 0, 3}}], {x, - 6, 8}, Filling → Axis] 0.4

0.3

0.2

0.1

-6

-4

2

-2

4

6

8

Plot[Evaluate @ Table[PDF[NoncentralStudentTDistribution[ν, 2], x], {ν, {0.5, 3, 10}}], {x, - 1, 6}, Filling → Axis] 0.35 0.30 0.25 0.20 0.15 0.10 0.05 1

-1

2

3

4

5

6

Plot[Evaluate @ Table[CDF[NoncentralStudentTDistribution[25, δ], x], {δ, {- 2, 0, 3}}], {x, - 6, 8}, Filling → Axis] 1.0 0.8 0.6 0.4 0.2

-6

-4

-2

2

4

6

8

ControlCalidad.nb

9

Calculo de kn,α,p Calculo de kn,α,p en el caso unilateral Para calcular la k de forma exacta se aplica: t' n - 1, - z(p)

n ; 1 - α

n La función anterior tiene el problema que requiere grandes recursos de ordenador cuando n aumenta. Podemos aplicar una aproximación para el caso unilateral cuando el el valor n empieza a ser elevado (n>10) t' n - 1, z(p)

n ; 1 - α

kn,α,p = n

≈  z (p) + z2 (p) - a b

1/2

 a

donde a = 1 - [z (1 - α)]2  [2 (n - 1)] b = [z (p)]2 - [z (1 - α)]2  n Ejemplo: Calcular la k unilateral para n:, de 5 a 20, incrementando n de 5 en 5. La aplicamos al caso de que alfa = 0.05 y 0.1 y F (fraccion de la población en el intervalo): 0.90 a 0.975 Comparamos los resultados con los tabulados (estan disponibles en varios sitios de internet) y apenas hay diferencias Table[{{n, p}, g1[n, 0.05, p]}, {n, 5, 20, 5}, {p, 0.90, 0.975, 0.025}] // TableForm 5 3.40663 10 2.35464 15 2.06837 20 1.92599

0.9 0.9 0.9 0.9

5 0.925 3.74993 10 0.925 2.59492 15 0.925 2.2835 20 0.925 2.12931

5 0.95 4.20268 10 0.95 2.91096 15 0.95 2.566 20 0.95 2.396

5 4.90851 10 3.40245 15 3.00457 20 2.80954

0.975 0.975 0.975 0.975

γ = 1- 0.05= 0.95 n 0.90 0.95 0.975 0.99 5 3.413 4.210 4.916 5.749 10 2.355 2.911 3.403 3.981 20 1.926 2.396 2.809 3.295 Table[{{n, p}, g1[n, 0.1, p]}, {n, 5, 20, 5}, {p, 0.90, 0.975, 0.025}] // TableForm 5 2.74235 10 2.06567 15 1.86684 20 1.76521

0.9 0.9 0.9 0.9

5 3.02616 10 2.28301 15 2.06682 20 1.95683

0.925 0.925 0.925 0.925

γ = 1-0.1= 0.90 n 5

0.90 0.95 0.975 0.99 2.744 3.401 3.983 4.668

5 3.39983 10 2.56837 15 2.32898 20 2.20778

0.95 0.95 0.95 0.95

5 3.98131 10 3.01125 15 2.73518 20 2.59621

0.975 0.975 0.975 0.975

10

ControlCalidad.nb

10 2.066 2.568 3.011 3.532 20 1.765 2.208 2.597 3.052

Calculo de kn,α,p en el caso bilateral Al igual que en el caso unilateral el método de la t-student no central requiere un consumo eleva de recursos de ordenador, aplciamos la aproximación siguiente kn,α,p ≈ z[(1 + p) / 2]

(n - 1) χ2 (n - 1; α)

1/2

1+

1 2n

Ejemplo: Calcular la k bilateral para n:, de 5 a 20, incrementrando n de 5 en 5. La aplicamos al caso de que alfa = 0.05 y 0.1 y F (fraccion de la población en el intervalo): 0.90 a 0.975 Comparamos los resultados con los tabulados y apenas hay diferencias Table[{{n, p}, g2[n, 0.05, p]}, {n, 5, 20, 5}, {p, 0.90, 0.975, 0.025}] // TableForm 5 0.9 4.2924 10 0.9 2.84141 15 0.9 2.48101 20 0.9 2.31048

5 4.64628 10 3.07568 15 2.68556 20 2.50097

0.925 0.925 0.925 0.925

5 0.95 5.1147 10 0.95 3.38575 15 0.95 2.9563 20 0.95 2.7531

5 5.84914 10 3.87193 15 3.38081 20 3.14843

0.975 0.975 0.975 0.975

γ = 0.95 n 0.90 0.95 0.99 5 4.275 5.079 6.634 10 2.839 3.379 4.433 20 2.310 2.752 3.615 Table[{{n, p}, g2[n, 0.1, p]}, {n, 5, 20, 5}, {p, 0.90, 0.975, 0.025}] // TableForm 5 3.50878 10 2.53785 15 2.27864 20 2.15302

0.9 0.9 0.9 0.9

5 3.79806 10 2.74708 15 2.46651 20 2.33053

0.925 0.925 0.925 0.925

5 4.18097 10 3.02403 15 2.71517 20 2.56548

0.95 0.95 0.95 0.95

5 4.78133 10 3.45827 15 3.10505 20 2.93387

0.975 0.975 0.975 0.975

γ = 0.90 n 0.90 0.95 0.99 5 3.494 4.152 5.423 10 2.535 3.018 3.959 20 2.152 2.564 3.368

Ejemplo: Calcular el valor de K unilateral y bilataral para una muestra de tamaño n = 20, con alfa = 0.1, y P = 0.95. { g1[20, 0.1, 0.95], g2[20, 0.1, 0.95]} {2.20778, 2.56548}

ControlCalidad.nb

Calular los limites unilaterales y bilaterales para una poblacion del que tomamos una muestra de tamaño n con media 10.34 y desv. standar: 1.23 con alfa =.05 y P = 0.25 limiteBilateral[10.34, 1.23, 30, 0.05, 0.95] {LS → 13.4765, LI → 7.20353} limiteUnilateral[10.34, 1.23, 30, 0.05, 0.95] {LS → 13.0565}

Ejemplo.- Tomemos 30 medidas experimentales que representan una muestra de la población. Medimos cierta característica para la que se establece como límite de aceptación (tolerancia) que el 95% de la población está por debajo de 15 probabilidad del 90%.) Los resultados de las 30 medidas son los siguientes :

11

12

ControlCalidad.nb

medidas = {10.98, 7.20, 8.08, 7.76, 15.10, 7.64, 9.92, 8.39, 9.67, 11.46, 10.57, 9.65, 8.98, 10.01, 7.74, 8.77, 8.09, 5.83, 12.31, 9.78, 8.05, 10.45, 8.93, 6.92, 5.26, 7.91, 12.52, 11.61, 13.77, 12.47};

Ahora procedemos a comprobar si se verifica y + k30,0.1,0.95 s < 10 y, s = {Mean[ medidas], StandardDeviation[medidas]} {9.52733, 2.29301} y + g1[30, 0.10, 0.95] s 14.2591

Tambien podemos calcular el limite directamentne con : limiteUnilateraly, s, 30, 0.10, 0.95 {LS → 14.2591}

Luego aceptaríamos la población pues está debajo de 15

ControlCalidad.nb

13

Criterios para determinar si una muestra está dentro del intervalo de tolerancia para un P y alfa dados Dado un intervalo de tolerancia definido por los límites superior e inferior (LS, LI) pretendemos saber si una muestra de media x y desviación estandar s está comprendida en el intervalo de tolerancia para un P dado Conocidos los LS e LI de aceptacion, y los parametros muestrales x, s y n, se trata de calcular p fijado α y ver si este p es mayor o igual que un P dado. Para ello: a) Hacemos Yp = LS y Yp = LI en y obtenemos g1[n, alfa, pS] ⩵

LS - x

g1[n, alfa, 1 - pI] ⩵

s

y de aquí pSg1[n, alfa],

x - LI s

LS - x

y de aquí pIg1[n, alfa],

s

 = pLS

x - LI s

 = pLI

donde pLS indica la proporcion de la población comprendida entre LS y 0 y pLI indica la proporcion de la población comprendida entre LI y 0 (estrictamente en vez de 0 es -∞, pero asumimos que la variable x sólo toma valores positivos). b) La población será aceptada si se verifica que pLS -pLI = p ≥ P, siendo P la proporción de la población que se considera aceptable. Creamos una sentencia que nos automatice el anterior proceso (para P = 0.95 y alfa = 0.05), donde mean es la media de la muestra x, size su tamaño n , uL le LS, uL el LI y sigma la s de la muestra

Ejemplo Sea x =10.34, s = 1.23, LS = 15.3 , LI = 7.4, n = 30, ¿Es rechazable la muestra para un alfa = 0.05 y un P = 0.95?. La solución aplicando la sentencia anterior es que con dicha muestra podriamos aceptar la población p1[10.34, 1.23, 30, 0.05, 0.95, 15.3, 7.4] // Quiet {{0.962583}, True}

14

ControlCalidad.nb

ControlCalidad.nb

15

Criterios para determinar si fijado alfa, el tamaño muestral y el valor de K que porcentaje de la poblacion está dentro del intervalo de tolerancia Tomamos una muestra de tamaño 30, y fijamos un nivel de confianza alga = 0.05. Aplicando un K unilateral concreto queremos saber aplicando ese K que porcentaje de la población quedaria dentro del intervalo: como ejemplo tomamos K = {2, 2.2, 2.12} Transpose[{{2, 2.2, 2.12}, Flatten[P /. Map[Solve[g1[30, 0.05, P] ⩵ #, P, Reals] &, {2, 2.2, 2.12}]]}] // Quiet {{2, 0.929747}, {2.2, 0.949279}, {2.12, 0.942074}}

Dato el tamaño muestral, el nivel de confianza y la fraccion defectuosa calcular el tamaño muestral para un muestreo simple con cero rechazos El problema mas frecuente en muestreo es determinar el tamaño de la muestra y el número de uds. no conformes en la muestra. Vamos a describir como realizarlo en el caso de muestreos simples. Sea una población de tamaño N, del que desconocemos el número de uds defectuosas. La probabilidad Pa de que haya r o menos defectuosas nos viene dada por la distribución hipergeométrica. r

Pa =  x=0

D x

N-D n-x N n

donde D

Número de piezas defectuosas en el lote (desconocidas).

f

Fraccion de uds defectuosas: f = D / N, f es desconocida, se toma como valor la fracción

16

ControlCalidad.nb

máxima, pA , de la población que admitiriamos que este formada por uds fuera de los límites de tolerancia. = nivel de significación (Probabilidad de cometer un error de tipo I que estamos dispuesto a

α

asumir). = tamaño muestral

n

En el caso particular de que el criterio de aceptación sea c = 0

Pa =

(1 - f ) N n N n

Ejemplo : Calcular la probabilidad de que en una muestra de tamaño 258 procedente de una población de 1000 uds con un 1% de defectuosas aparezca una muestra defectuosa ProbAlfa[1000, 258, 0.01] 0.0497958

Fijado Pa podemos calcular el tamaño muestral n. Este calculo es realizado por la función sizeSample Ejemplo : Queremos calcular el tamaño muestral para una población que tiene 1000 unidades en la que admitimos una fracción máxima de unidades defectuosas del 1%, con un nivel de significación de 0.05 sizeSample[100, 0.05, 0.01] 95 sizeSample[50, 0.05, 0.01] N debe ser 100 o mayor

Programa usado en webMathematica En el siguiente ejemplo se cácula el tamaño muestral para poblaciones de distinto tamaño:N: {100, 200,500, 1000, 2000} (N debe ser 100 o mayor) fijado un nivel de confianza alfa = 0.05 y suponiendo que hay una fracción f= 0.01 de defectuosas. El resultado da el tamaño de la muestra en cada uno de los casos, para que sea aceptable tomada ese muestra ninguna de las unidades deberia ser defectuosa. TableForm[{ {100, 200, 500, 1000, 2000}, Map[sizeSample[#, 0.05, 0.01] &, {100, 200, 500, 1000, 2000}]}] 100 95

200 155

500 225

1000 258

2000 277

ControlCalidad.nb

17

18

ControlCalidad.nb

Intervalos de confianza para la varianza El paquete