Significado de la media y desviación estándar poblacional

REV. OBSTET. GINECOL. - HOSP. SANTIAGO ORIENTE DR. LUIS TISNÉ BROUSSE 2015; VOL 10 (1): 17-21 ARTÍCULO DE REVISIÓN Significado de la media y desviac

3 downloads 66 Views 172KB Size

Story Transcript

REV. OBSTET. GINECOL. - HOSP. SANTIAGO ORIENTE DR. LUIS TISNÉ BROUSSE 2015; VOL 10 (1): 17-21

ARTÍCULO DE REVISIÓN

Significado de la media y desviación estándar poblacional Sócrates Aedo M1, Gabriel Cavada Ch2, Gabriel Aedo I3.

RESUMEN La media poblacional (μ) es un número creado, no necesariamente observado, que establece un valor al cual todos los valores de una variable cuantitativa se encuentran a una mínima distancia; siendo la desviación estándar poblacional (σ) el valor promedio de todas las observaciones a μ. Se realiza una demostración matemática a fin de obtener fórmulas para cálculo de μ y σ. Palabras claves: Media, desviación estándar poblacional.

ABSTRACT The population mean (μ) is a created number, not necessarily observed, that provides a value to which all values of a quantitative variable are at a distance minimal; while population standard deviation (σ) is the average value of all observations to μ. It is performed mathematical demonstration for obtain fórmulas calculating for μ and σ. Key words: Mean, standard deviation population.

1 2 3

Departamento de Obstetricia y Ginecología Campus Oriente de Peñalolén. Facultad de Medicina, Universidad de Chile. Escuela de Salud Pública. División Bioestadística, Universidad de Chile. Alumno Medicina. Facultad de Medicina, Universidad de Chile.

Correspondencia: Sócrates Aedo M. Cabo Segundo Julio Pavez Ortiz 5671, Peñalolén, Santiago. Chile. E mail: [email protected].

17 Disponible en www.revistaobgin.cl

REV. OBSTET. GINECOL. - HOSP. SANTIAGO ORIENTE DR. LUIS TISNÉ BROUSSE 2015; VOL 10 (1): 17-21

MEDIA Y DESVIACIÓN ESTÁNDAR EN VARIABLES NUMÉRICAS Desde muy pequeños nos enseñaron el teorema de Pitágoras, que establecía que para todo triángulo rectángulo la suma de sus catetos al cuadrado resultaba en la hipotenusa al cuadrado, lo que se observa en la Figura 11. Supongamos, que tenemos 2 puntos en el espacio de 2 planos, digamos los puntos “1” y P, lo que podríamos graficar en Figura 2. Para obtener la distancia (d) del punto “1” (coordenadas X1 e Y1) al punto “P” (coordenadas XP e YP), podríamos ocupar el teorema de Pitágoras con lo cual dicha distancia cuadrática sería: d2 = (Xp – X1)2 + (Yp – Y1)2 Si a esta distancia le sacamos la raíz cuadrada obtenemos, la distancia d que buscamos: d = √(Xp – X1)2 + (Yp – Y1)2 Supongamos ahora que el interés es sumar las distancias de los puntos “1” a “P” (d1) y “2” a “P” (d2), de acuerdo a Figura 3. Y utilizando nuevamente el teorema de Pitágoras obtenemos la distancia cuadrática d1 y d2: d 12 = (X1 – Xp)2 + (Y1 – Yp)2 d 22 = (X2 – Xp)2 + (Y2 – Yp)2 Si sumamos ambas distancias cuadráticas (d1+d2) obtenemos: d2 = d 12 + d 22 = (X1 – Xp)2 + (Y1 – Yp)2 + (X2 – Xp)2 + (Y2 – Yp)2

Generalizando el concepto anterior podemos señalar que la suma distancias cuadráticas a un punto “P” determinado de todos los otros puntos puede escribirse así: 2

2

2

1

2

n

d2 = d + d + ... + d

= (X1 – Xp)2 + (Y1 – Yp)2 + (X2 – Yp)2 + (Y2 – Yp)2 + … + (Xn – Xp)2 + (Yn – Yp)2 Por tanto si deseamos conocer la suma de las distancias de todos los puntos a un punto “P” podemos resumirla como: d = √d 21 + d 22 + … + d 2n =

√ (X1–Xp)2 + (Y1–Yp)2 + (X2–Yp)2 + (Y2–Yp)2 + … + (Xn–Xp)2 + (Yn–Yp)2

Figura 1. Teorema de Pitágoras, la suma de catetos (X e Y) al cuadrado da como resultado la hipotenusa (Z) al cuadrado.

Figura 2. Cálculo distancia entre 2 puntos del espacio en euclidiano en 2 dimensiones.

18 Disponible en www.revistaobgin.cl

SIGNIFICADO DE LA MEDIA Y DESVIACIÓN ESTÁNDAR POBLACIONAL

Supongamos que solo estamos trabajando en un plano, lo que significa que todas las coordenadas “y” son iguales a cero, y por tanto la expresión anterior se reduce a: d = √d 21 + d 22 + … + d 2n =

√(X1 – Xp)2 + (X2 – Xp)2 + … + (Xn – Xp)2

Lo que en forma cuadrática sería: d = d21 + d22 + … + d n2 = (X1 – Xp)2 + (X2 – Xp)2 + … + (Xn – Xp)2 La expresión anterior corresponde a la suma de las distancias cuadráticas de diferentes puntos a un punto denominado “P”, y la idea sería encontrar qué valor tiene que poseer la coordenada “Xp” de este punto, de tal forma de minimizar la distancia de todos los demás puntos a este punto “P”. Para poder calcularlo debemos derivar2 la expresión anterior e igualar a cero y luego despejar la respectiva incógnita “XP”. Pero de donde viene esta idea, para ello observemos la función (Y) = X2, en la Figura 4; para esta función el mínimo valor de “Y” ocurre, cuando “X” es igual a cero. Para poder obtener el mínimo de la función ƒ (y) = Y = X2 además del método gráfico ya señalado; se puede realizar de forma analítica, lo que consistiría en derivar la función e igualarla a cero, lo que presento a continuación: d ƒ (y) d (X2) = = 2x dX dX Lo anterior es la derivada de la función, si la igualamos a cero obtenemos: 2X = 0 => X = 0 Como podemos observar tanto por método gráfico como analítico la función anterior tiene un mínimo y éste es igual a cero. Volvamos ahora sobre nuestra función cuadrática, que en síntesis es igual aunque con más términos que la función X2: d2 = d 21 + d 22 + ... + d 2n = (X1 – XP)2 + (X2 – Xμ)2 + ... + (Xn – Xμ)2 La idea como dijimos anteriormente es determinar un punto XP en que todas las distancias de los diferentes puntos sean las menores posibles, a este punto XP. Para ello, a continuación, en forma analítica, derivamos e igualamos a cero la función señalada y luego despejamos XP.

Figura 3. Cálculo suma de 2 distancias entre puntos 1 y 2 del espacio euclidiano.

Figura 4. Grafica función f(y) = Y = X2, valor mínimo en X=0.

19 Disponible en www.revistaobgin.cl

REV. OBSTET. GINECOL. - HOSP. SANTIAGO ORIENTE DR. LUIS TISNÉ BROUSSE 2015; VOL 10 (1): 17-21

Aquí está la derivada:

d(d2) dXP

= –2 (X1 – Xy) – 2(X2 – Xμ) – ... –2(Xn – XP) = 0

Ahora igualamos a cero –2X1 + 2Xμ – 2X2 + 2XP – 2X3 + 2XP ... –2Xn + 2XP = 0 Despejamos Xp

2nXP = 2(X1 + X2 + X3 + ... + XP)

XP =

X1 + X2 + X3 +... + Xμ = Σni = 1 Xi n n

Pero sorpresa ¿quién es Xp? es aquel punto de todos los puntos de una colección (no necesariamente observado), que ocupa el centro de masas de la colección de puntos; en que la distancia de todos los demás puntos a él es la mínima posible. Y si observamos con detención es el llamado “Promedio” o “Media” poblacional y que se representa por “μ”. La utilidad de este promedio como medida resumen de una variable determinada requiere que dicha variables sea de naturaleza cuantitativa, pues su construcción asume como hemos visto atributos numéricos3,4. Ahora bien supongamos que obtenemos el promedio de la suma de las distancias cuadráticas, lo que sería d2 = d21 + d22 +... + dn2 = (X1 – XP)2 + (X2 – Xp)2 + ... + (Xn – XP)2 n n n La expresión anterior podemos también escribirla como:

σ2 =

Σni = 1 (Xi – x)2 n

Lo que en síntesis representa la varianza (σ2), en otras palabras la varianza es el promedio de las distancias cuadráticas a la media. Si estimamos la raíz cuadrada de la varianza, dejamos de usar unidades cuadráticas y usamos la medida en que observamos la variable. Y así cuando calculamos la raíz cuadrada de la varianza estamos transformando este promedio de distancias cuadráticas a la media a unidades no cuadráticas, denominado a esto desviación estándar. En suma la desviación estándar (σ) es la distancia promedio de una colección de puntos a un punto denominado media. Su representación matemática es: Σn (X – x)2 σ =√ i = 1 ni

APLICACIÓN CONCEPTO MEDIA Y DESVIACIÓN ESTÁNDAR A VARIABLE INDICADORA

ΨΑ : X



En matemáticas, una función indicadora o función característica, es una regla que asigna a un elemento determinado el valor cero en caso de ausencia y uno si está presente para un conjunto determinado5. Formalmente esto se diría como: sea X un conjunto arbitrario pero fijo. Para cada A C X, la función característica de A es la función {0,1} definida por

X∈Α ΨA (X) ={ 10 si si X ∉ Α

Un ejemplo de función indicadora sería la presencia de metrorragia en mujeres posmenopáusicas, según esta regla, a cada mujer posmenopáusica, se asigna el valor 1 cuando está presente; y cero si está ausente. ¿Qué es una proporción sino la suma de ceros y unos dividido por el total de sujetos? Tomemos un ejemplo, tomamos una muestra de 10 mujeres posmenopáusicas y procedemos a determinar la presencia de metrorragia. Así tenemos la Tabla 1 que para el ejemplo anterior decimos que 2 de 10 mujeres presentan metrorragia o sea 0,2% o 20%. En suma lo que estamos estimando es un promedio. Σn X Por tanto la proporción de éxitos (llamémosle éxito a la presencia de metrorragia), sería igual a p = i = 1n i siendo los Xi iguales a 0 ó 1. Σ ni = 1 (Xi – x)2 Ahora reconsideremos la fórmula de la varianza: σ2 = n Si procedemos a hacer un arreglo algebraico tenemos que:

σ2 =

Σ ni = 1 (Xi – x)2 n

20 Disponible en www.revistaobgin.cl

=

Σ ni = 1 (X2i – 2Xi x + x2) n

SIGNIFICADO DE LA MEDIA Y DESVIACIÓN ESTÁNDAR POBLACIONAL

Σni = 1 X2i – Σni = 1 (2Xi x) + Σni = 1 x2 σ = n n n

Tabla 1. Variable indicador, metrorragia en 10 mujeres

2

Σni = 1 X2 – 2 i x Σni = 1 Xi + x2 Σni = 1 1 σ = n n n 2

σ2 =

Σni = 1 X2i x2 n – 2 xx + n n

σ2 =

Σni = 1 X2i – 2 x2 + n

σ2 =

Σni = 1 X2i – x2 n

x2

Mujer

Presencia metrorragia 1 = Sí; 0 = No

1 2 3 4 5 6 7 8 9 10

1 0 1 0 0 0 0 0 0 0

Total

2

Ahora bien sin pensamos que lo si los Xi toman valor 0 ó 1 tenemos que los son Σni = 1 X2i solos los 1 al cuadrado Σni = 1 X21 , lo que es igual 1 (los ceros se eliminan), por tanto esta expresión es igual a Σni = 1 Xi y dado que 2 p = n n tenemos entonces que np = Σ i = 1 Xi . n 2 Σ np i = 1 Xi Si sustituimos las expresiones anteriores tenemos que: σ2 = – x2 = n – p2 = p – p2 n La expresión q = 1 – p corresponde a los fracasos. Para el ejemplo, si p = 20% ó 0,2 eran las aquellas mujeres con metrorragia, en cambio los fracasos son aquellas sin metrorragia o sea q = 1 – p = 1 – 0,2 = 0,8. Si remplazamos q = 1 – p, en la expresión anterior obtenemos que: σ2 = p – p2 = p(1 – p) = pq En suma obtenemos que la varianza cuando se trata de una población constituida por valores cero y unos; su valor corresponde a la multiplicación entre la proporción de éxito y la proporción de fracasos. En suma tenemos entonces que si la varianza para una proporción corresponde a: σ2 = pq, es inmediato que la desviación estándar corresponde a σ = √pq. En síntesis la desviación estándar para una proporción es lo mismo que la desviación estándar para un promedio, pues una proporción es en verdad un promedio de variables indicadoras. En resumen hemos establecido los valores de la media (μ), varianza (σ2) y desviación estándar (σ) poblacionales, o sea medidas que resumen los valores observados para una población.

BIBLIOGRAFÍA 1. BARROSO C, GAVILÁN J. Diversas perspectivas del Teorema de Pitágoras. Epsilon. 2001;50:251-283. Disponible en: http://personal.us.es/rbarroso (Consultado el 1 de octubre de 2014). 2. LARSON R, HOSTETLER R, EDWARDS B. En su: Cálculo I. Octava edición. México, Editorial McGraw-Hill/interamericana, 2006; pp. 95-162. 3. AEDO S. El uso y abuso de la media aritmética (parte 1). Rev Obstet Ginecol Hosp Santiago Oriente Dr. Luis Tisné Brousse 2007; 2(2): 181-2. 4. AEDO S. El uso y abuso de la media aritmética (parte 2). Rev Obstet Ginecol Hosp Santiago Oriente Dr. Luis Tisné Brousse 2007; 2(3): 269-70. 5. ESPINOSA R. Capitulo III Relaciones y funciones. En su: Matemáticas discretas. Primera edición. México, Editorial Alfaomega, 2010; pp. 98-146.

21 Disponible en www.revistaobgin.cl

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.