Capítulo 2: PRINCIPALES ESTADÍSTICOS RESISTENTES

Capítulo 2: PRINCIPALES ESTADÍSTICOS RESISTENTES. 1991 · 35 EL ENFOQUE DEL ANÁLISIS EXPLORATORIO DE DATOS. 36 · Hector Monterde i Bort - Manue

14 downloads 49 Views 448KB Size

Recommend Stories


2 Principales causas de mortalidad
indice MORTALIDAD Y MORBILIDAD / MORTALIDAD mundial de mortalidad. Defunciones 1 Tasa anuales por 1.000 habitantes 1970 1998 África subsahariana 2

26. TRATAMIENTO DE LAS INFECCIONES OSTEOARTICULARES RESISTENTES
Criterios, acordados por el Consejo Interterritorial, que deben cumplir los CSUR para ser designados como de referencia del Sistema Nacional de Salud

Control de malezas resistentes en Argen na
Instituto Nacional de Tecnología Agropecuaria 74 Marzo 2013 Control de malezas resistentes en Argen na Guía de limpieza de la cosechadora para elim

Story Transcript

Capítulo

2:

PRINCIPALES ESTADÍSTICOS RESISTENTES.

1991

· 35

EL ENFOQUE DEL ANÁLISIS EXPLORATORIO DE DATOS.

36 ·

Hector Monterde i Bort - Manuel Perea Lara.

Cap. 2: PRINCIPALES ESTADÍSTICOS RESISTENTES.

2.1.- INTRODUCCIÓN: CUARTILES E INTERCUARTIL.

MEDIANA, INTERVALO

La Mediana, los Cuartiles, y por extensión los Percentiles, son cuantiles (puntos en una escala numérica que dividen al conjunto de valores obtenidos en subconjuntos de proporciones establecidas) o índices de posición basados en el cálculo de frecuencias de las clases de un conjunto de datos ordenado o distribución, y por ello 1 resistentes, en cierta medida, al efecto de las puntuaciones extremas. Sobre estos índices se desarrollan muchos de los estadísticos resistentes que veremos. Por ello, los conceptos y propiedades con ellos relacionados deben estar suficientemente claros para abordar el estudio de este enfoque de tratamiento estadístico.

Dado un conjunto valores obtenidos de una variable, a los que nos referiremos como datos estadísticos: El término Mediana se utiliza para referir a aquel valor que divide la distribución, de dichos datos ordenados de menor a mayor o de mayor a menor, en dos subconjuntos de igual número. Es decir, es aquel valor tal que por debajo y por encima de él se encuentra el mismo número de casos, datos o frecuencias, el 50%. El término Cuartiles se utiliza para referir a aquellos tres valores, de un conjunto de datos, que dividen la distribución, de dichos datos ordenados de menor a mayor, en cuatro partes iguales, conteniendo cada una el 25% de los casos, datos o frecuencias. Son designados con un subíndice, 1, 2 o 3, según la posición de orden que ocupan en la distribución, así, el Cuartil1 (C1 2 ) referiría al valor que dejara por encima el 75% de los valores o datos obtenidos de la variable en cuestión, el Cuartil2 (C2) al que dejara por encima al 50% (que 1 Al no tener en cuenta las puntuaciones en sí sino el orden de las mismas. 2 Q en la literatura anglosajona. 1

1991

· 37

EL ENFOQUE DEL ANÁLISIS EXPLORATORIO DE DATOS.

coincidiría con la Mediana), y el Cuartil3 (C3) al que dejara por encima al 25% de los valores obtenidos. El término Percentiles se utiliza para referir a aquellos valores que corresponden a los diferentes porcentajes en que se puede dividir la distribución de los valores obtenidos de una variable. Normalmente cien, designados por un subíndice (vg., P33) que indica el porcentaje de casos, datos o frecuencias que dejan igual o por debajo. Algunos autores definen a los Percentiles como aquellos valores o puntos que dividen la distribución (ordenada) en cien partes iguales, bajo esta definición, dichos valores no podrían ser más de 99. Sin embargo, hay incluso algún autor que admite fracciones de unidad, por lo que bajo esta consideración el número de Percentiles existente en una distribución, especialmente si se trata de una variable cuantitativa continua, podría ser infinito... Otros términos, como Deciles, Quintiles, etc., son también utilizados para referir particiones equivalentes o porcentajes concretos acumulados en la distribución de valores ordenados obtenidos en una variable, pero su comentario rebasa los objetivos de este apartado.

Conviene advertir que los procedimientos más desarrollados de cálculo, para la obtención de estos índices, en la medida que suponen interpolación 3 , son, y algunos autores así lo consideran expresa o tácitamente, idóneamente aplicables sobre variables cuantitativas continuas. Sin embargo es frecuente en la practica profesional, y en general en la Psicología aplicada, aplicar estos procedimientos sobre variables cuantitativas discretas e incluso cuasi-cuantitativas, concretamente sobre variables ordinales, práctica que aunque podría no ser ortodoxa da razón de la utilidad que estos índices de posición tienen también en el estudio y manipulación de dichas variables, destacando la característica de que aunque estos índices se deben calcular sobre el conjunto de datos o valores obtenidos de una variable, los valores que asumen pueden no coincidir con alguno de los valores obtenidos u observados. En este sentido, es necesario aclarar que estos índices, aunque no algunos procedimientos para 3

38 ·

Colocar entre dos valores conocidos otros que se calculan con sujeción a ciertas reglas.

Hector Monterde i Bort - Manuel Perea Lara.

Cap. 2: PRINCIPALES ESTADÍSTICOS RESISTENTES.

su cálculo, por definición son perfecta y lícitamente aplicables sobre variables ordinales y, por extensión, sobre cuantitativas discretas. En rigor, el Percentil ρ (ó Pρ) es todo punto m tal que probabilidad de escoger aleatoriamente un dato a la izquierda ρ m (es decir, menor que m ) es de 100 , y la probabilidad escoger un dato a la derecha (es decir, mayor que m ) es 100-ρ 100 .

la de de de

Sin embargo, para diversas distribuciones de datos de carácter discreto (variables cuasi-cuantitativas o cuantitativas discretas) no existen unos puntos tales que la probabilidad 100-ρ ρ total se divida exactamente en 100 y 100 . Piénsese en el Percentil 50 (P50) de la serie discreta: 2, 9, 20; en la cual la probabilidad 50/100=1/2=0'5 no se puede aplicar para dividir el conjunto de datos en dos partes exactas 4 . Por ello, los matemáticos recurren a la siguiente reformulación: El Pρ

se define como un punto m ρ P(X= 100

y

tal que la: P(X>=m ) >=

100-ρ 100

Con esta definición, toda distribución siempre tendrá un punto m que satisfaga el Pρ. Es más, diversas distribuciones podrán tener varios puntos m que satisfagan tal definición. Por ejemplo, sea la variable discreta X con valores: 1, 2, 2, 3, 3, 3, 4, 4 y 4. El valor 3 es una mediana de la ^, que es mayor que 1/2, distribución, ya que P(XDPs) significará que la distribución obtenida es Leptocúrtica (tiene colas más gruesas en los extremos de lo que las tendría si fuera "normal"). II) Si la Desviación Típica, de los datos obtenidos, es menor que la Desviación Pseudotípica (S

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.