LOGO
Fundamentos Básicos de Estadística I Prof. Mariugenia Rincón
[email protected]
Definiciones
Estadistica. Objetivo e Importancia
Clasificación: Descriptiva e Inferencial
Población y Muestra
Unidad Estadistica. Datos Estadisticos
Variable estadística: Tipos Escalas de Medición
Definiciones Estadística: Es una ciencia que aplica el método científico en la recolección, organización, análisis e interpretación de los datos numéricos con el fin de tomar decisiones racionales. Objetivo: Describir los datos; ya sea por medio de medidas (estimadores), gráficos o tablas en las que se puedan apreciar claramente el comportamiento y las tendencias de la información recopilada. Importancia: Al analizar los datos de experimentos los ingenieros aprenden cómo diseñar nuevos productos y procesos importantes, para lo que se necesita de cierto conocimiento estadístico porque éstos permiten diseñar experimentos válidos y obtener conclusiones confliables a partir de los datos obtenidos.
Definiciones Estadística Descriptiva: Su finalidad es agrupar y representar la información de forma ordenada, de tal manera que permita identificar rápidamente aspectos característicos del comportamiento de los datos. Se refiere a cualquier tratamiento de datos diseñados para resumir o describir algunas de sus características más importantes, sin intentar deducir nada que escape al alcance de los datos.
Clasificación
Estadística Inferencial: Busca dar explicación al comportamiento o hallar conclusiones de un amplio grupo de individuos (población), objetos o sucesos a través del análisis de una pequeña fracción de sus componentes (muestra).
Definiciones Población Estadística: Representa la colección completa de elementos o resultados de la información buscada; es el grupo bajo investigación. Es una agrupación de todos los elementos individuales de un tipo específico de interés. Es el conjunto de todos los sucesos susceptibles de aparecer en un problema o investigación y que interesan a la persona que hace el estudio. Las poblaciones pueden ser finitas o infinitas de acuerdo si se conoce el total de los elementos que la componen o no.
Población
Muestra
Muestra: Es un subconjunto de la población, que contiene elementos o resultados que realmente se observan. Es una porción o parte de la población estudiada. Es un subconjunto de mediciones seleccionadas de la población.
Definiciones Unidad Estadística: Corresponde a la entidad mayor o representativa de lo que va a ser objeto específico de estudio en una medición, y se refiere al qué o quién es objeto de interés en una investigación. Datos Estadísticos: Son números que pueden ser comparados, analizados e interpretados, de esta forma el campo del cual son tomados los datos estadísticos se identifican como población o universo. Métodos de Recolección de Datos: Es el medio a través del cual el investigador se relaciona con los participantes o elementos para obtener la información necesaria que le permita lograr los objetivos de la investigación. Para recolectar la información hay que tener presente: Seleccionar un instrumento de medición el cual debe ser valido y confiable para poder aceptar los resultados Aplicar dicho instrumento de medición Organizar las mediciones obtenidas, para poder analizarlos Los métodos más usados son la observación y la encuesta.
Variable Estadística Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población.
Cualitativa
Nominal
Cuantitativa Discreta
Ej. El estado civil
Ej. Numero de hijos
Ordinal
Continua
Ej. Orden de llegada
Ej. Estura de los hijos
Escalas de medición Son variables numéricas cuyos valores representan una categoría o identifican un grupo de pertenencia. Este tipo de variables sólo nos permite establecer relaciones de igualdad/desigualdad entre los elementos de la variable. La asignación de los valores se realiza en forma aleatoria por lo que NO cuenta con un orden lógico
Nominal Las variables de razón poseen las mismas características de las variables de intervalo, con la diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia total de medida, por lo que se puede realizar cualquier operación Aritmética (Suma, Resta, Multiplicación y División) y Lógica (Comparación y ordenamiento).
Razón
Ordinal
Escalas Intervalo
Son variables numéricas cuyos valores representan una categoría o identifican un grupo de pertenencia contando con un orden lógico. Este tipo de variables nos permite establecer relaciones de igualdad/desigualdad y a su vez, podemos identificar si una categoría es mayor o menor que otra
Son variables numéricas cuyos valores representan magnitudes y la distancia entre los números de su escala es igual. Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad, establecer un orden dentro de sus valores y medir la distancia existente entre cada valor de la escala. Las variables de intervalo carecen de un cero absoluto, por lo que operaciones como la multiplicación y la división no son realizables
Ejemplos de Escalas
NOMINAL Escala: Variable: Profesión
Ingeniero Licenciado
Médico Abogado
ORDINAL Escala: Variable: Grado de Instrucción
Primaria Superior
Secundaria Post superior
Ejemplos de Escalas
DISCRETA Variable: Materias Inscritas
Escala:
3
4
5
6
CONTINUA Variable: Peso (gr.)
Escala: 60,2
75,4
76,8
83,5
Métodos
Observación
Encuesta
-Observación directa, -Lista de verificación.
-Entrevista -Cuestionario
Ejercicios 1.- Clasifique las siguientes variables como cualitativas o cuantitativas: a) Comida Favorita b) Profesión c) Goles marcados d) Género e) Nivel de Educación f) Lugar en una competencia g) Temperatura h) Número de trabajadores en una empresa i) Unidades producidas j) Kilowatt-hora consumidos
2.- Clasifique las siguientes variables como ordinal, nominal, discreta o continua: a) Temperaturas medidas en un laboratorio cada media hora b) Número de miembros que integran la unidad familiar c) Ingresos anuales d) Llamadas que llegan a la central telefónica e) Vida media de los tubos de televisión producidos por una fábrica f) Período de duración de un automóvil g) La nacionalidad de una persona h) Condición social de un entrevistado i) Grado de participación de los estudiantes en cursos j) Salario
Análisis de Datos
Distribución de Frecuencias
Representaciones Gráficas
Medidas de Posición
Medidas de Dispersión o Variabilidad
Es una ordenación de datos que muestra la ocurrencia de valores, cuyo objeto es condensar los datos sin perder los detalles esenciales. Esta tabla contiene la clase o categoría de los datos, la frecuencia absoluta, frecuencia relativa, frecuencia absoluta acumulada y frecuencia relativa acumulada. Para aquellos casos donde exista un gran número de categorías se agrupan los datos por intervalos (datos agrupados), si existen pocas categorías se describen los datos de forma no agrupada.
Frecuencia absoluta (ni) Es el número de veces que aparece repetido cada valor de la variable (categoría). Frecuencia relativa (fi) Es el cociente ni/N; siendo N el total de las observaciones. Este cociente indica la proporción que representan los datos de una categoría o clase determinada, en relación al total de los datos (N). Frecuencia absoluta acumulada (Ni) Se obtiene sumando las frecuencia absolutas precedentes a cada clase o categoría. Frecuencia relativa acumulada (Fi) Es el cociente Ni/N; representa la proporción de datos ubicados en el extremo interior de la distribución y un valor superior. Clase o Categoría (Xi) Representan los valores diferentes de la variable, dentro de las observaciones.
Ejercicio #1 (DATOS AGRUPADOS) Se desea estudiar el diámetro interno de las arandelas que se producen con un determinado proceso de fabricación, los siguientes datos representan el diámetro interno en mm de 16 arandelas tomadas de una muestra aleatoria; construya una tabla de distribución de frecuencia para describir los datos.
18 19 20 19
20 24 20 21
21 18 20 22
Tabla de Distribución de Frecuencia Xi (Clase o Categoría)
ni
18 19 20 21 22 24 N
fi 2 6 4 2 1 1 16
0,125 0,375 0,25 0,125 0,063 0,063 1
~ % ~ ~ ~ ~ ~ ~ ~
12,5 37,5 25 12,5 6,25 6,25 100
Ni
Fi ~ % 2 8 12 14 15 16
0,125 0,5 0,75 0,875 0,9375 1
~ 12,5 ~ 50 ~ 75 ~ 87,5 ~ 93,75 ~ 100
19 19 19 19
Tratamiento de datos por intervalos (DATOS AGRUPADOS) Se utiliza para aquellos casos donde existe una gran variedad de categorías o clases para la variable en estudio, por lo que se hace necesario agrupar los datos por intervalos del mismo tamaño (amplitud). Notación: Xi: punto medio LI: Límite inferior del intervalo LS: Límite superior del intervalo ni: Frecuencia absoluta (número de datos que están dentro del intervalo) A: amplitud m: número de intervalos li: límite inferior de todas las observaciones ls: límite superior de todas las observaciones
FÓRMULAS:
A= ls - li m
Xi= LS + LI 2
Ejercicio #2 (DATOS AGRUPADOS POR INTERVALOS) Parte de un estudio de control de calidad tuvo como objetivo mejorar una línea de producción, para lo cual se midieron los pesos en onzas de 50 barras de jabón, obteniéndose los siguientes resultados. Construya una tabla de distribución de frecuencias agrupando los datos en 5 intervalos. 11,6 12,6 12,7 13,1 12,8 13,3 13,6 13,7 13,8 14,1 14,3 15,8 16,5 17,7
14,3 14,6 15,1 14,8 15,2 15,9 15,9 16,2 16,1 16,2 16,6 17 17,3 17,1 17,3 18,1 18,3 18,3 18,3 18,5
15,6 16,3 17,4 18,5
15,6 16,4 17,4 18,8
Tabla de Distribución de Frecuencia
Intervalos 11,6 - 13,3 13,4 - 15,1 15,2 - 16,9 17,0 - 18,7 18,8 - 20,5
Xi ni fi ~ % Ni Fi ~ % 12,45 6 0,12 ~ 12,00 6 0,12 ~ 12 14,25 9 0,18 ~ 18,00 15 0,3 ~ 30 16,05 17 0,34 ~ 34,00 32 0,64 ~ 64 17,85 15 0,30 ~ 30,00 47 0,94 ~ 94 19,65 3 0,06 ~ 6,00 50 1 ~ 100 N 50 1 ~ 100
Intervalo Real 11,55 - 13,35 13,35 - 15,15 15,15 - 16,95 16,95 - 18,75 18,75 - 20,55
15,7 16,5 17,4 19,2
15,8 16,5 17,6 20,3