Story Transcript
Universidad de Puerto Rico Recinto de Aguadilla Programa CeCiMat Elemental Definición de conceptos fundamentales de la Estadística y la Probabilidad y su aportación al mundo moderno Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental 1
Estadística Definición:
ciencia que colecta, organiza, presenta e interpreta datos. Se divide en dos ramas; ◦ Estadística Descriptiva: recopila, organiza y presenta datos. ◦ Estadística Inferencial: se refiere a las técnicas de interpretación de datos.
Términos Básicos Población:
conjunto de individuos u objetos cuyas características van a ser estudiadas.
Muestra: Variable
subconjunto de la población.
(respuesta): característica de interés de la población o muestra.
Términos Básicos
Dato: valor numérico de la variable respuesta asociado a un elemento de la población o muestra.
Datos: conjunto de valores colectados de una variable respuesta de cada elemento de la población o muestra.
Experimento (encuesta): actividad planificada cuyos resultados producen un conjunto de datos.
Términos Básicos
Parámetro: característica numérica de toda la población.
Estadística: característica numérica de la muestra.
Censo: estudio a toda la población.
Términos Básicos Datos
cualitativos: es el resultado del proceso de categorizar o describir un elemento de la población. ◦ Ejemplos: El color de los carros en un estacionamiento. Color del cabello de las chicas en un grupo de séptimo grado.
Términos Básicos Datos
cuantitativos: es el resultado del proceso de cuantificar, esto es, contar o medir. Se divide en discreta y continua. ◦ Discreta: resultado del proceso de contar. Ejemplo: cantidad de maestros en el taller.
◦ Continua: resultado del proceso de medir. Ejemplo: edad promedio de los maestros en el taller.
Tipos de Variables
Variable cualitativa, de atributos o categórica: ◦ Variable que clasifica o describe un elemento de la población. Nominal: es imposible asignar un orden a las categorías. Ordinal: presenta una posición o clasificación ordenada, pero no tiene diferencia numérica.
8
Tipos de Variables: ejemplos
Nominal: ◦ Números de seguro social. ◦ Números de identificación de los estudiantes universitarios.
Ordinal: ◦ Clasificación de excelente, bueno, regular o deficiente de una cita. ◦ Obtener A, B, C, D, o F en un curso.
9
Tipos de Variables Variable
cuantitativa o numérica:
◦ Variable que cuantifica un elemento de la población. Discreta: puede asumir un número contable de valores. Continua: puede asumir un número incontable de valores. 10
Tipos de Variables Variable cuantitativa o numérica: De intervalo: al igual que la ordinal, presenta una posición o clasificación ordenada. Lo diferente es que sí establece una diferencia numérica. No tiene un cero natural. De razón: similar a la de intervalo, con la diferencia que posee un cero natural.
11
Tipos de Variables: ejemplos
Discreta: ◦ Cantidad de maestros tomando el taller.
Continua: ◦ Peso de una barra de chocolate.
Intervalo: ◦ Temperatura del salón.
Razón: ◦ Precio de los libros de textos. 12
Cuestionarios
¿A qué escuela asistió usted?
Características: de las preguntas ◦ Preguntas no pueden ser ambiguas. ◦ Fáciles de contestar. ◦ No preguntar sobre asuntos íntimos y/o personales. ◦ No deben permitir que el encuestado tenga que escribir mucho.
Cuestionarios
Características: del cuestionario ◦ Título claro y de fácil comprensión. ◦ Propósito fácil de entender.
Administración del cuestionario ◦ Por teléfono: poco aceptado. ◦ Por correo: no muchos contestan. ◦ De persona a persona: forma más eficiente.
Ejercicio de práctica
Se puede trabajar en forma individual o en pareja: ◦ ◦ ◦ ◦ ◦
Escoger un tema. Determinar la población. Determinar la muestra. Identificar la o las variables. Redactar tres posibles preguntas sobre el tema.
Cada maestro o equipo presentará su trabajo para ser analizado por todos.
Medidas de Tendencia Central
Valores numéricos que localizan, de alguna manera, el centro de un conjunto de datos.
Generalmente el término promedio se asocia con todas las medidas de tendencia central. ◦ Media aritmética ◦ Mediana
◦ Moda
16
Medidas de Tendencia Central
Media aritmética: promedio más conocido. Se denota con X . Se calcula sumando todos los valores y dividiendo el resultado por el total de valores. sumatoria
Notación:
X
x n
suma de los datos total de datos 17
Media Aritmética
En una clase de Estadística, un estudiante obtuvo las siguientes notas en los primeros 5 exámenes:
89, 77, 92, 85 y 82. Determine la nota del estudiante hasta el momento. ¿Cuánto deberá obtener en un próximo examen para mantener su promedio igual? ¿Qué nota debería obtener en un examen final para finalizar con promedio de A?
18
Medidas de Tendencia Central
Mediana: es el valor del dato que se encuentra en el centro de una distribución. Se denota por X.
Para determinar la mediana se tienen que colocar los datos en orden ascendente.
La posición de la mediana se determina por la 1 . fórmula n
2 19
Mediana
Ejemplo: determine la mediana de los datos siguientes;
23,12, 9, 56, 34, 48 y 17
Mediana es 23
Si se le añade el valor 24 a los datos anteriores, ¿cuál será la mediana ahora? Mediana es 23.5
20
Medidas de Tendencia Central
Moda: el valor que más se repite. La distribución puede: ◦ No tener moda. ◦ Tener una moda.
◦ Ser bimodal (dos modas). ◦ Trimodal (tres modas).
◦ Multimodal (más de tres modas).
21
Moda
Dadas las siguientes distribuciones determine la moda de cada una de ellas:
23, 33,15, 56, 24, 87 23, 33,15, 56, 24, 87,15 23, 33,15, 56, 24, 87,15, 23 22
Medidas de Tendencia Central
Dada la siguiente tabla determine la media aritmética, la mediana y la moda.
24
56
67
12
9
45
24
45
12
9
56
67
82
91
14
14
54
91
82
54 23
Gráficas
Es la forma más efectiva para ayudar en la lectura de los datos.
Para cada tipo de variable se aplica un tipo de gráfica.
Revelan, en forma visual, patrones y comportamiento de la variable en estudio.
24
Variable Categórica
Diagrama de Pastel: muestran la cantidad de datos que pertenecen a cada categoría como una parte proporcional de un círculo.
Gráfica de Barras: muestran la cantidad de datos que pertenecen a cada categoría como áreas rectangulares de tamaño proporcional.
25
Operaciones en el Hospital General el año pasado Tipo de operación
Número de casos
Toráxica Huesos y articulaciones Ojos, oídos y garganta General Abdominal Urológicas Proctológicas Neurológicas Total
20 45 58 98 115 74 65 23 498 26
Operaciones en el Hospital General el año pasado Toráxica Huesos y articulaciones Ojos, oídos y garganta General Abdominal Urológicas Proctológicas Neurológicas
27
Operaciones en el Hospital General el año pasado 140
120 C a n t i d a d
o 100 p e r 80 a c i 60 o n d e 40 e s 20
0 Toráxica
Huesos y articulaciones
Ojos, oídos y garganta
General
Abdominal
Urológicas
Proctológicas
Neurológicas
28
Variable Numérica
Diagrama de Tallo y Hoja: presenta los datos usando los dígitos que corresponden a los valores de los datos.
Diagrama de Caja: presenta el resumen de 5 números: valor mínimo, cuartil uno, mediana, cuartil tres y el valor máximo.
Histograma: gráfica de barras que representa una distribución de frecuencias de una variable. 29
Calificaciones de 19 estudiantes en un examen
De un grupo se extrajo aleatoriamente una muestra de 19 calificaciones de un examen:
76 74 82 96 66 76 78 72 86 84 62 76 78 92 82 74
52 68 88
30
Calificaciones de 19 estudiantes en un examen Tallo 5 6 7 8 9
Hojas
2 6 6 2 6
8 4 6 2
2 6 4
8 2
2 8
6
8
4
31
Calificaciones de 19 estudiantes en un examen Tallo (50 -54) (55-59) (60-64) (65-69) (70-74) (75-79) (80-84) (85-89) (90-94) (95-99)
Hojas 5 5 6 6 7 7 8 8 9 9
2 2 6
8
4 6 2
2 6 4
6 2 6
8
4 8 2
6
8
32
Cuartiles: Qk
Dividen los datos en cuatro partes iguales.
Cómo se obtienen: ◦ Se obtienen a través de los Percentiles. ◦ Colocar los datos en orden ascendente. ◦ Si k < 50 la posición se obtiene con ◦ Si k > 50 la posición se obtiene con
nk 100
.
n 100 k 100
. 33
Cuartiles: Qk
Cómo se obtienen: ◦ Si la posición da a un número entero se usa el promedio de esa posición y la siguiente.
◦ Si el resultado es un número decimal se usa la posición siguiente. ◦ Si k < 50: posiciones de menor a mayor. ◦ Si k > 50: posiciones de mayor a menor.
34
Diagrama de Caja Valor Mín 0
0
Q1 86.5
100
Med. 170
Valor Máx 491
Q3 251.5
200
300
400
500
35
Notas de un examen Intervalos de Notas 40 – 49 50 – 59 60 – 69 70 – 79 80 – 89 90 – 99 100 – 109
Frecuencia 8 44 23 6 98 11 1 36
Histograma: notas de un examen 100 90 80 70 60 50 40 30 20 10
F R E C U E N C I A S
0 40-49 50-59 60-69 70-79 80-89 90-99 100-109
INTERVALOS
37
Ejercicios de Práctica Obtener cuartiles y percentiles. Dibujar :
◦ Diagrama de pastel. ◦ Gráfica de barras. ◦ Diagrama de tallo y hoja. ◦ Diagrama de caja. ◦ Histograma. 38
Medidas de dispersión Se
utilizan para determinar cuánto se alejan los valores del centro de la distribución. ◦ Rango ◦ Varianza
◦ Desviación estándar
Rango
Se obtiene restando el valor menor del valor mayor de la distribución.
Indica cuantas unidades de diferencia se pueden esperar, como máximo, entre dos valores de la variable.
El rango estima el campo de variación de la variable.
Varianza:
s
2
Medida de dispersión que ostenta una variable aleatoria respecto a su esperanza.
Pasos para calcular la varianza:
◦ Calcular la media aritmética. ◦ Restar la media aritmética a cada dato de la distribución y elevar el resultado al cuadrado. ◦ Sumar los resultados del paso dos y dividir por el total de datos menos uno.
Varianza: Fórmula
s
2
s
2
para determinar la varianza;
x x n 1
2
Varianza:
s
2
Ejemplo:
determinar la varianza de las edades de 5 niños. Edades
x x
x x
6 3 8 5 2
Determinar
la media aritmética.
2
x
x
n Edades
s
2
24 5
4.8
x x
x x
6
1.2
1.44
3
–1.8
3.24
8
3.2
10.24
5
0,2
0.04
2
–2.8
7.84
x x n 1
2
22.80 4
5.7
2
Desviación Estándar
Es la medida más útil de la variabilidad de los resultados de una muestra.
Es una medida de la magnitud en que se desvían los datos de su valor medio.
Si las puntuaciones se agrupan en torno a la media, la DE será relativamente pequeña; si se extienden en todas direcciones, la DE será relativamente grande.
Desviación Estándar La
desviación estándar es la raíz cuadrada de la varianza.
s
s
s
x
2
s
x
n 1 2
5.7
2.4
2