MG-617-T Modelos para la Toma de Decisiones en honor a Carlos Dreyfus

1 Pontificia Universidad Católica Madre y Maestra Recinto Santo Tomás de Aquino Vice Rectoría de Post Grado MG-617-T Modelos para la Toma de Decisio
Author:  Luz Acosta Rojo

3 downloads 145 Views 4MB Size

Recommend Stories


Modelos de Toma de Decisiones
AACREA CRED, Columbia University Universidad de Miami Proyecto CLIMA Teoría Conductual de la Toma de Decisiones: Cómo se Toman Decisiones y Formulan

para la toma de decisiones*
La argumentación abstracta en Inteligencia Artificial: problemas de interpretación y adecuación de las semánticas 1para la toma de decisiones* Gustavo

Modelos empleados para la Toma de Decisiones en el Cuidado de la Salud
Rev. 10 (1):178-188, REVISTA DE SALUD2008 PÚBLICA · Volumen 10 (1), Febrero 2008 178 salud pública. Modelos empleados para la Toma de Decisiones en e

Pilotaje para la toma de decisiones en el emprendimiento PILOTAJE PARA LA TOMA DE DECISIONES EN EL EMPRENDIMIENTO
Pilotaje para la toma de decisiones en el emprendimiento PILOTAJE  PARA  LA  TOMA  DE   DECISIONES  EN  EL   EMPRENDIMIENTO   Autónom@s en Red Pil

Story Transcript

1

Pontificia Universidad Católica Madre y Maestra Recinto Santo Tomás de Aquino Vice Rectoría de Post Grado

MG-617-T Modelos para la Toma de Decisiones en honor a Carlos Dreyfus

Ing. Rubén Darío Estrella Sánchez, MBA Cavaliere dell’ordine al Merito della Repubblica Italiana Ingeniero de Sistemas (UNIBE), Administrador (PUCMM), Matemático (PUCMM), Teólogo (UNEV) y Maestro (SALOME UREÑA)

[email protected] ; [email protected]

www.atalayadecristo.org SEPTIEMBRE, 2013

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

1

2

 Bibliografía de Modelos Estadísticos. o

WEBSTER, Allen L. Estadística Aplicada a los Negocios y la Economía. McGraw-Hill: Tercera Edición. 2000.

o

LIND Douglas A., MARCHAL William G. and WATHEN Samuel A. Estadística Aplicada a los Negocios y a la Economía. McGraw-Hill. 15ª Edición. 2012.

o

ANDERSON David, SWEENEY Dennis and WILLIAMS Thomas. Estadística para Negocios y Economía. CENGAGE Learning: 11ª Edición. 2012.

o

TRIOLA, Mario F. Estadística. PEARSON Addison Wesley. 11ª Edición. 2013.

o

TRIOLA, Mario F. Estadística. PEARSON Addison Wesley. Décima Edición. 2009.

o

SPIEGEL Murray, SHILLER John and SRINIVASAN R. Alu. Probabilidad y Estadística. Mc Graw Hill. 3ª. Edición – Serie Shaum. 2010.

o

NIEVES Antonio and DOMINGUEZ Federico. Probabilidad y Estadística para Ingeniería un enfoque moderno. Mc Graw Hill. 2010.

o

HERNANDEZ SAMPIERI Roberto, FERNANDEZ COLLADO Carlos and BAPTISTA LUCIO Pilar. Métodos de la Investigación. Mc Graw Hill. Quinta Edición. 2010.

o

GUTIERREZ PULIDO Humberto and DE LA VARA SALAZAR Román. Control Estadístico de Calidad y Seis Sigma 6. Mc Graw Hill. 2004

o

JONSON Robert and KUBY Patricia. Estadística Elemental Lo Esencial. International Thomson Editores, S. A.: Tercera Edición 2004.

o

LIPSCHUTS Seymour and LIPSON Marc. PROBABILIDAD. Mc Graw Hill. Segunda Edición. 2001.

o

MILTON J. Susan and ARNOLD Jesse C. PROBABILIDAD Y ESTADISTICA. Mc Graw Hill. Cuarta Edición. 2004.

o

MONTIEL A. M., RIUS F. And BARON F.J. Elementos Básicos de Estadística Económica y Empresarial. Prentice Hall: 1997.

o

HOPKINS Kenneth, HOPKINS B.R. and GLASS Gene. Estadística Básica para las Ciencias Sociales y del Comportamiento. Prentice Hall: Tercera Edición. 1997.

o

LAPIN Lawrence L. Statistics for Modern Business. The Dryden Press: 1995.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

2

3

Conceptos Generales de Estadística La Estadística: Es una colección de métodos para planear experimentos, obtener datos y luego organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones con base en esos datos. - Se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. - Es el arte y la ciencia de reunir, analizar, presentar e interpretar datos. - Es un cuerpo de métodos y teorías que es aplicado con evidencia numérica, cuando se toman decisiones en presencia o situaciones de incertidumbre.

Estadística Descriptiva: Es el proceso de recopilación, organización y presentación de datos de alguna manera que describa con rapidez y facilidad. - Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. - La estadística descriptiva proporciona herramientas para organizar, simplificar y resumir información básica a partir de un conjunto de datos que de otra forma seria poco manejable. Esta incluye la tabulación, representación y descripción de conjuntos de datos. - La estadística es descriptiva cuando los resultados del análisis estadístico no pretende ir mas allá del conjunto de datos investigados.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

3

4

Estadística Inferencial: Implica la utilización de una muestra para extraer alguna inferencia o conclusión sobre la población correspondiente. - Apoyándose en el calculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones y otras generalizaciones sobre un conjunto mayor de datos. La estadística es inferencial cuando se derivan conclusiones generales para un conjunto de datos más amplio a partir de la información proporcionada por los datos estudiados. Es el proceso de reunir datos obtenidos de una muestra para hacer estimaciones o probar hipótesis acerca de las características de una población.

Estadística Descriptiva Obtener datos o recopilación Organizar y resumir Presentar

Estadística Inferencial Analizar Interpretar Llegar a conclusiones

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

4

5

Uso de la Estadística en: - Mercadeo. - Investigación de mercado. - Encuestas - Combinación de productos y existencias. - Publicidad. - Gerencia de Operaciones. - Pronósticos. - Gestión de Calidad Total (TQM). - Minimización de costos. - Eliminación de desperdicios. - Localización. - Ruta critica. - Productividad. - Simulación. - Teorías de colas. - Finanzas - Análisis financieros. - Economía. - Análisis económicos. - Impuestos y Gastos públicos. - Producción nacional. - Inflación. - Macroeconomía. - Comercio internacional. - Localización o Ubicación de Negocios.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

5

6

Conceptos Elementales de Estadística. Población: Es la colección completa de todos los elementos (puntajes, personas, mediciones, etc.) que se van a estudiar. - Es una colección completa de todas las observaciones de interés para el investigador. Censo: Es la colección de datos de cada elemento de una población. Muestra: Es un subconjunto de elementos extraídos de una población. - Es una porción representativa de la población, que se selecciona para su estudio porque la población es demasiado grande para analizarla en su totalidad. Parámetro: Es una medición numérica que describe alguna característica de una población. - Medida descriptiva de la población completa de observaciones que tienen interés para el investigador. Estadístico: Es una medición numérica que describe alguna característica de una muestra. Variable: Característica de la población que se analiza en el estudio estadístico. - Característica observable de un aspecto discernible en un objeto de estudio que puede adoptar diferentes valores o expresarse en varias categorías.

Clasificación de las variables. Según el modo como se presentan estas características o propiedades las variables se pueden clasificar de esta forma: - Cualitativas o Cuantitativas - Continuas o discontinuos (discretas) - Dependientes o independientes - Explicatorias o externas - Generales, intermedias o empíricas [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

6

7

Variables cualitativas: Son aquellas variables cuyos elementos de variación tienen un carácter cualitativo no susceptible de medición numérica, por ejemplo el sexo de los estudiantes de estadística, el estado civil de los solicitantes de prestamos, preferencia religiosa, etc. Se pueden dividir en diferentes categorías que se distinguen por alguna característica no numérica. Una variable cualitativa se mide por medios no numéricos. Los datos cualitativos emplean la escala de medición nominal o la ordinal y pueden ser no numéricos o numéricos. Si la variable es cualitativa, el análisis estadístico es bastante limitado. Podemos resumir los datos cualitatitativos al contar el número de observaciones en cada categoría cualitativa, o bien, al calcular la proporción de observaciones en cada categoría cualitativa. Variables cuantitativas: Son aquellas cuyas características o propiedades pueden presentarse en diversos grados o intensidad y tienen un carácter numérico, como por ejemplo nivel de ingresos, deserción escolar, las calificaciones que los estudiantes reciben en el examen final, el número de kilómetros que recorren los que asisten a la universidad, etc. Según el número de valores que pueden tomar las variables cuantitativas se distingue variables continuas y discontinuas. Variables continuas: Son las que pueden tomar cualquier valor dentro de un intervalo dado. Por muy próxima que puedan estar dos observaciones, si el instrumento de medida tiene la precisión suficiente siempre puede haber una tercera observación que caiga entre las dos primeras. Los valores de una variable continua proceden en general de mediciones, por ejemplo las cantidades de leche que las vacas producen son datos continuos porque son mediciones que pueden asumir cualquier valor dentro de un intervalo continuo. Se pueden obtener de un número infinito de posibles valores que pueden asociarse a puntos de una escala continua, de tal manera que no haya huecos ni interrupciones.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

7

8

Variables discontinuas o discretas: Son las que pueden tomar valores intermedios entre otros dos valores dados, han de hacerlo siempre con valores enteros, por ejemplo el número de alumnos de una escuela, los socios de una cooperativa, etc. Se obtienen de un número finito de posibles valores o bien de un número de posibles valores que pueden contarse. Sólo puede tomar determinados valores, por lo general números enteros. Puede ser resultado de la enumeración o del conteo. En ninguno de los casos se observaran valores fraccionarios. Consideradas conforme a la posición que une a las variables entre sí, se distingue entre variables dependientes e independientes. Variables dependientes (Y): Reciben este nombre las variables a explicar, o sea, el objeto de la investigación, que se trata de explicar en función de otros elementos. Variables independientes (X): Son las variables explicativas, o sea, los factores o elementos susceptibles de explicar las variables dependientes (en un experimento son las variables que se manipulan).

Variables explicatorias: Son las propiedades que interesan directamente al investigador en términos de su modelo. Variables externas: Son las que están fuera del interés teórico inmediato y que pueden afectar los resultados de la investigación empírica. Variables generales: Se refieren a realidades no inmediatamente medibles. Variables intermedias o intervenientes: Expresan algunos aspectos parciales de las variables generales, pero más concretos y cercanos a la realidad. En algunos casos de análisis de relación causa-efecto, se introducen una o más variables de enlace interpretativo entre las variables dependientes e independientes. Se trata de variables vinculadas funcionalmente a la variable dependiente y a la variable independiente y que producen un efecto en la relación existente entre esas variables. Variables empíricas: Representan aspectos directamente medibles y observables.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

8

9

Clasificación de las Variables según el Nivel de Medición Los datos se reúnen mediante una de las siguientes escala de medición: nominal, ordinal, intervalo y de razón. La escala o nivel de medición permite determinar la cantidad de información que contienen los datos e indica el resumen de los datos y el análisis estadístico más apropiado. La escala para medir una característica tiene implicaciones en la forma de presentar y resumir la información; también determina el método estadístico escogido para analizar los datos.

Nivel de medición nominal: Se caracteriza por datos que consisten exclusivamente en nombres, rótulos o categorías. Los datos no pueden acomodarse según un esquema de ordenamiento. Nombres o clases que se utilizan para organizar los datos en categorías separadas y distintas. La escala de medició para una variable es nominal cuando los datos son etiquetas o nombres que se emplean para identificar un atributo del elemento. Ejemplos: El sexo de los estudiantes de esta clase de estadística. Las bebidas gaseosas refrescantes se pueden clasificar en: Coke, Pepsi, 7-Up o Country Club. La escala de medición es nominal aun cuando los datos son mostrados como valores numéricos. 1. Coke 2. Pepsi 3. 7-Up 4. Country Club El partido político al que pertenecen los miembros de las cámaras de senadores y diputados del país.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

9

10

Los datos evaluados en escala nominal en ocasiones suelen llamarse observacones cualitativas, porque describen una cualidad de la persona o casa estudiada, y observaciones categóricas, si los valores caen en categorías. En general, los datos nominales o cualitativos se describen en términos de porcentajes o proporciones. A menudo se utilizan las tablas de contingencia y las gráficas de barras para mostrar este tipo de información.

Nivel de medición ordinal. La escala de medición para una variable es ordinal si los datos tienen propiedades de datos nominales y el orden de los datos es significativa. Mediciones que jerarquizan los datos en categorías, ordenadas en virtud de un determinado criterio. Implica datos que pueden acomodarse en algún orden, pero no es posible determinar diferencias entre los valores de los datos, o tales diferencias carecen de significado. Los datos para una escala ordinal podrían ser no numéricos o numéricos. Este nivel ordinal proporciona información sobre comparaciones relativas, pero los grados de las diferencias no se pueden usar en cálculos. Ejemplos: Los productos de un determinado almacén pueden ser clasificados como "buenos", "mejores" y "óptimos". Un editor califica algunos manuscritos como "excelentes", otros como "buenos" y algunos como "malos". (No podemos encontrar una diferencia cuantitativa especifica entre "bueno" y "malo"). La Revista Money clasificación las inversiones a partir de los niveles de riesgos "bajo", "alto" y "muy alto".

Nivel de medición de intervalos. La escala de medición para una variable es una escala de intervalo si los datos tienen las propiedades de datos ordinales y el intervalo entre observaciones se expresa [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

10

11

en términos de una unidad fija de medida. numéricos.

Los datos de intervalos siempre son

Es como el nivel ordinal, con la propiedad adicional de que podemos determinar magnitudes de diferencias entre los datos que tienen algún significado. Sin embargo, no hay un punto de partida o cero inherente (natural) en el que la cantidad este totalmente ausente. Mediciones respecto de una escala numérica en la cual el valor del cero es arbitrario, pero la diferencia de valores es importante. La escala Fahrenheit de temperaturas es un ejemplo de escala de intervalos: 70 grados no sólo significan una temperatura mayor que 60 grados, sino que existe la misma diferencia de 10 grados que entre 100 y 90 grados Fahrenheit. Las temperaturas promedian anuales (en grados Celsius) de las capitales de todos los estados de los Estados Unidos. Los años 1000, 2000, 1776 y 1944.

Nivel de medición de proporción o de razón. La Escala de medición para una variable es una escala de razón si los datos tienen todas las propiedades de los datos de intervalos y el cociente de los dos valores es significativa. Variables como distancia, peso, altura y tiempo emplean la escala de razón. Un requisito de esta escala es que pede contener un valor cero que indica que no existe nada para una variable en el punto cero. Mediciones numéricas en las cuales el cero es un valor fijo en cualquier escala y la diferencia de valores es importante. Es el nivel de intervalo modificado para incluir el punto de partida o cero inherente (donde cero indica que nada de la cantidad esta presente). Para los valores de este nivel, tanto las diferencias como las razones tienen significado. De los cuatro niveles de medición, sólo la escala de proporción o de razón se basa en un sistema numérico en el cual el cero tiene sentido. Por consiguiente, las operaciones aritméticas de multiplicación y división también adquieren una interpretación racional. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

11

12

Mediciones tales como el peso, el tiempo y la distancia se miden en escala de proporción, puesto que el cero ocupa un lugar natural. Ejemplo: Distancia (en kilómetros) recorridas por automóviles en una prueba de consumo de combustible. Longitudes (en minutos) de películas de cine. Los valores de cada una estas colecciones de datos se pueden acomodar en orden, las diferencias pueden calcularse y existe un punto de partida o cero inherente. Este nivel se denomina "razón" porque el punto de partida hace que las razones o cocientes tengan significado. Nivel Nominal

Ordinal

De Intervalo

De Razón

Resumen Sólo categorías. Los datos no pueden acomodarse en un esquema de ordenamiento. Las categorías están ordenadas, pero no es posible determinar diferencias, o éstas carecen de significado. Se pueden calcular diferencias entre valores, pero no existe un punto de partida inherente. Los cocientes no tienen significado. Igual que el intervalo, pero con un punto de partida inherente. Los cocientes tienen significado

Ejemplo

Observación

Autos de estudiantes: Sólo categorías o 10 Mercedes Benz nombres 20 BMW 40 Toyota Vehículos de los estudiantes: 10 compactos 20 medianos 40 grandes

Se determina un orden con “compactos, medianos y grandes”.

Temperaturas: 45º C 80º C 90º C

90º no es dos veces más caliente que 45º C.

Pesos de deportistas universitarios: 70 kg 85 kg 140 kg

140 kg es dos veces 70 kg.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

12

13

Estudio Experimental: En este estudio primero se identifican las variables de interés. Luego se identifican o controlan una o más variables, de modo que se puedan obtener datos de cómo influyen en la variable de interés. Por ejemplo, a una empresa farmacéutica le puede interesar un experimento para determinar la forma en que una nueva medicina afecta la presión sanguínea. Es cuando aplicamos algún tratamiento y luego procedemos a observar su efecto sobre los sujetos. Estudio estadístico No Experimentales u Observasionales: No se trata de controlar las variables de interés, ni de influir sobre ellas. Quizás el tipo más común de estudio observasional es la encuesta. Por ejemplo, para una encuesta personal se identifican primero las preguntas de investigación; a continuación se diseña un cuestionario y se administra a una nuestra de individuos. En este estudio observamos y medimos características especificas, pero no intentamos manipular ni modificar los sujetos que estamos estudiando. Muestra: Es un subconjunto de elementos extraídos de una población. - Es una porción representativa de la población, que se selecciona para su estudio porque la población es demasiado grande para analizarla en su totalidad. Muestra Aleatoria o Probabilística: Se seleccionan los miembros de la población de modo que cada uno tenga la misma probabilidad de ser escogido. Son muestras en que los elementos a seleccionar se obtienen con base en la probabilidad. Cada elemento de una población tiene cierta probabilidad de ser elegido como parte de la muestra. Muestra Aleatoria Simple: Una muestra es seleccionada de modo que todos los elementos de la población tienen la misma probabilidad de ser elegidos. De igual manera, todas las muestras de tamaño n tienen la misma posibilidad de ser elegidas. La muestras aleatorias simples se obtienen por muestreo con reemplazo en una población finita o por muestreo sin reemplazo en una población sin reemprazo. Una muestra aleatoria simple de n sujetos se selecciona de tal manera que toda posible muestra de tamaño n tenga la misma probabilidad de ser escogida.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

13

14

Muestreo Estratificado: Subdividimos la población en por lo menos dos subpoblaciones (o estratos) distintas que comparten categorías (como genero), y luego sacamos una muestra de cada estrato. Si los tamaños de muestra de los distintos estratos reflejan la población general, decimos que tenemos un muestreo proporcional. Muestra que se obtinen al estratificar el marco muestral y luego seleccionar un número fijo de elementos de cada uno de los estratos pro promedio de una técnica de muestreo aleatorio simple. Muestreo Proporcional: Muestra que se obtinene al estratificar el marco muestral y luego seleccionar de cada estrato un número de elementos en proporción al tamaño de los estratos, por medio de una técnica de muestreo aleatorio simple. Cuando se extrae una muestra aleatoria proporcional, el marco muestral se subdivide en varios estratos y luego de cada estrato se extrae una submuestra. Una forma conveniente de expresar el concepto de muestreo proporcional es establecer una proporción. Por ejemplo, “uno de cada 150”, le induce a seleccionar un (1) elemento por cada 150 elementos en el estrato. Muestreo sistemático: Seleccionamos un punto inicial y luego seleccionamos cada késimo (digamos, cada quincuagésimo) elemento de la población. La técnica sistemática es fácil de describir y ejecutar; no obstante, conlleva algunos peligros cuando el marco muestral es repetitivo o de naturaleza cíclica. En estas condiciones, puede que los resultados no se aproximen a una muestra aleatoria simple. Muestreo por cúmulos o conglomerados: Muestreo que se obtiene al muestrear algunas, pero no todas, las subdivisiones posibles que hay dentro de una población. Estas subdivisiones, denominadas conglomerados, a menudo ocurren de manera natural dentro de la población. Primero dividimos el área de la población en secciones (o cúmulos) y luego seleccionamos aleatoriamente unas cuantas de esas secciones escogiendo todos los miembros de las secciones seleccionadas. Una diferencia importante entre el muestreo por cúmulos y el estratificado es que en el muestreo por cúmulos se usan todos los miembros de cúmulos seleccionados,

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

14

15

mientras que en el muestreo estratificado se usa una muestra de miembros de cada estrato. Muestreo de conveniencia o de juicio: Simplemente utilizamos resultados que ya están disponibles. Las muestras son elegidas con base en el hecho de que son típicas. Cuando se obtiene una muestra de juicio, la persona que elabora la muestra elige unidades que considera representativas de la población. La validez de los resultados de una muestra de juicio refleja la solidez del juicio del recolector de datos. Error de muestreo: Es la diferencia entre el resultado de una muestra y el verdadero resultado de la población; tal error es consecuencia de las fluctuaciones aleatorias de las muestras. Error de muestreo: Este error ocurre cuando los datos de una muestra se obtienen, registran o analizan de forma incorrecta. Tal error es consecuencia de una equivocación y no de una fluctuación aleatoria y predispuesta, cuando se usa un instrumento de medición defectuoso, cuando se hacen preguntas predispuestas en una encuesta, cuando mucha gente se niega a responder o cuando se cometen errores al copiar los datos de la muestra. Sesgo muestral: Tendencia a favorecer la elección de unos determinados elementos de la muestra en detrimento de otros. Este análisis de las muestras conduce a distinguir entre las dos ramas principales del análisis estadístico: 1) Estadística descriptiva o deductiva, y 2) Estadística inferencial o inductiva.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

15

16

Tabla de Frecuencias y Gráficos Estadísticos Herramientas estadísticas que resultan de particular utilidad para organizar los datos. - Tabla de frecuencia es un resumen tabular de un conjunto datos donde se muestra la frecuencia (o cantidad) del objeto de estudio en cada una de varias clases. 270 278 250 278 290 274 242 269 257 272 265 263 234 270 273 270 277 294 279 268 230 268 278 268 262

273 201 275 260 286 272 284 282 278 268 263 273 282 285 289 268 208 292 275 279 276 242 285 273 268

258 264 281 262 278 265 241 267 295 283 281 209 276 273 263 218 271 289 223 217 225 283 292 270 262

204 265 271 273 283 275 276 282 270 256 268 259 272 269 270 251 208 290 220 259 282 277 282 256 293

254 223 263 274 262 263 200 272 268 206 280 287 257 284 279 252 280 215 281 291 276 285 287 297 290

228 274 277 286 277 251 278 277 286 277 289 269 267 276 206 284 269 284 268 291 289 293 277 280 274

282 230 275 236 295 289 283 261 262 252 283 277 204 286 270 278 270 283 272 281 288 248 266 256 292

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

16

17

TABLA DE FRECUENCIA CLASES FREC. FREC. FREC . LI LS ABS. REL. ABS. ACU M. 1 200 209 9 0,051 9 2 210 219 3 0,017 12 3 220 229 5 0,029 17 4 230 239 4 0,023 21 5 240 249 4 0,023 25 6 250 259 14 0,080 39 7 260 269 32 0,183 71 8 270 279 52 0,297 123 9 280 289 38 0,217 161 10 290 299 14 0,080 175 TOTALE 175 1,000 S

FREC. MARCA

FREC.

REL. DE X MARCA ACUM. CLASE DE CLASE 0,0514 204,5 1.840,50 0,0686 214,5 643,50 0,0971 224,5 1.122,50 0,1200 234,5 938,00 0,1429 244,5 978,00 0,2229 254,5 3.563,00 0,4057 264,5 8.464,00 0,7029 274,5 14.274,00 0,9200 284,5 10.811,00 1,0000 294,5 4.123,00 46.757,50

- Gráficos que pueden proporcionar una representación visual de los datos. Gráficos.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

17

18

HISTOGRAMA. Consiste en una escala horizontal para valores de los datos que se están representando, una escala vertical para las frecuencias, y barras que representan la frecuencia de cada clase de valores. El eje horizontal pueden ser colocadas las marcas de clase. Coloca las clases de una distribución de frecuencia en el eje horizontal y las frecuencias en el eje vertical. 60

52

50 38

40 FRECUENCIAS

32

30 20 10

14

9 3

5

4

4

214,5

224,5

234,5

244,5

14

0 204,5

254,5

264,5

274,5

284,5

MARCAS DE CLASES

TABLA DE FRECUENCIA CLASES FREC. FREC. FREC . LI LS ABS. REL. ABS. ACU M. 1 200 209 9 0,051 9 2 210 219 3 0,017 12 3 220 229 5 0,029 17 4 230 239 4 0,023 21 5 240 249 4 0,023 25 6 250 259 14 0,080 39 7 260 269 32 0,183 71 8 270 279 52 0,297 123 9 280 289 38 0,217 161 10 290 299 14 0,080 175 TOTALE 175 1,000 S

FREC. MARCA

FREC.

REL. DE X MARCA ACUM. CLASE DE CLASE 0,0514 204,5 1.840,50 0,0686 214,5 643,50 0,0971 224,5 1.122,50 0,1200 234,5 938,00 0,1429 244,5 978,00 0,2229 254,5 3.563,00 0,4057 264,5 8.464,00 0,7029 274,5 14.274,00 0,9200 284,5 10.811,00 1,0000 294,5 4.123,00 46.757,50

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

18

294,5

19

HISTOGRAMA DE FRECUENCIA RELATIVA. Tiene la misma forma y escala horizontal que un histograma, pero la escala vertical se marcara con frecuencias relativas en lugar de frecuencias reales o absolutas.

0,297 0,217

0,183

0,080

MARCAS DE CLASES

TABLA DE FRECUENCIA CLASES FREC. FREC. FREC . LI LS ABS. REL. ABS. ACU M. 1 200 209 9 0,051 9 2 210 219 3 0,017 12 3 220 229 5 0,029 17 4 230 239 4 0,023 21 5 240 249 4 0,023 25 6 250 259 14 0,080 39 7 260 269 32 0,183 71 8 270 279 52 0,297 123 9 280 289 38 0,217 161 10 290 299 14 0,080 175 TOTALE 175 1,000 S

FREC. MARCA

FREC.

REL. DE X MARCA ACUM. CLASE DE CLASE 0,0514 204,5 1.840,50 0,0686 214,5 643,50 0,0971 224,5 1.122,50 0,1200 234,5 938,00 0,1429 244,5 978,00 0,2229 254,5 3.563,00 0,4057 264,5 8.464,00 0,7029 274,5 14.274,00 0,9200 284,5 10.811,00 1,0000 294,5 4.123,00 46.757,50

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

19

4, 5 29

4, 5 28

4, 5 27

4, 5 26

4, 5 25

4, 5 24

4, 5 23

4, 5 22

21

20

0,080 0,017 0,029 0,023 0,023

4, 5

0,051

4, 5

FRECUENCIAS RELATIVAS

0,350 0,300 0,250 0,200 0,150 0,100 0,050 0,000

20

DIAGRAMA DE BARRAS. Este puede mostrar cantidades o porcentajes para dos o más valores sobre el eje vertical. Es una forma de gráfica de representar datos cualitativos que se han resumido en una distribución de frecuencias, de frecuencias relativas o porcentuales. Para los datos cualitativos, las barras deben estar separadas par enfatizar el hecho de que cada clase (categoría) es separada. Relacion Ingresos/Costos 30000 20000

Ingresos

10000

Costos

0 10

20

30

40

50

60

70

80

90 100 110 120 130 140 150 160 170 180 190 200

Unidades Producidas y Vendidas

ANALISIS DE PUNTO DE EQUILIBRIO CANTIDAD COSTO PRECIO UNIDADES UNITARIO FIJO 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170

60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60

7.500 7.500 7.500 7.500 7.500 7.500 7.500 7.500 7.500 7.500 7.500 7.500 7.500 7.500 7.500 7.500 7.500

COSTO COSTO PRECIO VARIABL TOTAL UNITARI INGRESOS BENEFICI E O O 600 8.100 130 1.300 -6.800 1.200 8.700 130 2.600 -6.100 1.800 9.300 130 3.900 -5.400 2.400 9.900 130 5.200 -4.700 3.000 10.500 130 6.500 -4.000 3.600 11.100 130 7.800 -3.300 4.200 11.700 130 9.100 -2.600 4.800 12.300 130 10.400 -1.900 5.400 12.900 130 11.700 -1.200 6.000 13.500 130 13.000 -500 6.600 14.100 130 14.300 200 7.200 14.700 130 15.600 900 7.800 15.300 130 16.900 1.600 8.400 15.900 130 18.200 2.300 9.000 16.500 130 19.500 3.000 9.600 17.100 130 20.800 3.700 10.200 17.700 130 22.100 4.400

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

20

21

180 190 200

60 60 60

7.500 7.500 7.500

10.800 11.400 12.000

18.300 18.900 19.500

130 130 130

23.400 24.700 26.000

5.100 5.800 6.500

DIAGRAMA DE TALLO Y HOJAS. En una grafica de tallo y hojas ordenamos los datos según un patrón que revela la distribución subyacente. Dicho patrón implica separar un numero (como 257) en dos partes, por lo regular el primer digito o los dos primeros (25) y los demás dígitos (7). El tallo consiste en los dígitos de la izquierda (en este caso 25) y las hojas consisten en los dígitos de la derecha (en este caso 7). DIAGRAMA DE TALLOS Y HOJAS

20 21 22 23 24 25 26 27 28 29

1 0 5 0 0 1 0 0 0 0 0

2 1 7 3 0 2 1 1 0 0 0

3 4 8 3 4 2 1 2 0 0 0

4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 4 6 6 8 8 9 5 6 8 2 2 0 1 1

8

2 2 0 1 1

4 2 0 1 2

6 2 0 1 2

6 3 0 2 2

6 3 1 2 3

7 3 1 2 3

7 3 2 2 4

8 3 2 2 5

9 4 2 2 5

9 5 5 5 6 7 7 8 8 8 8 8 8 8 8 8 9 9 9 9 2 2 3 3 3 3 3 3 4 4 4 4 5 5 5 5 6 6 6 6 6 7 7 7 7 7 3 3 3 3 3 3 4 4 4 4 5 5 5 6 6 6 6 7 7 8 9 9 9 9 9 7

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

21

22

POLIGONOS DE FRECUENCIA Y POLIGONO DE PORCENTAJE. El proceso de construcción de un polígono de frecuencias es similar al del histograma excepto que sólo un punto sobre el punto medio de cada intervalo se utiliza para indicar la frecuencia y los puntos adyacentes se conectan mediante segmentos de líneas.

FRECUENCIAS

60 50 40 30 20 10 0

52 38

32 9

14 3

5

4

14

4

204,5 214,5 224,5 234,5 244,5 254,5 264,5 274,5 284,5 294,5 MARCAS DE CLASES TABLA DE FRECUENCIA CLASES FREC. FREC. FREC . LI LS ABS. REL. ABS. ACU M. 1 200 209 9 0,051 9 2 210 219 3 0,017 12 3 220 229 5 0,029 17 4 230 239 4 0,023 21 5 240 249 4 0,023 25 6 250 259 14 0,080 39 7 260 269 32 0,183 71 8 270 279 52 0,297 123 9 280 289 38 0,217 161 10 290 299 14 0,080 175 TOTALE 175 1,000 S

FREC. MARCA

FREC.

REL. DE X MARCA ACUM. CLASE DE CLASE 0,0514 204,5 1.840,50 0,0686 214,5 643,50 0,0971 224,5 1.122,50 0,1200 234,5 938,00 0,1429 244,5 978,00 0,2229 254,5 3.563,00 0,4057 264,5 8.464,00 0,7029 274,5 14.274,00 0,9200 284,5 10.811,00 1,0000 294,5 4.123,00 46.757,50

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

22

23

GRAFICA DE SERIES DE TIEMPO. Es una grafica de línea en la que la línea base representa el tiempo. ESTUDIANTES MATRICULADOS EN EL NIVEL SUPERIOR, POR INSTITUCION. INSTITUCIÓ N

AÑO DE FUNDACIO N

UASD PUCMM UNPHU INTEC UNIBE

1994

AÑOS 1995

1996

1997

1538 41.139

51.432

62.058

81.753

8.560

8.816

9.081

9.438

6.124

6.171

6.220

6.044

3.074

2.369

2.335

2.803

1.747

1.665

1.910

1.947

1962 1967 1974 1982

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

23

24

ESTUDIANTES MATRICULADOS EN EL NIVEL SUPERIOR 90.000 80.000 70.000 60.000 50.000 40.000 30.000 20.000 10.000 -

UASD PUCMM UNPHU INTEC UNIBE 1994

1995

1996

1997

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

24

25

CURVA DE OJIVA.

FRECUENCIAS ACUMULADAS

1,2000 1,0000 0,8000 0,6000 0,4000 0,2000 0,0000

0,9200 0,7029 0,4057

0,0514

0,0686

0,0971

0,1200

0,1429

0,2229

204,5 214,5 224,5 234,5 244,5 254,5 264,5 274,5 284,5 29 MARCAS DE CLASES Es una gráfica de una distribución acumulada. Los valores de los datos están en el eje horizontal y las frecuencias acumuladas, frecuencias relativas acumuladas se muestran en el eje vertical. TABLA DE FRECUENCIA CLASES FREC. FREC. FREC . LI LS ABS. REL. ABS. ACU M. 1 200 209 9 0,051 9 2 210 219 3 0,017 12 3 220 229 5 0,029 17 4 230 239 4 0,023 21 5 240 249 4 0,023 25 6 250 259 14 0,080 39 7 260 269 32 0,183 71 8 270 279 52 0,297 123 9 280 289 38 0,217 161 10 290 299 14 0,080 175 TOTALE 175 1,000 S

FREC. MARCA

FREC.

REL. DE X MARCA ACUM. CLASE DE CLASE 0,0514 204,5 1.840,50 0,0686 214,5 643,50 0,0971 224,5 1.122,50 0,1200 234,5 938,00 0,1429 244,5 978,00 0,2229 254,5 3.563,00 0,4057 264,5 8.464,00 0,7029 274,5 14.274,00 0,9200 284,5 10.811,00 1,0000 294,5 4.123,00 46.757,50

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

25

26

DIAGRAMA DE PARETO. Es una grafica de barras en la que las barras se acomodan en orden según la frecuencia. Al igual que los histogramas, las escalas verticales de los diagramas de Pareto pueden representar frecuencias o frecuencias relativas. En este la barra mas alta queda a la izquierda, y la más pequeña a la derecha. Paises o territorios con mayor numero de inmigrantes 25.000.000 20.000.000 15.000.000 10.000.000

Italia

Argentina

Hong Kong

Costa Avorio

Iran

Reino Unido

Arabia Saudita

Canada

Alemania

Francia

0

Estados Unidos

5.000.000

Países o territorios con el mayor numero de inmigrantes Datos del 1990 País o territorio Numero de Inmigrant es Estados Unidos 19.602.72 5 Francia 5.897.370 Alemania 5.037.072 Canadá 4.265.626 Arabia Saudita 4.037.518 Reino Unido 3.718.295 Irán 3.587.697 Costa Avorio 3.440.419 Hong Kong 2.271.226 Argentina 1.675.033 Italia 1.549.259 [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

26

27

DIAGRAMA CIRCULAR, DE SECTORES O TORTAS. Es de especial utilidad para mostrar proporciones (porcentajes) relativas de una variable. Se utiliza para representar variables cualitativas. Por ejemplo si una determinada categoría representa el 57.8% del total de los datos u observaciones, el ángulo central deberá ser de 0.578 x 360º = 208º. TABLA DE FRECUENCIA CLASES FREC. FREC. FREC . LI LS ABS. REL. ABS. ACU M. 1 200 209 9 0,051 9 2 210 219 3 0,017 12 3 220 229 5 0,029 17 4 230 239 4 0,023 21 5 240 249 4 0,023 25 6 250 259 14 0,080 39 7 260 269 32 0,183 71 8 270 279 52 0,297 123 9 280 289 38 0,217 161 10 290 299 14 0,080 175 TOTALE 175 1,000 S

8%

5%

FREC.

REL. DE X MARCA ACUM. CLASE DE CLASE 0,0514 204,5 1.840,50 0,0686 214,5 643,50 0,0971 224,5 1.122,50 0,1200 234,5 938,00 0,1429 244,5 978,00 0,2229 254,5 3.563,00 0,4057 264,5 8.464,00 0,7029 274,5 14.274,00 0,9200 284,5 10.811,00 1,0000 294,5 4.123,00 46.757,50

3% 2%

200 - 209

2% 2%

8%

22%

FREC. MARCA

210 - 219 220 - 229 230 - 239 240 - 249 250 - 259 260 - 269

18%

270 - 279 280 - 289 30%

290 - 299

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

27

28

PICTOGRAMA. Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de la variable. Estos gráficos se hacen representado en diferentes escalas un mismo dibujo. La escala de los dibujos debe ser tal que el area de cada uno de ellos sea proporcional a la frecuencia de la modalidad que representa. Se utiliza para representar variables cualitativas. DIAGRAMA DE DISPERSION O DISPERSIOGRAMA. Hay ocasiones en que tenemos datos apareados de manera que se establece una correspondencia entre cada valor de un conjunto de datos y un valor de un segundo conjunto de datos. Un diagrama de dispersión es una grafica de los datos (x,y) apareados con un eje "x" horizontal y un eje "y" vertical. En un diagrama de dispersión cada marca (punto o raya) representa la intersección de dos valores - hay una marca para cada par de observaciones de los temas. El propósito principal de la grafica es mostrar de manera grafica la relación entre dos. La relación no es lineal sino curvilínea. CAMPAÑA PUBLICITARIA PARA VENTAS DE PASAJES AEREOS Y X Y OBSERVACI VENTAS PUBLICIDA 4.38625+1.08132 S. D X MES EN EN MILES MILES 1 15 10 15,20 2 17 12 17,36 3 13 8 13,04 4 23 17 22,77 5 16 10 15,20 6 21 15 20,61 7 14 10 15,20 8 20 14 19,52 9 24 19 24,93 10 17 10 15,20 11 16 11 16,28 12 18 13 18,44 13 23 16 21,69 14 15 10 15,20 15 16 12 17,36 TOTALES 268 187 [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

28

29

Pasajes Aereos vendidos en base a la publicidad 30,00 25,00 20,00 15,00 10,00 5,00 0,00

Pasajes Aereos

0

5

10

15

20

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

29

30

Medidas de Tendencias Central Una medida de tendencia central es un valor que está en el centro o punto medio de un conjunto de datos. Es una medida que ubica e identifica el punto alrededor del cual se centran los datos. Es un valor númerico que localiza, de alguna manera el centro de un conjunto de datos.

La Media Aritmética La Media Aritmética o Promedio de un conjunto de puntajes es el valor que se obtiene sumando los puntajes y dividiendo el total entre el numero de puntajes. La media es el punto que menos dista de todas las observaciones. Por esta razón a veces se le considera como el centro de gravedad de los datos. La media es un una medida más confiable que la mediana y la moda, porque tiene un menor error de muestreo. Además la media también tiene más facilidad para un tratamiento estadístico posterior que la mediana o la moda. Es una medida que toma en consideración todos los valores de la distribución. Esto es positivo, pero por la misma razón es muy sensible a la presentación de observaciones extremas que hacen que la media se desplace hacia ellas. En consecuencia no es recomendable usar la media como medida de tendencia central en estos casos, pues la cantidad obenida no es representativa del total de los datos. Tiene la ventaja de que es la única y siempre se puede calcular. Pero cuando se trabaja con datos agrupados, la división en intervalos influye en el valor resultatne de la media. La media es el estadístico de centralización más utilizado para realizar inferencias debido a una buena propiedad matemática que posee: es el centro de gravedad de la distribución. Depende de todas y cada una de las observaciones. El valor de la media puede no coincidir con uno de los valores de la variable. Si consideramos una variable discreta, por ejemplo, “número de hijos en las familias de un barrio” el valor de la media puede resultar x’=2.5 hijos, que no pertenece al conjunto de valores de la variable. La media es el promedio más utilizado. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

30

31

Para datos no agrupados: Media Poblacional  = Xi/N =(X1 + X2 + X3...XN)/N Media Muestral  = Xi/n=(X1 + X2 + X3...XN)/n Para datos agrupados: Media  = *M/n=M/=(1*M1+2*M2+...n*Mn)/

La Mediana o Media Posicional La Mediana o Media Posicional de un conjunto de puntajes es el valor que esta en medio, cuando los puntajes se acomodan en orden de magnitud creciente (o decreciente). La mediana deja a un lado y al otro lado de la distribución el mismo número de observaciones. Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones extremas, ya que no depende de los valores que toma la varible, sino del orden de los mismos. Por ello, es adecuado su uso en distribuciones que presentan observaciones extremadamente grandes o pequeñas. La mediana es la medida de localización que se utiliza con más frecuencia para datos de ingreso anual y valores catastrales, pues con unos pocos ingreos o con propieades extremadamente grandes se puede inflar la media. En esos casos, la mediana es una mejor medida de la tendencia central. La mediana es el valor de la variable que deja por encima y por debajo la misma cantidad de datos (una vesz que éstos han sido ordenados de menor a mayor). Al contrario de la media, en su cálculo no interviene más que el valor (o valores centrales). Esta particularidad ofrece: Ventajas: No se ve afectada por la aparición de observaciones anómalas. Por ello, en tales casos la podemos considerar como una medida más representativa de la mayor parte de los datos que la media. Inconvenientes: No utiliza toda la información de los datos (sólo los valores centrales).

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

31

32

Para datos no agrupados: Posición de la Mediana = (n + 1)/2 1.- Si el numero de puntajes es impar, la mediana es el numero que esta situado exactamente a la mitad de la lista. 2.- Si el numero de puntaje es par, la mediana se obtiene calculando la media de los dos números que están a la mitad. Para datos agrupados: Me = LImd + [(n/2 - F)/fmd] (C) md = clase mediana Clase Mediana es la clase cuya frecuencia acumulada es mayor que o igual a n/2. LImd = limite inferior de la clase de la mediana. F = frecuencia acumulada de la clase que antecede a la clase de la mediana. fmd = es la frecuencia de la clase de la mediana. C = Es la anchura de la clase (es la diferencia entre dos LS consecutivos o entre dos LI consecutivos).

La Moda La Moda de un conjunto de datos es el puntaje que ocurre con mas frecuencia. La observación modal es la observación que ocurre con mayor frecuencia. Es el punto donde donde se concentra el mayor número de observaciones. Se puede calcular para todo tipo de variables, incluidas las cualitativas. Puede no ser única. Cuando hay dos o más modas hablamos de distribuciones bimodales o plurimodales respectivamente.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

32

33

Para datos no agrupados: Mo = Mayor Frecuencia Para datos agrupados: Mo = LImo + [1/(2+1)]*(C) mo = clase modal Clase Modal es la clase que tiene la mayor frecuencia. LImo = limite inferior de la clase modal 1 = diferencia entre la frecuencia de la clase modal y la clase que la antecede. 2 = diferencia entre la frecuencia de la clase modal y la clase que le sigue. C = Es la anchura de la clase (es la diferencia entre dos LS consecutivos o entre dos LI consecutivos).

La Mediana Ponderada Media Ponderada: Media de una colección de puntajes a los que se asignado diferentes grados de importancia. Media Ponderada w = (X*W)/W W = es el peso o ponderación asignada a cada Observación.

La Media Geométrica Media Geométrica puede utilizarse para mostrar los cambios porcentuales en una serie de números positivos. La media geométrica proporciona una medida precisa de un cambio porcentual promedio en una serie de números. MG = X1*X2*X3*...Xn La media geométrica se utiliza con mas frecuencia para calcular la tasa de crecimiento porcentual promedio de algunas series dadas, a través del tiempo. TAREA: RELACION ENTRE LA MEDIA, MEDIANA Y MODA. VENTAJAS Y DESVENTAJAS OBSERVACIONES PARA EL USO DE LAS MISMAS. Observaciones: 1. La media se usa para datos numéricos y distribuciones simétricas (no sesgadas o cargadas). 2. La mediana se utiliza para datos ordinales o para datos numéricos si la distribución está cargada o sesgada. 3. La moda se utiliza principalmente para distribuciones bimodales. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

33

34

MEDIA ARITMETICA: Para datos no agrupados: Media Poblacional  = Xi/N =(X1 + X2 + X3...XN)/N Media Muestral  = Xi/n=(X1 + X2 + X3...XN)/n Para datos agrupados: Media  = *M/n=M/=(1*M1+2*M2+...n*Mn)/ MEDIANA Para datos no agrupados: Posición de la Mediana = (n + 1)/2 Para datos agrupados: Me = LImd + [(n/2 - F)/fmd] (C) md = clase mediana Clase Mediana es la clase cuya frecuencia acumulada es mayor que o igual a n/2. LImd = limite inferior de la clase de la mediana. F = frecuencia acumulada de la clase que antecede a la clase de la mediana. fmd = es la frecuencia de la clase de la mediana. C = Es la anchura de la clase (es la diferencia entre dos LS consecutivos o entre dos LI consecutivos). MODA Para datos no agrupados: Mo = Mayor Frecuencia Para datos agrupados: Mo = LImo + [1/(2+1)]*(C) mo = clase modal Clase Modal es la clase que tiene la mayor frecuencia. LImo = limite inferior de la clase modal 1 = diferencia entre la frecuencia de la clase modal y la clase que la antecede. 2 = diferencia entre la frecuencia de la clase modal y la clase que le sigue. C = Es la anchura de la clase (es la diferencia entre dos LS consecutivos o entre dos LI consecutivos).

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

34

35

MEDIDAS DE DISPERSION O VARIABILIDAD. Las medidas de dispersión miden que tanto se dispersan las observaciones alrededor de su media. El propósito de estas es cuantificar el grado de variación entre el conjunto de valores de una distribución. La variabilidad se refiere a que tan grandes son las diferencias entre los valores evaluados. EL RANGO O RECORRIDO (INTERVALO). Es la medida de dispersión más simple y menos útil. Esta se obtiene de la diferencia entre la observación más alta y la mas baja. Re = X máx – X mín VALORES DE DESVIACION. Para la variabilidad, se consideran las diferencias entre la media y cada valor. Estas diferencias se llaman valores de desviación. Valores de desviación = X- _ Valores de desviación = X-X VARIANZA. Es el promedio de las observaciones respecto a su media elevadas al cuadrado. Es la media de la diferencia cuadráticas de N puntuaciones en relación a su media aritmética. La varianza es útil para comparar la dispersión, o variabilidad, de dos conjuntos de tatos. Al comparar conjuntos de datos, el que tiene mayor varianza tiene mayor dispersión o variabilidad. La Varianza para una Población (² = suma de cuadrados). ²=[(Xi-)²]/N ²  0 Procedimiento para calcular La Varianza para una Población (² = suma de cuadrados) [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

35

36

1. Encuentre la desviación de cada valor de la media: Valores de desviación = X 2. Eleve al cuadrado cada valor de desviación: (Xi-)² 3. Realice la sumatoria de cada valor de desviación elevado al cuadrado: (Xi- )² 4. Encuentre la varianza dividiendo la sumatoria anterior entre N (totalidad de las observaciones). La Varianza para una muestra de datos no agrupados (s²). s²=[(Xi-X)²]/n-1 La Varianza de la muestra de datos agrupados (s²). s²=[M²-nX²]/n-1 LA DESVIACION ESTANDAR. Es la raíz cuadrada de la varianza. Es una medida importante de la dispersión de los datos. Esta regresa a la medición de los valores originales, así tiene mas valor descriptivo directo. La desviación estándar es más útil para describir la variabilidad de un conjunto de datos que la varianza. La desviación estándar lleva las mismas unidades que los valores originales. La Desviación Estándar para una población. =² La Desviación Estándar para una muestra. s=s²

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

36

37

La Desviación Media o Absoluta. Se define como el promedio de la suma de las diferencias en valor absoluto de los valores de la variable con respecto a la media. Desviación media= |Xi-X|/n Coeficiente de Variación. Este sirve como medida relativa de dispersión. Determina el grado de dispersión de un conjunto de datos relativo a su media. CV = s/X(100)

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

37

38

Los Cuantiles. Cuando los valores ordenados de una variable han de ser divididos en grupos homogéneos en cuanto al tamaño, se suelen utilizar los cuantiles. Entre los cuantiles más utilizados se encuentran: Los cuartiles Q Los deciles D Los percentiles P Cuartiles. Así como la mediana divide los datos en dos partes iguales, los tres cuartiles, denotados por Q1, Q2 y Q3, dividen los puntajes clasificados en cuatro partes iguales. (Los puntajes se clasifican cuando se acomodan en orden). A grandes rasgos: Q1 separa el 25% inferior de los puntajes clasificados del 75% superior; - al menos el 25% de los datos es = Q1 - N/4 = 25 - Q1 = P25 Q2 es la mediana; - 2N/4 = 50 - Q2 = P50 Q3 separa el 25% superior del 75% inferior - al menos el 75% de los datos es = Q3 - 3N/4 = 75 - Q3 = P75 Los Deciles. Hay nueve deciles, denotados por D1, D2, D3, D4, D5, D6, D7, D8, D9, que dividen los datos en 10 grupos con aproximadamente el 10% de los datos en cada grupo.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

38

39

El primer decil es la observación debajo de la cual se encuentra el 10% de las observaciones, mientras que el 90% restante se encuentra encima de este. - al menos el 10% de los datos es = D1 D1 = P10 D2 = P20 D3 = P30 : . D9 = P90 Los Percentiles. Hay 99 percentiles (P1, P2, P3 ... P99), que dividen los datos en 100 grupos con aproximadamente el 1% de los puntajes en cada grupo. - al menos el 1% de los datos es = P1 Ubicación de un Percentil. Lp = (n + 1) (P/100) Lp es el sitio del percentil deseado en una serie ordenada. n es el numero de observaciones P es el percentil deseado Percentil de un puntaje. Percentil del puntaje x = numero de puntajes menores que x . 100 numero total de puntajes Otras Medidas de Tendencia Central con los Cuantiles. intervalo intercuartiles = Q3 - Q1 intervalo semiintercuartiles = Q3 - Q1 (desviación del cuartil) 2 cuartil medio = Q3 + Q1 2 intervalo de percentiles 10-90 = P90 - P10 [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

39

40

Los cuartiles (Q) para datos agrupados TABLA DE FRECUENCIA CLASES FREC. FREC. FREC . LI LS ABS. REL. ABS. ACU M. 1 200 209 9 0,051 9 2 210 219 3 0,017 12 3 220 229 5 0,029 17 4 230 239 4 0,023 21 5 240 249 4 0,023 25 6 250 259 14 0,080 39 7 260 269 32 0,183 71 8 270 279 52 0,297 123 9 280 289 38 0,217 161 10 290 299 14 0,080 175 TOTALE 175 1,000 S

FREC. MARCA

FREC.

REL. DE X MARCA ACUM. CLASE DE CLASE 0,0514 204,5 1.840,50 0,0686 214,5 643,50 0,0971 224,5 1.122,50 0,1200 234,5 938,00 0,1429 244,5 978,00 0,2229 254,5 3.563,00 0,4057 264,5 8.464,00 0,7029 274,5 14.274,00 0,9200 284,5 10.811,00 1,0000 294,5 4.123,00 46.757,50

Q1 = LI + N/4 – Fi-1 * C fi N/4 = 43.75; primera Fi > N/4 = 71 Q1 = 260 + 43.75 – 39 * (10) = 261.48 32 Q2 = LI + 2N/4 – Fi-1 * C fi 2N/ 4 = 87.50; primera Fi > 2N/4 = 123 Q2 = 270 + 87.50 – 71 * (10) = 273.17 52 Q3 = LI + 3N/4 – Fi-1 * C fi 3N/4 = 131.25; primera Fi > 3N/4 = 161 Q3 = 280 + 131.25 – 123 * (10) = 282.17 38 [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

40

41

CUARTILES

DECILES

PERCENTILES

Q1

VALOR QUE OCUPA N/4

Q2

VALOR QUE OCUPA 2N/4

Q3

VALOR QUE OCUPA 3N/4

D1

VALOR QUE OCUPA N/10

D2

VALOR QUE OCUPA 2N/10

D9

VALOR QUE OCUPA 9N/10

P1

VALOR QUE OCUPA N/100

P2

VALOR QUE OCUPA 2N/100

P99

VALOR QUE OCUPA 99N/100

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

41

42

Usos frecuentes de la desviación estándar. Teorema de Chebyshev (matemático ruso P.L. Chebyshev 1821-1894) La proporción (o fracción) de cualquier conjunto de datos que queda a menos de K desviaciones estándar de la media siempre es al menos 1 - 1/K², donde K es cualquier numero positivo mayor que 1. Para K = 2 y K = 3, obtenemos los dos resultados específicos siguientes: - Al menos 3/4 (o el 75%) de todos los puntajes quedan a menos de 2 desviaciones estándar de la media (x-2s a x+2s). - Al menos 8/9 (o el 89%) de todos los puntajes quedan a menos de 3 desviaciones estándar de la media (x-3s a x+3s).

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

42

43

La distribución normal (o gaussiana) y la regla empírica. La distribución normal es una distribución de datos continuos(*) (no discretos) que produce una curva simétrica en forma de campana. La distribución gaussiana fue presentada por Karl Friedrich Gauss (1777-1855) en el 1812. La campana de Gauss o curva de distribución normal, curva de probabilidad normal; se caracteriza por: - Es unimodal. - Es simétrica (la simetría es perfecta). - La mitad izquierda de su histograma es aproximadamente una imagen especular de su mitad derecha. - La asimetría de la distribución es cero. - Las colas de la curva se aproximan mas, pero nunca tocan, el eje horizontal. - La media, la mediana y la moda son iguales. - La mitad de las observaciones esta por encima de la media y la mitad esta por debajo. - Si las observaciones están altamente dispersas, la curva en forma de campana se aplanara y se esparcirá. (*) Variables continuas: Son las que pueden tomar cualquier valor dentro de un intervalo dado. Por muy próxima que puedan estar dos observaciones, si el instrumento de medida tiene la precisión suficiente siempre puede haber una tercera observación que caiga entre las dos primeras. Los valores de una variable continua proceden en general de mediciones, por ejemplo las cantidades de leche que las vacas producen son datos continuos porque son mediciones que pueden asumir cualquier valor dentro de un intervalo continuo. Se pueden obtener de un numero infinito de posibles valores que pueden asociarse a puntos de una escala continua, de tal manera que no haya huecos ni interrupciones.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

43

44

La Regla Empírica o Regla 68-95-99. Esta regla solo aplica a un conjunto de datos cuya distribución tiene aproximadamente forma de campana. Esta afirma que: - Cerca del 68% de todos los puntajes u observaciones queda a menos de una desviación estándar de la media. - Cerca del 95% de todos los puntajes u observaciones queda a menos de dos desviaciones estándar de la media. - Cerca del 99.7% de todos los puntajes u observaciones que a menos de tres desviaciones estándar de la media. Distribuciones de Datos Sesgadas. Una distribución de datos esta sesgada, si no es simétrica y se extiende mas hacia un lado que hacia otro. Sesgo describe la falta de simetría en una distribución. Los datos sesgados a la izquierda se dice que tienen sesgo negativo; la media y la mediana están a la izquierda de la moda. Generalmente tiene la media a la izquierda de la mediana. Sesgo negativo describe distribuciones asimétricas en la que la mediana excede a la media; la cola de la distribución es hacia los valores bajos. Los datos sesgados a la derecha se dice que tienen sesgo positivo; la media y la mediana están a la derecha de la moda. Sesgo positivo describe distribuciones asimétricas en las que la media excede la mediana; los valores se alargan hacia los valores altos. En ambos casos, la moda es por definición la observación que ocurre con mayor frecuencia, por tanto esta en el pico de la distribución.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

44

45

Observaciones: 1. Si la media y la mediana son iguales, la distribución de los resultados suele ser simetrica. 2. Si la media es mayor que la mediana, la distribución se carga a la derecha. 3. Si la media es menor que la mediana, la distribución se carga a la izquierda. Coeficiente de Sesgo de Pearson. P = 3 (Media - Mediana) s Si P < 0, los datos están sesgados a la izquierda. Si P > 0, los datos están sesgados a la derecha. Si P = 0, los datos están distribuidos normalmente.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

45

46

Ejercicios Propuestos. Calcule los modelos de tendencia central, represente gráficamente cada situación e interprete los resultados. Caso I. El precio que acostumbran a pagar 500 usuarias de un determinado producto aparece en la siguiente tabla: NUMERO DE PRECIOS

PRECIOS

USUARIAS

5.05

10.05

38

10.05

15.05

167

15.05

20.05

143

20.05

25.05

92

25.05

30.05

37

30.05

35.05

17

35.05

40.05

6

1. Construya una tabla de frecuencia. 2. ¿Cuál es el precio más representativo? 3. ¿Cuál es el precio que representa al sector socioeconómico que está equidistante de los sectores extremos? 4. ¿Cuál fue el precio que más pagaron estas usuarias? 5. Grafique un diagrama circular. 6. Grafique un Histograma.

Caso II. Se considera la distribución de los ingresos mensuales de una muestra de directores de enseñanza básica, según muestra la siguiente tabla: NUMERO DE INGRESOS

DIRECTORES

7,000.00

7,999.00

6

8,000.00

8,999.00

6

9,000.00

9,999.00

10

10,000.00

10,999.00

18

11,000.00

11,999.00

30

12,000.00

12,999.00

25

13,000.00

13,999.00

40

14,000.00

14,999.00

80

15,000.00

15,999.00

15

1. 2. 3. 4. 5. 6.

Construya una tabla de frecuencia. ¿Cuál es el ingreso más representativo de estos directores? ¿Cuál es el ingreso que representa a los directores están equidistantes de los extremos? ¿Cuál es el ingreso que más recibieron los directores? Grafique una curva de ojiva. Grafique un Polígono de frecuencia. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

46

47

Caso III. Una organización está por revisar el monto que los estudiantes invierten en textos cada semestre. Cincuenta estudiantes reportaron las cantidades aproximadas en dólares: DOLARES

NUMERO DE

INVERTIDOS

ESTUDIANTES

100

124

8

125

149

11

150

174

8

175

199

6

200

224

10

225

249

6

250

274

1

TOTALES

1. 2. 3. 4. 5. 6. 7.

50

Construya una tabla de frecuencia. ¿Cuál es la cantidad de dinero invertida que más representa a todos los estudiantes? ¿Cuál es la inversión más común entre los estudiantes? ¿Cuál sería la cantidad que representa la mitad de la inversión de todos los estudiantes? Grafique un diagrama circular. Grafique un Histograma. Grafique una curva de ojiva.

Caso IV. Un analista de la Secretaría de Estado de Trabajo está evaluando los sueldos de los empleados dominicanos para recomendar un reajuste salarial. Para esto tomo una muestra de 140 empleados, en base a la siguiente tabla: SUELDOS USA$

USA$

305

609

65

610

914

30

915

1,219

22

1,220

1,524

10

1,525

1,829

5

1,830

2,134

3

2,135

2,439

2

2,440

2,744

2

2,745

3,049

1

TOTALES

1. 2. 3. 4. 5. 6.

EMPLEADOS

140

Construya una tabla de frecuencia. ¿Cuál es el sueldo más representativo de estos empleados? ¿Cuál es el sueldo que representa la mitad? ¿Cuál es el sueldo más común? Grafique una curva de ojiva. Grafique un Polígono de frecuencia. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

47

48

7. Usando el coeficiente de sesgo de Pearson determine si está sesgada. 8. ¿Cómo está sesgada? ¿Por qué? 9. ¿Es simétrica? ¿Por qué? 10. ¿Es una distribución normal? ¿Por qué?

Caso V. Un estudiante de quinto semestre de administración de empresas está cursando 5 asignaturas, y estos estiman obtener las siguientes calificaciones: ASIGNATURA

NOTA

LETRA

CREDITOS

CONTABILIDAD DE COSTOS

80

B=3

5

INTR. AL DERECHO LAVORAL

90

A=4

3

METODOS CUANTITATIVOS

85

B=3

4

METODOG. DE LA INVESTIGACION

95

A=4

3

MERCADEO II

90

A=4

3

Determine cuál será el índice académico del semestre. Caso VI. Un fabricante de circuitos eléctricos ha producido el siguiente número de unidades en los siguientes años: 1995

1996

1997

1998

1999

12,500

13,250

14,310

15,741

17,630

1. Calcule el incremento porcentual de cada año con relación al anterior. 2. Determine la media tomando en consideración los incrementos porcentuales. Caso VII. Un inversionista extranjero está interesado en ingresar en algún sector económico de la República Dominicana, para ello seleccionó 4 sectores y así evaluar su comportamiento. Este se basó en los datos del Banco Central de la R. D. según el informe de la economía dominicana ene-dic 1999 del producto interno bruto (PIB) durante los años 1995-1999. Estos sectores crecieron de la siguiente manera: SECTORES

1995

1996

1997

1998

1999

MANUFACTURA

839.4

866.4

929.9

987.5

1053.6

COMERCIO

554.8

603.9

661.9

733.4

800.1

COMUNICACIONES

159.7

185.7

221.5

267

308.7

HOTELES, BARES Y REST.

259.4

292.6

343.6

359.7

395.6

1. Tomando como base la tasa de crecimiento porcentual promedio de cada sector, ¿en cuál sector usted le recomendaría invertir? 2. Haga un diagrama de serie de tiempo que represente simultáneamente todos los sectores.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

48

49

Caso VIII. Calcule la desviación estándar de los siguientes tiempos de espera (en minutos) de los clientes del Banco BHD, basados en una muestra. Calcule la Mediana y la Moda. 6.5

6.6

6.7

6.8

7.1

7.3

7.4

7.7

7.7

7.7

Caso IX. Se utilizan dos procesos para producir discos de computadoras, pero han surgido problemas respecto a la variación en los tamaños de tales discos. Con base en los datos de muestra aquí presentados de ocho tamaños de discos en pulgadas para cada proceso. Explique en cuál proceso aconsejaría usted si su objetivo es minimizar la desviación en el tamaño de los discos. PROCESO I

PROCESO II

3.41

3.22

3.81

3.26

3.74

3.06

3.26

3.79

3.89

3.65

3.07

3.14

3.65

3.33

3.35

3.51

Caso X. Los salarios en miles de dólares de los directores ejecutivos de las mejores corporaciones de los Estados Unidos de América reportados por la edición de la revista Forbes de la edición del 24 de mayo de 1997 aparecen en la siguiente tabla de frecuencias: SALARIOS DIRECTORES (EN MILES DE US$) EJECUTIVOS 90 439 6 440 789 8 790 1,139 10 1,140 1,489 12 1,490 1,839 10 1,840 2,189 8 2,190 2,539 6 TOTALES 1. 2. 3. 4. 5. 6. 7. 8.

Haga un Histograma. ¿Cuál es el salario más común de los directores ejecutivos? Haga un Diagrama Circular e Interprételo. Determine si está sesgada. ¿Cuál es el salario que está equidistante de los dos extremos? ¿Es una distribución normal? ¿Por qué? Represente gráficamente si es normal o el sesgo. Compruebe si se cumple la regla empírica.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

49

50

Caso XI. Un inversionista extranjero está interesado en ingresar en algún sector económico de la República Dominicana, para ello seleccionó 5 sectores y así evaluar su comportamiento. Este se basó en los datos del Banco Central de la R. D. según el informe de la economía dominicana ene-dic 2002 del producto interno bruto (PIB) durante los años 1996-2002. Estos sectores crecieron de la siguiente manera: BANCO CENTRAL DE LA REPUBLICA DOMINICANA Departamento de Cuentas Nacionales y Estadísticas Económicas PRODUCTO INTERNO BRUTO POR SECTORES DE ORIGEN 1996-2002 Millones de RD$

Sectores CONSTRUCCIÓN COMERCIO COMUNICACIONES ELECTRICIDAD FINANZAS

1996 1997 1998 702.1 603.9 664.2 743.3 185.7 221.5 266.7 106.0 120.7 228.8 236.2 245.7

TASAS DE CRECIMIENTO (%) SECTORES CONSTRUCCIÓN COMERCIO COMUNICACIONES ELECTRICIDAD FINANZAS

1999 826.2 805.7 308.3 130.5 256.0

2000 2001* 2002* 872.8 876.9 904.9 875.8 885.0 915.1 355.7 442.0 518.9 139.5 165.1 178.0 264.4 271.9 279.7

97/ 96 98/97 99/98 00/99 01/00* 02/01* 17.7 5.6 0.5 3.2 10.0 11.9 8.4 8.7 1.1 3.4 19.3 20.4 15.6 15.4 24.2 17.4 13.8 8.1 7.0 18.3 7.8 3.2 4.0 4.2 3.2 2.8 2.9

1. Tomando como base la tasa de crecimiento porcentual promedio de cada sector, ¿en cuáles sectores usted le recomendaría invertir? 2. Haga un diagrama de serie de tiempo que represente simultáneamente todos los sectores. Caso XII. Un analista de la Secretaría de Estado de Trabajo está evaluando los sueldos de los empleados dominicanos en la rama “Industrias y Manufactureras” para recomendar un reajuste salarial. Para esto tomo una muestra de 464 empleados, en base a la siguiente tabla: Ingresos por rama de actividad económica según el Banco Central Fuente: Encuesta Nacional de Fuerza de Trabajo, Abril 2002. Ingresos por Hora (RD$) Empleados 6 9 18 10 13 35 14 17 60 18 21 61 22 25 64 26 29 53 30 33 48 34 37 49 38 41 36 42 45 40 [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

50

51

1. 2. 3. 4. 5. 6. 7. 8.

Construya una tabla de frecuencia. ¿Cuál es el sueldo más representativo de estos empleados? ¿Cuál es el sueldo que representa la mitad? ¿Cuál es el sueldo más común? Grafique un Polígono de frecuencia Usando el coeficiente de sesgo de Pearson determine si está sesgada. ¿Cómo está sesgada? ¿Por qué? ¿Es una distribución normal? ¿Por qué? Diga 5 razones.

Caso XIII. El informe Nielsen sobre Tecnología Domestica (20 de febrero de 1996) describió las tecnologías caseras y su empleo por parte de personas de 12 años o más. Los datos siguientes son las horas de empleo de computadoras personales durante una semana, para una muestra de 50 personas. 4.1 3.1 4.1 10.8 7.2

1.5 4.8 4.1 2.8 6.1

10.4 2.0 8.8 9.5 5.7

5.9 14.8 5.6 12.9 5.9

3.4 5.4 4.3 12.1 4.7

5.7 4.2 3.3 0.7 3.9

1.6 3.9 7.1 4.0 3.7

6.1 4.1 10.3 9.2 3.1

3.0 11.1 6.2 4.4 6.1

3.7 3.5 7.6 5.7 3.1

Resuma estos datos formando: a. Construya una tabla de distribución de frecuencias, empleando anchura de clase igual a 3 horas. b. Un histograma. c. Una Ojiva. d. Un diagrama circular. e. Un Polígono de Frecuencia. f. Haga comentarios acerca de lo que indican los datos respecto al uso de computadoras en el hogar. g. ¿Cuál es el tiempo más empleado? h. ¿Qué tiempo está a la mitad? i. ¿Cuál es el más representativo de los tiempos?

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

51

52

Caso XIV. Los sueldos de los dominicanos expresados en dólares USA$ oscilan dentro de la siguiente distribución de valores: 105 145 185 225 265

1. 2. 3. 4. 5. 6.

305 345 385 425 465

505 545 585 625 665

705 905 1,105 745 945 1,145 785 985 1,185 825 1,025 1,225 865 1,065 1,265

1,305 1,345 1,385 1,425 1,465

1,505 1,545 1,585 1,625 1,665

1,705 1,745 1,785 1,825 1,865

1,905 1,945 1,985 2,025 2,065

2,105 2,145 2,185 2,225 2,265

2,305 2,345 2,385 2,425 2,465

Determine los cuartiles Q1, Q2 y Q3 Determine el percentil 70 Determine el sexto decil Determine la desviación del cuartil Determine el percentil del valor US$1,425 Determine la mediana

Caso XV. Los salarios inicial para recién graduados de licenciatura en contabilidad, durante 1996 y 1997, fue US$30,393 (US Online, U.S. News and World Report, diciembre 1997). A continuación vemos una muestra de salarios iniciales, en miles de dólares. 30.7 28.8 29.1 31.1 30.1 29.7 30.7 30.0 30.6 30.5 31.2 32.1 30.2 30.3 32.9 32.2 29.9 28.9 30.6 31.8 32.2 30.3 30.4 32.3 33.3 32.7 29.3 30.3 30.9 30.3 a. ¿Cuál es el salario promedio inicial para datos no agrupados? b. ¿Cuál es la mediana de salario inicial para datos no agrupados? c. ¿Cuál es la moda de salario inicial para datos no agrupados? d. ¿Cuál es el primer cuartil? e. ¿Cuál es el segundo cuartil? f. ¿Condicen estos resultados con lo que afirma U.S. News & World Report? Caso XVI. Dos modos que usan los empleados para ir a trabajar diariamente son el transporte público y el automóvil. A continuación vemos unas muestras de tiempos de cada modo. Las cifras son en minutos. Transporte público Automóvil

28.0 29.0 32.0 37.0 33.0 25.0 29.0 32.0 41.0 34.0 29.0 31.0 33.0 32.0 34.0 30.0 31.0 32.0 35.0 33.0 [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

52

53

a. Calcule la media de la muestra del tiempo que se lleva en cada modo de transporte. b. Calcule la desviación estándar de la muestra para cada modo de transporte. c. Con base en los resultados de los incisos a y b, ¿qué modo de transporte debe preferirse? Explique sus razones? Caso XVII. Como estadístico residente en Air Santo Domingo, el director de análisis estadístico le pide recolectar y agrupar los datos sobre el número de pasajeros que han decidido viajar con Air Santo Domingo. Tales datos correspondientes a los últimos 50 días aparecen en la tabla siguiente. Sin embargo, con estos datos en bruto, es improbable que el director pueda obtener información útil y significativa respecto a las operaciones de vuelo. Los datos no están organizados y es difícil llegar a una conclusión significativa simplemente revisando una serie de números anotados en un papel. Es preciso agrupar y presentar los datos de manera concisa y reveladora para facilitar el acceso a la información que contienen. 68 72 50 70 65 83 77 78 80 93

71 77 83 74 57 67 60 70 66 84 59 75 72 85 79 84 74 82 73 78 93 81 79 90 84 91 101 92 102 80

79 69 76 94 71 97 95 83 86 69

9. Haga un Histograma. 10.¿Cuál es el número de pasajeros que ocurre con más frecuencia? 11.¿Qué tan dispersos están los datos? 12.Haga un Diagrama Circular e Interprételo. 13.Determine si está sesgada. 14.¿Qué cantidad de pasajeros está equidistante de los dos extremos? 15.¿Es una distribución normal? ¿Por qué? 16.Represente gráficamente si es normal o el sesgo.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

53

54

Caso XVIII. En Aeromar se aceptaron reservaciones telefónicas de vuelos. En la tabla siguiente vemos las duraciones de las llamadas en minutos, para una muestra de reservaciones telefónicas. 2.1 3.3 5.3 5.9 7.5 a) b) c) d) e) f) g) h) i) j) k) l)

4.8 3.5 5.5 6.6 6.0

5.5 4.8 2.8 7.8 4.5

10.4 5.8 3.6 10.5 4.8

¿Qué tan dispersos están los tiempos de estas llamadas? ¿Cuál es el tiempo que está equidistante de los extremos? Determine el primer Cuartil. Determine el quinto Decil. Determine el percentil de la duración 7.8 Construya una tabla de frecuencia. Determine si está sesgada analíticamente. ¿Es una distribución normal? ¿Por qué? Diga 5 razones. Represente gráficamente el comportamiento de esta distribución. Haga una curva de ojiva. Construya un diagrama circular e interprételo. Se puede comprobar la Regla Empírica.

Caso XIX. Los siguientes datos representan el tiempo, en segundos, para pasar de 0 a 60 mi/h para una muestra de 15 automóviles hechos en Alemania y 20 hechos en Japón: Automóviles Alemanes 10.0 10.9 6.4 7.9 8.5 6.9 5.5 6.4 5.1 6.0

4.8 8.9 7.1 8.7 7.5

Automóviles Japoneses 9.4 9.5 7.1 8.9 7.7 10.5 6.7 9.3 5.7 7.2 9.1 8.3 8.5 6.8 9.5

8.0 6.5 12.5 8.2 9.7

Compare y describa las diferencias en tiempos de aceleración de automóviles alemanes y japoneses, en términos de sus estadísticas de tendencia central, estadísticas de dispersión y los cuartiles. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

54

55

Caso XX. 5 compras de una materia prima en los últimos 3 meses: Costo por libra Cantidad Compra Dólares de libras 1 3.00 1,200 2 3.40 500 3 2.80 2,500 4 2.90 1,000 5 3.25 800 Observe que el costo por libra cambió de 3.4 a 2.80 dólares, ya que la cantidad comprada varió de 500 a 2,500 libras. Suponga que un administrador pidió información sobre el costo promedio por libra de la materia prima.

Caso XXI. El Colmado Gazcue vende cinco tipos de limpiadores para desagües. En la tabla se muestra cada tipo junto con la utilidad por lata y el número de latas vendidas: Utilidad Volumen de Limpiador por lata ventas en latas Glunk Out 2.00 3 Bubble Up 3.50 7 Dream Drain 5.00 15 Clear More 7.50 12 Main Drain 6.00 52 Determine la utilidad promedio por lata. Caso XXII. Los miembros de un Club deben pagar cuotas con base en su peso promedio. De los 60 miembros, 12 pesan 110 libras, 25 pesaron 120 libras, 18 hicieron girar la balanza hasta 150 y el resto registraron 180 libras. Si los miembros deben pagar US$5 por cada libra que pesan en promedio, ¿cuánto debe desembolsar cada uno? Número de Libras Miembros 110 12 120 25 150 18 180 5 [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

55

56

Caso XXIII. Aplicando el Teorema de Chebyshev. La media de una línea aérea es de 78.7 pasajeros por día, con una desviación estándar de 12.14. Para programar los tiempos de para una nueva ruta que abrió, la gerencia desea saber con qué frecuencia los pasajeros están dentro de K = dos desviaciones estándar de la media, y cuál es dicho intervalo. Caso XXIV. Suponga que las calificaciones del examen de aptitudes de 100 candidatos a las posiciones vacantes en su organización, tuvieron un promedio de 70 y una desviación estándar de 5. ¿Cuántos candidatos tuvieron calificaciones entre 60 y 80? ¿cuántos entre 58 y 82? Caso XXV. Wageweb lleva a cabo encuesta de salarios y presenta resúmenes en su sitio de la red. Con los datos de salarios, Wageweb informó que los salarios de los gerentes de beneficios variaron entre 50,935 a 79,577 dólares. Suponga que los datos siguientes son una muestra de los salarios anuales para 30 gerentes de beneficios (los datos están en miles de dólares). 57.7 63.0 64.2 63.0 68.7 59.3

64.4 64.7 63.3 66.7 63.8 69.5

62.1 61.2 62.2 60.3 59.2 61.7

69.1 66.8 61.2 74.0 60.3 58.9

71.1 61.8 59.4 62.8 56.6 63.1

17.Haga un Histograma. 18.¿Cuál es el número de pasajeros que ocurre con más frecuencia? 19.¿Qué tan dispersos están los datos? 20.¿Qué representa esta dispersión? 21.Haga un Diagrama Circular e Interprételo. 22.Determine si está sesgada. 23.¿Qué cantidad de pasajeros está equidistante de los dos extremos? 24.¿Es una distribución normal? ¿Por qué? Diga por lo menos 5 razones. 25.Represente gráficamente si es normal o el sesgo por pedio de un poligono de frecuencia. 26.Determine el tercer Cuartil. 27. Determine el octavo Decil. 28. Demuestre y diga si se cumple la regla empírica. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

56

57

29.Utilice el Teorema de Chebyshev para determinar el porcentaje de los gerentes con un salario anual entre 53,000 y 71,000 dólares. 30.Utilice la regla empírica para determinar el porcentaje de gerentes con un salario anual entre 50,000 y 71,000 dólares. Compare sus resultados con el punto anterior. 31.¿Al parecer es razonable suponer que la distribución de salarios se puede aproximar a una distribución de Gauss?

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

57

58

Introducción a las Probabilidades Gran parte de la vida del hombre se caracteriza por la incertidumbre. Muchos fenómenos del mundo parecen estar dominados por el comportamiento aleatorio. Casi todas las decisiones se toman en un entorno caracterizado por la ausencia de un conocimiento completo de la situación. Así, una decisión acerca de la cantidad de unidades a fabricar se basa en las estimaciones del número de unidades que se espera vender. Si se conociera este último con anticipación, la decisión sería elaborar exactamente esa cantidad, sin que hubiera ni escasez ni excedentes. Con todo, en las situaciones concretas de la toma de decisiones rara vez puede recabarse información tan precisa. Estadística Inferencial: Implica la utilización de una muestra para extraer alguna inferencia o conclusión sobre la población correspondiente. - Apoyándose en el calculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones y otras generalizaciones sobre un conjunto mayor de datos. La estadística es inferencial cuando se derivan conclusiones generales para un conjunto de datos más amplio a partir de la información proporcionada por los datos estudiados. Experimento. Experimento es cualquier proceso que permite a los investigadores obtener observaciones. Es el proceso que produce un evento o suceso.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

58

59

Experimento Lanza una moneda Seleccionar una parte para inspección Lanzar un dado Jugar un partido de pelota

Resultados experimentales Cara, cruz Defectuosa, no defectuosa 1, 2, 3, 4, 5, 6 Ganar, perder, empatar

Experimento Aleatorio o de azar. Es un proceso que produce uno de varios resultados posibles. Decimos que un experimento es aleatorio si se verifican las siguientes condiciones: a. Se puede repetir indefinidamente, siempre en las mismas condiciones. b. Antes de realizarlo, no se puede predecir el resultado que se va a obtener. c. El resultado que se obtenga, pertenece a un conjunto de resultados posibles conocido previamente. A este conjunto de resultados posibles, lo denominamos como espacio muestral. Los elementos del espacio muestral se denominan sucesos elementales. Ensayo: Es cada repetición de un experimento. Suceso o Evento. Es cualquier colección de resultados de un experimento. Es una colección de puntos muestrales (resultados experimentales). El suceso o evento es un subconjunto del Espacio Muestral. Suceso Simple. Es un resultado o un suceso que no puede desglosarse. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

59

60

Espacio muestral. El conjunto de todos los posibles resultados para un experimento. Probabilidad. Los conceptos de probabilidad pueden resultar de suma utilidad cuando nos hallamos frente a la incertidumbre que caracteriza a al mayor parte de los ambientes en que se adoptan decisiones. Es una medida numérica de la posibilidad de que ocurrirá un evento. Es la posibilidad numérica de que ocurra un evento, medida entre 0 y 1. Es la frecuencia relativa con la que puede esperarse que ocurra ese evento. Las probabilidades de los diferentes resultados posibles de un ensayo deben sumar uno. Las probabilidades son siempre mayores que o iguales a cero (es decir, las probabilidades nunca son negativas) y son menores que o iguales a uno. Cuanto más pequeña sea la probabilidad, tanto menos posibilidad tendrá el evento. Suceso seguro o evento cierto. Es aquel que siempre se verifica después de un experimento aleatorio. Entre mayor sea la probabilidad de que ocurra un evento, su probabilidad asignada estará más próxima a 1. La probabilidad de certeza es 1.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

60

61

Suceso imposible o evento imposible. Es aquel que nunca se verifica como resultado del experimento aleatorio. La única posibilidad es que el suceso imposible sea el conjunto vació. La probabilidad de una imposibilidad es 0. Formas de Enfocar la Probabilidad. 1. Probabilidad de Laplace o Clásica (a priori) 2. Probabilidad Frecuencial o Frec. Relativa (a posteriori) 3. Probabilidad Subjetiva 4. Probabilidad Axiomática 1. Probabilidad de Laplace o Clásica (a priori=antes del hecho). Según la Regla del marques Laplace (1789-1827) en su obra "Theorie analytique des probabilites" de 1812: Si un experimento cualquiera puede dar lugar a un numero finito de resultados posibles, y no existe ninguna razón que de privilegio a unos resultados en contra de otros - tiene una estructura de un juego de azar entonces la probabilidad de un evento aleatoria A es el cociente entre el numero de formas o casos en las que puede ocurrir un evento (favorables), y el numero de todos los posibles resultados del experimento. P(A) = Numero de formas en las que puede ocurrir un evento Numero total de posibles resultados Ejemplos: La probabilidad de obtener una cara en un solo lanzamiento de una moneda.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

61

62

La probabilidad de sacar un numero x al lanzar un dado. La probabilidad de sacar una carta de una baraja de 52 cartas. 2. Probabilidad Frecuencial o Frec. Relativa (a posteriori). Esta fue establecida por autores como el ingles Ronald A. Fisher (18901962) y el austriaco Richard von Mises (1883-1953) Utiliza datos que se han observado empíricamente, registra la frecuencia con que ha ocurrido algún evento en el pasado y estima la probabilidad de que el evento ocurra nuevamente con base en estos datos históricos. Esta se determina mediante: P(E) = Numero de veces que ha ocurrido el evento en el pasado Numero total de observaciones 3. Probabilidad Subjetiva. Cuando se estudian fenómenos aleatorios en los que no hay posibilidad de repetición o experimentación, la probabilidad sujetiva es la cuantificación (basada en supuesto) que una persona (o grupo) hace de un evento, utilizando la información que posee. Esta conceptualizacion de la probabilidad es muy aplicada en la empresa, en la estadística bayesiana, la teoría de la decisión y la teoría de juegos. Ha sido tratada por autores como Keynes (1921), Ramsey (1926), de Finetti (1937), Koopman (1940) y Savage (1954). El modelo subjetivo requiere establecer la probabilidad de algún evento con base en la mejor evidencia disponible. En muchos casos esto puede ser apenas una conjetura hecha sobre cierta base. Esta se utiliza cuando se desea asignar probabilidad a un evento que nunca ha ocurrido. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

62

63

4. Probabilidad Axiomática. El concepto axiomático de probabilidad fue formulado por Kolmogorov 1933. Para ello preciso ciertas leyes o axiomas que debe cumplir una función de probabilidades. Los axiomas deberían implicar, entre otras, las siguientes cuestiones: a. La probabilidad solo puede tomar valores comprendidos entre 0 y 1. 0 X Ejercicios 16 y 17 Pág. 85

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

71

72

Reglas de la probabilidad. A. Regla de la Multiplicación. Consiste en determinar la probabilidad del evento conjunto P(AB), es decir de la probabilidad de "A y B". Esta se obtiene simplemente multiplicando sus respectiva probabilidades. El procedimiento depende de sí A y B son dependientes o independientes. Probabilidades de eventos independientes. P(AB) = P(A) * P(B) Eventos independientes. Dos sucesos A y B son independientes si la ocurrencia de uno no afecta la probabilidad de ocurrencia del otro. La ocurrencia de uno no tiene que ver nada con la del otro. El 20% de los carros que pasan por el Km. 12 de la Carretera Sánchez, se detienen en un Motel, para alquilar una cabaña. ¿Cuál es la probabilidad de que los próximos dos carros se detengan? Asumiendo que estos son eventos independientes. P(C1C2) = 0.20 * 0.20 = 0.04 ¿Cuál es la probabilidad de que el primer carro se pare y que el segundo siga? P(C1C2) = 0.20 * 0.80 = 0.16

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

72

73

Probabilidad de Eventos dependientes. P(AB) = P(A) * P(B\A) Eventos dependientes. Dos sucesos A y B son dependientes si la ocurrencia de uno afecta la probabilidad de ocurrencia del otro. La ocurrencia de uno tiene que ver con la del otro. Ejemplo: La probabilidad conjunta de que sea hombre y miembro administrativo. P(HA) = 0.24 P(HA) = P(H) * P(A\H) = 0.60 * 0.40 = 0.24 P(A\H) = P(AH)/P(H) = 0.24/0.60 = 0.40 Regla de la Adición. Se utiliza para determinar la probabilidad de A o B, P(AB). La probabilidad del evento A o mutuamente excluyente).

B (cuando

los eventos no son

P(AB)= P(A) + P(B) - P(AB) La razón por la cual se debe restar la probabilidad conjunta es para evitar el doble conteo.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

73

74

Eventos no mutuamente excluyentes. Los sucesos A y B son no mutuamente exclusivos si pueden ocurrir simultáneamente. Si la ocurrencia de un evento no prohíbe la ocurrencia del otro. Ejemplo: La probabilidad de sacar un as o una de las tres cartas de corazones de una baraja. P(AC)=P(A)+P(C)- P(AC) P(AC)=(4/52) + (13/52) - (1/52) = 16/52 En un curso de Métodos Cuantitativos para la toma de decisiones. De 200 estudiantes inscritos en el curso, 160 aprobaron el examen parcial, 140 aprobaron el examen final y 124 aprobaron ambos. A = evento de aprobar el examen parcial B = evento de aprobar el examen final P(A) = 160/200 = 0.80 P(B) = 140/200 = 0.70 P(AB) = 124/200 = 0.62 P(AB)= P(A) + P(B) - P(AB) = 0.80 + 0.70 – 0.62 = 0.88

La probabilidad de que un hombre sea un trabajador hombre o un trabajador administrativo. P(HA)=P(H)+P(A)- P(HA) = 0.60+0.34-0.24 = 0.70 [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

74

75

Probabilidad del evento A o del evento B (cuando los eventos son mutuamente excluyentes). P(AUB) = P(A) + P(B) Eventos mutuamente excluyentes. Los sucesos A y B son mutuamente exclusivos si no pueden ocurrir simultáneamente. Si la ocurrencia de un evento prohíbe la ocurrencia del otro. Si A y B son mutuamente excluyente P(AB)= 0 Ejercicios 18 al 22 - Pág. 90

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

75

76

Teorema de Bayes. Este fue desarrollado por el reverendo Thomas Bayes (1702-1761). Asumimos: Una industria X utiliza dos maquinas para producir su producto. La maquina A produce el 60% de la producción total. La maquina B produce el 40% restante. El 2% de las unidades producidas por A son defectuosas. Las unidades de B tienen un 4% de defectos. Podríamos decir: P(A) = 0.60 P(D\A) = 0.02 P(D'\A) = 0.98

P(B) = 0.40 P(D\B) = 0.04 P(D'\B) = 0.96

P(AD') = P(A) * (D'\A) = 0.60 * 0.98 = 0.588 P(AD) = P(A) * (D\A) = 0.60 * 0.02 = 0.012 P(BD') = P(B) * (D'\B) = 0.40 * 0.96 = 0.384 P(BD) = P(B) * (D\B) = 0.40 * 0.04 = 0.016 según la probabilidad condicional. P(A\D) = P(AD)/P(D) = [P(A) * P(D\A)]/P(D) Sin embargo, para la P(D) existen dos formas en las cuales la unidad puede ser defectuosa. Utilizando la regla de la adición. P(D) = P(AD) + P(BD) P(D) = P(A) * P(D\A) + P(B) * P(D\B) [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

76

77

Teorema de Bayes. P(A\D) = P(AD)/P(D) P(A\D) = P(AD)/[P(AD) + P(BD)] P(A\D)=P(A)*P(D\A)]/[P(A)*P(D\A) + P(B)* P(D\B)] P(A\D)=0.012/(0.012+0.016)=0.429

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

77

78

Técnicas de conteo basadas en el Análisis Combinatorio. Permutaciones. Son las diferentes agrupaciones que pueden formarse con n elementos, entrando todos en cada agrupación y diferenciándose una de otra sólo en el orden de colocación de los elementos. Las permutaciones pueden ser sin repetición si los n elementos dados son diferentes, y con repetición si entre los n elementos dados hay algunos o algunos que aparecen repetidos. La permutación es un arreglo ordenado de un conjunto de elementos. El numero de permutaciones de n elementos tomados r a la vez es: nPr = n!/(n-r)! Nota: La permutación considera el orden de los elementos de los subconjuntos. Combinaciones. Son las diferentes formaciones que podemos hacer con n elementos diferentes entrando de n en r; pudiendo ser r =1|=2)=1-P(x=0) c) ¿Entre 3 y 5, inclusive? =2 llamadas / minuto 3 t=2.201 donde E = t (s/n) E = 2.201 (15,873/12) = US$10,085.29 El intervalo de confianza es: X' - E <  < X' + E US$26,227-US$10,085.29<  < US$26,227+US$10,085.29 US$16,142 <  < US$36,312 [Este resultado también podría expresarse en el formato de  =US$26,227US$10,085.29 o como (US$16,142, US$36,312).] Con base en los resultados de muestra dados, tenemos un 95% de confianza en que los limites de USD16,142 y USD36,312 contendrán realmente el valor de la media de población . Estos costos de reparación parecen muy altos. Efectivamente, el Dodge Viper es actualmente el automóvil más costoso de reparar después de una colisión. Tal información es importante para compañías que aseguran Dodge Vipers contra choques. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

109

110

Caso II. Utilice el grado de confianza y los datos de muestra dados para determinar (a) el margen de error y (b) el intervalo de confianza para la media de la población . 1) Estaturas de mujeres: confianza del 95%; n=10, x'=63.4 pulg., s=2.4 pulg. 2) Promedios de calificaciones: confianza del 99%; n=15, x'=2.76, s=0.88 3) Puntajes en una prueba: confianza del 90%; n=16, x'=77.6, s=14.2 4) Salarios de policías: confianza del 92%; n=19, x'=$23,228, s=$8,779 Caso III. Ejercicios 12 al 18 Págs. 179-180 y Analizar figura 7.4 Pág. 179.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

110

111

Análisis de Regresión y Correlación El modelo estadístico que nos permite representar la relación entre dos variables (dependiente e independiente) se denomina Ecuación de Regresión, ya que a través de el podemos regresar o proyectar datos sobre el posible comportamiento futuro del fenómeno. El primero en desarrollar el análisis de regresión fue el científico ingles Sir Francis Galton (1822-1911). Este estudio el fenómeno de la herencia y demostró que cuando matrimonios con estaturas altas o bajas tienen hijos, las estaturas de esos hijos tienden a exhibir regresión, es decir, a desplazarse hacia una estatura media más representativa. Dada una colección de datos de muestra apareados, la ecuación de regresión

y = bo + bix y = f(x) describe la relación entre dos variables. La grafica de la ecuación de regresión se denomina línea de regresión (o línea de mejor ajuste, o línea de mínimos cuadrados). Esta definición expresa una relación entre "x" (variable independiente o variable predictoria) y "y" (llamada variable dependiente o variable de respuesta). Variable dependiente (Y): Es la variable que se desea explicar o predecir; también se le denomina regresando o variable de respuesta. Variable independiente (X): se utiliza para explicar a Y. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

111

112

Notación para la ecuación de regresión. Parámetro Estadística de Poblac. de Muestra Ordenada al origen de la ecuación de regresión

o

bo

1

b1

Pendiente de la la ecuación de regresión Ecuación de la línea

Y=o+ix

de Regresión

y=bo+bix

y = b o + b ix Donde bo es la ordenada de origen y bi es la pendiente.

bo y bi son estadísticas de muestra que sirven para estimar los parámetros de población o y ix. Mínimos cuadrados ordinarios (MCO). El propósito del análisis de regresión es determinar una recta que se ajuste a los datos muestrales mejor que cualquier otra recta que pueda dibujarse.

bo y bi

estos valores los podemos determinar a través de un procedimiento matemático que se denomina Mínimos Cuadrados Ordinarios (MCO). MCO producirá una recta que se extiende por [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

112

113

el centro del diagrama de dispersión aproximándose a todos los puntos de datos mas que cualquier otra recta. Suma de los cuadrados de X. SCx = (Xi-X')²

SCx = X² - [(X)²/n] Suma de los cuadrados de Y. SCy = (Yi-Y')²

SCx = Y² - [(Y)²/n] Suma de los productos cruzados de X y Y. SCxy = (Xi-X')(Yi-Y')

SCxy = XY - [(X)(Y)/n] Vale la pena notar que las primeras porciones de cada una de estas formulas: SCx = (Xi-X')² | SCy = (Yi-Y')² | SCxy = (Xi-X')(Yi-Y') Ilustran como la recta MCO se basa en las desviaciones de las observaciones a partir de su media. Dadas las sumas de cuadrados y los productos cruzados, es sencillo calcular la pendiente de la recta de regresión y el intercepto, así: La Pendiente de la recta de regresión.

bi = SCxy/SCx bo = Y' - biX'

El intercepto de la recta de regresión. donde Y' y X' son las medias de los valores de Y y los valores de X. NOTA: Estos cálculos son extremadamente sensibles a la aproximación. Por tanto, se aconseja en aras de la exactitud, efectuar los cálculos hasta con cinco o seis cifras decimales. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

113

114

El error estándar de estimación Se. Es una medida del grado de dispersión de los valores Yi alrededor de la recta de regresión. Mide la variación de los puntos de datos por encima y por debajo de la recta de regresión. Refleja la tendencia a desviarse del valor real de Y cuando se utiliza el modelo de regresión para fines predictivos. El error estándar de estimación mide la variación promedio de los puntos de datos alrededor de la recta de regresión que se utiliza para estimar Y y por ende proporciona una medida del error que se presentara en dicha estimación. Se = (Yi-Y^i)²/n-2

Suma de Cuadrados del Error - SCE SCE = SCy - (SCxy)²/SCx En un modelo de regresión simple, se imponen dos restricciones en el conjunto de datos, debido a que se deben dos parámetros, CME es

o y ix.

Por tanto hay n-2 grados de libertad y

Cuadrado Medio del Error CME = SCE/n-2

El Error Estándar Se = CME El error estándar siempre se expresa en las mismas unidades que la variable dependiente Y. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

114

115

Caso I. La gerencia de Aeromar, considera que existe una relación directa entre los gastos publicitarios y el numero de pasajeros que escogen viajar por Aeromar. Para determinar si esta relación existe, y si es así cual podría ser la naturaleza exacta, los analistas decidieron utilizar los procedimientos de MCO para determinar el modelo de regresión. Represente gráficamente los resultados.

y=bo+bix Datos de Regresión para AEROMAR Observación Publicidad Mes En miles US$ X 1 10 2 12 3 8 4 17 5 10 6 15 7 10 8 14 9 19 10 10 11 11 12 13 13 16 14 10 15 12 TOTALES 187

Pasajeros En miles Y 15 17 13 23 16 21 14 20 24 17 16 18 23 15 16 268

XY

X^2

Y^2

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

115

116

El valor positivo para un bi indica una relación directa. A medida que la publicidad aumenta, también lo hace el numero de pasajeros. Ahora es útil obtener una medida de la fuerza de esa relación. Esta es la función del Coeficiente de Correlación, desarrollada por Carl Pearson, a veces se le llama el Coeficiente de Correlación producto-momento de Pearson. El Coeficiente de Correlación r puede asumir cualquier valor entre -1 y +1, es decir, -1  r  +1 Un valor de r= -1 indica una relación negativa entre X y Y.

Suma de Cuadrados Total SCT = (Yi-Y')²

Suma de Cuadrados de la Regresión SCR = (Y^i-Y')²

Suma de Cuadrado de Error

SCE = (Yi-Y^i)²

Coeficiente de Correlación r = SCR/SCT r = SCxy / (SCx)(SCy)

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

116

117

Caso II. Para apoyar las ventas de un producto de consumo masivo en un mercado altamente competitivo una empresa inicio a comienzos de año una intensa campaña publicitaria. La comparación entre la inversión publicitaria y las ventas del producto en 12 meses se colocan en la siguiente tabla: a) Formule la ecuación de regresión. b) Si invertimos en publicidad $400,000 cual debería ser las posibles ventas? MESES ENERO FEBRERO MARZO ABRIL MAYO JUNIO JULIO AGOSTO SEPTIEMBRE OCTUBRE NOVIEMBRE DICIEMBRE TOTALES

VENTAS EN MILES Y 350 300 630 840 930 1060 1280 850 700 1160 1180 1500 10780

PUBLICIDAD EN MILES X 200 250 300 250 330 180 150 350 200 250 250 170 2880

XY

X^2

Y^2

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

117

118

Caso III. El departamento de ventas de una Compañía realiza un análisis comparativo entre el volumen de pedidos levantados y numero de visitas efectuadas. Por sus diez vendedores en cierto periodo de tiempo, todos los vendedores trabajan en zonas similares, en lo referente al numero de clientes que maneja cada uno y potencial de compra de dichos clientes. Los resultados obtenidos son los siguientes: a) Formule la ecuación de regresión. b) ¿Cuánto ascendería el posible monto de los pedidos si las visitas fueran 250? c) ¿Cuál es el grado de relación entre las variables? d) Determine el error estándar. e) Haga el diagrama de dispersión. f) Grafique la recta de regresión.

PEDIDOS EN MILES

VISITAS

VENDEDOR

US$

REALIZADAS

1

13,4

245

2

10,3

172

3

15,1

291

4

6,9

124

5

7,3

191

6

14,2

218

7

5,2

101

8

11,8

259

9

14,3

307

10

5,5

142

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

118

119

Caso IV. Suponga que se reunieron datos de una muestra de 10 restaurantes ubicados cerca de centros educativos. Para i-ésima observación o restaurante de la muestra, xi es el tamaño de la población estudiantil, en miles, y yi son las ventas trimestrales (en miles de dólares). Los valores de xi y yi para los 10 restaurantes de la muestra se resumen en la siguiente tabla: Ventas Población de Trimestrales Restaurante Estudiantes (miles) (miles de dólares 1 2 58 2 6 105 3 8 88 4 8 118 5 12 117 6 16 137 7 20 157 8 20 169 9 22 149 10 26 202 a. Trace un diagrama de dispersión para estos datos. b. ¿Qué indica el diagrama de dispersión que trazó anteriormente, acerca de la relación entre las dos variables? c. Formule la ecuación de regresión. d. Realice una interpretación de la pendiente de la ecuación de regresión. e. ¿Cuál es el grado de relación entre las variables? f. Determine el error estándar. g. Grafique la recta de regresión.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

119

120

Caso V. Los datos siguientes muestran las ventas (en millones) de cajas y los gastos de publicidad (en millones de dólares) para 7 marcas principales de refrescos (Superbrands ’98, 20 de octubre de 1997). Gastos de Publicidad Ventas de cajas Marca (millones de dólares) (en millones) Coca-Cola Classic 131.3 1,929.2 Persi-Cola 92.4 1,384.6 Diet Coke 40.4 811.4 Sprite 55.7 541.5 Dr. Pepper 40.2 536.9 Mountain Dew 29.0 535.6 7-Up 11.6 219.5 a. Trace un diagrama de dispersión para estos datos. b. Formule la ecuación de regresión. c. Realice una interpretación de la pendiente de la ecuación de regresión. d. ¿Cuál es el grado de relación entre las variables? e. Determine el error estándar. f. Prediga las ventas para una marca que gaste 70 millones de dólares en publicidad. g. Grafique la recta de regresión.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

120

121

Caso VI. En The Wall Street Journal Almanac 1998 aparecieron datos sobre el desempeño de las aerolíneas estadounidenses. A continuación vemos los datos sobre el porcentaje de vuelos que llegan puntuales y la cantidad de quejas por 100,000 pasajeros. Aerolínea % de Puntualidad Quejas Southwest 81.8 0.21 Continental 76.6 0.58 Northwest 76.6 0.85 US Airways 75.7 0.68 United 73.8 0.74 American 72.2 0.93 Delta 71.2 0.72 American West 70.8 1.22 TWA 68.5 1.25 a. Trace un diagrama de dispersión para estos datos. b. ¿Qué indica el diagrama de dispersión que trazó en el inciso a)? c. Formule la ecuación de regresión, que indique cómo se relaciona el número de quejas por cada 100,000 pasajeros con el porcentaje de vuelos que llegan a tiempo. d. Realice una interpretación de la pendiente de la ecuación de regresión. e. ¿Cuál es el grado de relación entre las variables? f. Determine el error estándar. g. ¿Cuál es la cantidad estimada de quejas por 100,000 pasajeros, si el porcentaje de vuelos puntuales es de 80 porciento? h. Grafique la recta de regresión.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

121

122

Caso VII. La empresa Nielsen Media Research reúne datos que muestran qué publicistas obtienen la mayor difusión durante las horas estelares de transmisión en 6 redes televisivas. A continuación se presentan los datos de la cantidad de familias espectadoras, en millones, y la cantidad de veces que salió el anuncio al aire durante la semana del 28 de abril al 4 de mayo de 1997 (USA Today, 5 de mayo de 1997). Veces que salió al Familias Marca Anunciada aire espectadoras Wendy's 28 191.7 Ford Escort 20 174.6 Ausin Powers movie 14 161.3 Nissan 16 161.1 Pizza Hut 16 147.7 Saturn 16 146.3 Father's Day Movie 11 138.2 a. Forme la ecuación de regresión estimada que describa cómo se relaciona la cantidad de veces que sale un anuncio con la cantidad de familia espectadoras. b. Proponga una interpretación de la pendiente de la ecuación de regresión estimada. c. ¿Cuál es la cantidad estimada de familias espectadoras si un anuncio sale 15 veces al aire en una semana.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

122

123

Caso VIII. Un gerente de ventas reunió los datos siguientes relacionados con las ventas anuales y años de experiencia. Años de Ventas anuales Vendedor Experiencia (miles de dólares) 1 1 80 2 3 97 3 4 72 4 4 102 5 6 103 6 8 111 7 10 119 8 10 123 9 11 117 10 13 136 a. Trace un diagrama de dispersión para estos datos. b. Formule una ecuación de regresión estimada con la que se puedan predecir las ventas anuales, dados los años de experiencia. c. Use la ecuación de regresión para predecir las ventas anuales de un vendedor con 9 años de experiencia. Caso IX. El gerente de ventas de Copier Sales of America, que tiene una fuerza de ventas muy numerosa en Estados Unidos y Canadá, quiere determinar si existe una relación entre el número de llamadas de ventas que se realizan al mes y el número de copiadoras que se venden durante ese mes. El gerente selecciona una muestra aleatoria de 10 representantes y determina el número de llamadas de ventas que cada uno hizo el pasado y la cantidad de copiadoras vendidas. La información de la muestra se presenta a continuación: Representante de Ventas Tom Keller Jeft Hall Brian Virost Greg Fish Susan Welch Carlos Ramírez Rich Niles Mike Kiel Mark Reynolds Soni Jones

Número de Llamadas de Ventas 20 40 20 30 10 10 20 20 20 30

Número de Copiadoras Vendidas 30 60 40 60 30 40 40 50 30 70

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

123

124

h. Trace un diagrama de dispersión para estos datos. i. ¿Qué indica el diagrama de dispersión que trazó anteriormente, acerca de la relación entre las dos variables? j. Formule la ecuación de regresión. k. Realice una interpretación de la pendiente de la ecuación de regresión. l. ¿Cuál es el grado de relación entre las variables? m. Determine el error estándar. n. Grafique la recta de regresión. o. Prediga las ventas para 15, 35 y 60 llamadas.

Caso X. La humedad influye en la evaporación, de modo que el equilibrio de solventes de las pinturas base agua durante su rocío se ve afectado por la humedad. Se emprende un estudio controlado para examinar la relación de la humedad con la magnitud de la evaporación del solvente. El conocimiento de esta relación es útil para que el pintor ajuste el aspersor de pintura de modo de considerar la humedad. Se obtienen los datos siguientes: OBSERVACION

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

HUMEDAD

EVAPORACION

RELATIVA

SOLVENTE

(%) 35.3 29.7 30.8 58.8 61.4 71.3 74.4 76.7 70.7 57.5 46.4 28.9 28.1 39.1 46.8 48.5 59.3 70.0 70.0 74.4 72.1 58.1 44.6 33.4 28.6

(% DE PESO) 11.0 11.1 12.5 8.4 9.3 8.7 6.4 8.5 7.8 9.1 8.2 12.2 11.9 9.6 10.9 9.6 10.1 8.1 6.8 8.9 7.7 8.5 8.9 10.4 11.1

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

124

125

Las estadísticas de resumen para estos datos son: Sumatoria de x = 1,314.90 Sumatoria de y = 235.70 Sumatoria de x*x = 76,308.53 Sumatoria de y*y = 2,286.07 Sumatoria de x*y = 11,824.44 i. Trace un diagrama de dispersión para estos datos. j. ¿Qué indica el diagrama de dispersión que trazó en el inciso a)? k. Formule la ecuación de regresión, que indique cómo se relaciona la humedad con la evaporación. l. Realice una interpretación de la pendiente de la ecuación de regresión. m. ¿Cuál es el grado de relación entre las variables? n. Determine el error estándar. o. ¿Cuál es la magnitud de la evaporación del solvente cuando la humedad relativa es 50%? Grafique la recta de regresión.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

125

126

Distribución Muestral Generalmente las poblaciones son demasiado grandes como para ser estudiadas en su totalidad. Es necesario seleccionar una muestra representativa de un tamaño más manejable. Esta muestra se utiliza luego para sacar conclusiones sobre la población. Distribución Muestral: Es una lista de todos los valores posibles para un estadístico y la probabilidad relacionada con cada valor. Error de Muestreo: Es la diferencia entre el parámetro poblacional y el estadístico de la muestra para estimar el parámetro. X'-X" X'- Parámetro: Es una medición numérica característica de una población.

que

describe

alguna

- Medida descriptiva de la población completa de observaciones que tienen interés para el investigador. Estadístico: Es una medición numérica característica de una muestra.

que

describe

alguna

El estadístico se utiliza como estimador del parámetro. Al confiar en una muestra para sacar alguna conclusión o inferencia sobre la población. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

126

127

Caso I. Las ventas en miles de dólares de Electrom, S.A. durante los últimos 6 meses fueron de 70, 77, 73, 78, 85 y 80. Asumiendo que estos cinco meses constituyen una población, la media claramente es  = 77.17. El director de Marketing desea estimar esta media "desconocida" tomando una muestra de tamaño n=4. Se espera que el error de muestreo que es probable que ocurra sea relativamente pequeño. Realice la distribución muestral. 1º Podemos obtener muchas muestras de tamaño 4. Específicamente 6C4 = 15 2º Construya la tabla en base a la cantidad de muestra del primer punto, indicando los elementos muestrales (Xi), y Medias Muestrales (X') 3º Construya la tabla con la Probabilidad de cada media muestral. 4º Calcule la media de las medias muestrales. La Media de las Medias Muestrales: X"= estándar de las medias muestrales/K. Varianza de la Distribución Muestral de las Medias Muestrales: ²x'=(X'-X")²/K Error Estándar de la Muestral de las Medias Muestrales: x'=²x' Una aproximación cercana puede obtenerse mediante: ²x'=²/n [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

127

128

x'=/n Si el tamaño de la muestra es mas del 5% de la población, n>0.05N, debe aplicarse el factor de corrección para poblaciones finitas (fpc). Error Estándar utilizando el fpc: x'=(/n)((N-n/N-1)) (N-n/N-1) es el fpc. 70

73

77

78

80

85

TABLA DE DISTRIBUCION MUESTRAL POBLACION VENTAS MENSUALES 70 77 73 78 85 80 77.17 MEDIA VARIANZA DESVICION

NUMERO MUESTRA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

ELEMENTOS DE MEDIA (X') ERROR DE CUADRADO DEL LA MUESTRA (X) MUESTRAL MUESTREO (X'-X") ERROR (X'-X") 70 73 77 78 70 73 77 80 70 73 77 85 70 73 78 80 70 73 78 85 70 73 80 85 70 77 78 80 70 77 78 85 70 77 80 85 70 78 80 85 73 77 78 80 73 77 78 85 73 77 80 85 73 78 80 85 77 78 80 85 MEDIA DE X'

VARIANZA ERROR ESTANDAR

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

128

129

TABLA DE PROBABILIDADES NUM. MEDIAS (NX')

MUESTRAL MEDIA (X')

NX'/K P(X')

Ejercicios 1 al 5 - Págs. 149-150 Teorema del Limite Central. A medida que n se vuelve más grande, la distribución de las medias muestrales se aproxima a una distribución normal con una media X"= y un error estándar de x'=/n. A mayor n menor x' Por tanto, incluso si la población no esta distribuida normalmente, la distribución de muestreo de las medias muestrales será normal si n es lo suficientemente grande. La regla general es que si n es por lo menos 30, el Teorema del Limite Central asegurara una distribución normal en las medias muestrales incluso si la población no es normal. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

129

130

En síntesis: Teorema del Limite Central: Dado que: 1.- La variable aleatoria x tiene una distribución (que podría ser o no normal) con media  y una desviación estándar . 2.- Se seleccionan aleatoriamente muestras de tamaño n de esa población. Conclusiones: 1.- A medida que aumenta el tamaño de las muestras, la distribución de las medias de muestra se acercara a una distribución normal. 2. - La media de las medias de muestra será la media de la población X"=. 3.- La desviación estándar de las medias de muestra será x'=/ n. Reglas prácticas de uso común: 1.- Para muestras de tamaño n mayor que 30, la distribución de las medias de muestra se puede aproximar razonablemente bien con una distribución normal. La aproximación es más exacta a medida que aumenta el tamaño de muestra n. 2.- Si la población original también esta distribuida normalmente, las medias de muestra tendrán una distribución normal para cualquier tamaño de muestra n. El Teorema del Limite Central indica que en el caso de muestras grandes (n > 30), la distribución de las medias de muestra es aproximadamente normal con media  y desviación estándar /n. Provocando así una variación de la ecuación: [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

130

131

 = (X' - )/(/n) La regla general es que si n es por lo menos 30, el Teorema del Limite Central asegurara una distribución normal en las medias muestrales incluso si la población no es normal.

Caso I. Orange registró los mensajes telefónicos de sus clientes, los cuales promedian 150 segundos, con una desviación de 15 segundos, por lo que planea instalar nuevos equipos que mejorarían la eficiencia de sus operaciones. Sin embargo, antes que los ejecutivos puedan decidir si dicha inversión será eficaz en función de los costos, deben determinar la probabilidad de que la media de una muestra de n = 35: a. Esté entre 145 y 150. b. Sea mayor que 145. c. Sea menor que 155. d. Esté entre145 y 155. e. Sea mayor que 155.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

131

132

Distribución de Proporciones Muestrales Muchos asuntos de negocios tratan la proporción de la población . Una firma de marketing puede querer averiguar si un cliente (1) compra o (2) no compra el producto. Un banco con frecuencia debe determinar si un depositante (1) pedirá o (2) no pedirá un crédito para auto. Muchas firmas deben determinar la probabilidad de que un proyecto para presupuestar capital (1) generara o (2) no generara un rendimiento positivo. un cliente (1) compra (p = ) o (2) no compra el producto (q = 1 - ) un depositante (1) pedirá un crédito para auto (p = ) o (2) no pedirá un crédito para auto (q = 1 - )

Valor esperado (media) de la Distribución Muestra de la Proporción: E(p) =  = ∑p/K Error estándar de la Distribución _______ ____ Muestra de la Proporción: p = (1-)/n = pq/n Si el tamaño de la muestra es mas del 5% de la población, n>0.05N, debe aplicarse el factor de corrección para poblaciones finitas (fpc). Error estándar de la Distribución _______ ________ Muestra de la Proporción: p = (1-)/n * (N-n/N-1) ____ ________ p = pq/n * (N-n/N-1)

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

132

133

Caso I. Publicidad Sarmiento pregunta a toda la población N=4 clientes si vieron el anuncio publicitario de Sarmiento en el periódico de esta mañana. Se registro una respuesta “si”como éxito, y “no”como fracaso. Los cuatros clientes S1, N2, N3 y S4. La proporción poblacional de éxitos es  = 0.5. Se tomaron muestras de tamaño n = 2, y la proporción de éxitos se registra en la siguiente tabla: p = x/n Xi

Núm. De éxitos

p

1

S1, N2

1

0.50

2

S1, N3

1

0.50

3 4

S1, S4 N2, N3

2 0

1.00

5

N2, S4

1

0.50

6

N3, S4

1

0.50

TOTAL

3.00

-

Valor esperado (media) de la Distribución Muestra de la Proporción: E(p) =  = ∑p/K = 3/6 = 0.5 Muestra de la Proporción: ________ _______ p = 0.5*0.5/2 * (4-2/4-1)

p = (1-)/n * (N-n/N-1)

p = 0.35355339 * 0.81649658 = 0.289 Z = (p - )/p [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

133

134

Caso II. BellLabs adquiere componentes para sus teléfonos celulares en lotes de 200 de una firma en Palo Alto. El componente tiene una tasa de defectos del 10%. Una política establecida recientemente por BellLabs establece que si el siguiente envío tiene: a. Más del 12% de defectos, definitivamente buscará un nuevo suplidor. b. Entre el 10 y el 12% de defectos, considerará un nuevo proveedor. c. Entre el 5 y 10% de defectos, definitamente no conseguirá un nuevo proveedor. d. Menos del 5% de defectos, incrementará sus pedidos. i. Cúal decisión es más probable que tome BellLabs?

a. Más del 12% de defectos, definitivamente buscará un nuevo suplidor. Valor esperado (media) de la Distribución Muestra de la Proporción: E(p) =  = 0.10 Muestra de la Proporción: p = (1-)/n __________ p = 0.1*0.9/200 = 0.021 P(p > 0.12):

Z = (p - )/p Z = (0.12 – 0.10)/0.021 = 0.95 Z = 0.95  área de 0.3289

P(p > 0.12) = P(Z > 0.95) = 0.5 - 0.3289 = 0.1711 [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

134

135

b. Entre el 10 y el 12% de defectos, considerará un nuevo proveedor. Valor esperado (media) de la Distribución Muestra de la Proporción: E(p) =  = 0.10 Muestra de la Proporción: p = (1-)/n __________ p = 0.1*0.9/200 = 0.021 P(0.10 Z=1.96 Queremos que la media de la muestra este dentro de un margen de US$500 de la media de la población. E=US$500 =US$6,250 n = ²²/(X' - )² n = [(1.96)²*(6250)²]/(500)²= n = [/E]² n = [(1.96 * 6250)/500]²= Caso II. ¿Que tan grande se requiere que sea una muestra para que proporcione una estimación del 90% del numero promedio de graduados de las universidades de la nación con un error de 2000 estudiantes si una muestra piloto reporta que s=8,659?

Caso III. Nielsen Media Research quiere estimar la cantidad media de tiempo (en horas) que los estudiantes universitarios de tiempo completo dedican a ver televisión cada día entre semana. Determine el tamaño de muestra necesario para estimar esa media con un margen de error de 0.25 horas (15 minutos). Suponga que se desea un grado de confianza del 96%, y que un estudio piloto indico que la desviación estándar se estima en 1.87 horas. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

151

152

¿QUE PASA SI SE DESCONOCE ? 1.- Podemos INTERVALO.

utilizar

la

REGLA

PRACTICA

DE

En conjuntos de datos representativos, el intervalo del conjunto tiene una anchura aproximada de cuatro desviaciones estándar (4s), así que la desviación estándar se puede aproximar de la siguiente manera: desviación estándar  intervalo/4   intervalo/4 Esta expresión proporciona una estimación burda de la desviación estándar, si conocemos los puntajes máximo y mínimo. Si conocemos el valor de la desviación estándar, podemos usarlo para entender mejor los datos, obteniendo estimaciones burdas de los puntajes máximo y mínimo como se indica. 2.- Realizar un estudio piloto iniciando el proceso de muestreo. Con base en la primera recolección de por lo menos 31 valores de muestra seleccionados al azar, calculamos la desviación estándar de la muestra s y la usamos en lugar de . Este valor puede refinarse a medida que se obtengan mas datos de muestra. mínimo  (media) - 2 * (desviación estándar) máximo  (media) + 2 * (desviación estándar)

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

152

153

Caso I. Si razonamos que los precios de los libros de textos universitario típicamente varían entre US$10 y US$90 dólares. Usted planea estimar el precio de venta medio de un libro de texto universitario. ¿Cuantos libros de textos deberá muestrear si desea tener una confianza del 95% en que la media de la muestra estará a menos de US$2 dólares de la verdadera media de la población ? DATOS:   intervalo/4   (US$90-US$10)/4  US$20 N.C.=95% ===> Z=1.96 E=US$2 dólares n = ²²/(X' - )² n = [(1.96)²*(20)²]/(2)²= n = [/E]² n = [(1.96 * 20)/2]²=

Caso II. Boston Marketing Company lo acaba de contratar para realizar una encuesta con el fin de estimar la cantidad media de dinero que los asistentes al cine de Massachussets gastan (por película). Primero use la regla practica del intervalo para hacer un estimado burdo de la desviación estándar de las cantidades gastadas. Es razonable suponer que las cantidades típicas varían entre US$3 dólares y unos US$15 dólares. Luego utilice esa desviación estándar para determinar el tamaño de muestra que corresponde a una confianza del 98% y a un margen de error de 25 centavos de dólar.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

153

154

Tamaño de la poblacional.

muestra para

estimar la proporción

Si despejamos a "n" de la expresión del margen de error E. E = ()(pq/n) E² = ()²(pq/n)² E² = ()²(pq/n) E²n = ()²(pq) n = [()²(pq)]/E² Cuando se puede obtener un estimado razonable de p utilizando muestras previas, un estudio piloto o los conocimientos de algún experto se utiliza la formula anterior. Cuando no se conoce el estimado puntual p: n = [()²* 0.25]/E² Si no se puede conjeturarse un valor, puede asignarse el valor de 0.5 tanto a p como a q, con lo que el tamaño de muestra resultante será al menos tan grande como necesita ser. La justificación para la asignación de 0.5 es la siguiente: el valor mas alto posible del producto p*q es de 0.25, y ocurre cuando p=0.5 y q=0.5 como se puede observar en la siguiente tabla que usted debe completar: p q p*q 0.1 0.9 0.09 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

154

155

Caso I.

Las compañías de seguros se están preocupando porque el creciente uso de teléfonos celulares esta teniendo como resultado un mayor numero de accidentes automovilísticos, y están considerando implementar tarifas mas altas para conductores que usan tales aparatos. Queremos estimar, con un margen de error de tres puntos porcentuales, el porcentaje de conductores que hablan por teléfono mientras conducen. Suponiendo que queremos tener una confianza del 95% en nuestros resultados, ¿cuantos conductores deberán encuestar? a. Supongamos que tenemos un estimado de p basado en un estudio previo que indico que el 18% de los conductores habla por teléfono (basados en datos de la revista Prevention). b. Suponga que no tenemos información previa que sugiera un posible valor de p. SOLUCION: a) DATOS: p=0.18 q=0.82 N.F.=95% ==> Z=1.96 E=0.03 = tres puntos porcentuales n = [()²(pq)]/E² n = [(1.96)²(0.18*0.82]/(0.03)² n= b) DATOS: N.F.=95% ==> Z=1.96 E=0.03 = tres puntos porcentuales n = [()²* 0.25]/E² n = [(1.96)²* 0.25]/(0.03)² n= Si comparamos estos dos resultados de tamaño de muestra vemos que, si no tenemos conocimiento de un estudio anterior, se requiere una muestra más grande para obtener los mismos resultados que cuando se puede estimar el valor de p. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

155

156

Caso II.

Una compañía de comunicaciones esta considerando un proyecto para prestar servicio telefónico de larga distancia. Se le pide a usted realizar un sondeo de opinión para estimar el porcentaje de los consumidores que esta satisfecho con su servicio telefónico de larga distancia actual. Usted quiere tener una confianza del 90% en que su porcentaje de muestra estará a menos de 2.5 puntos porcentuales del valor real para la población, y un sondeo sugiere que el porcentaje en cuestión anda alrededor del 85%. ¿Que tan grande deberá ser la muestra?

Caso III. Planeta Azul proporciona agua embotellada, en contenedores de 15 galones, a las casas de un sector del Distrito Nacional. El gerente desea estimar el número promedio de contenedores que una casa típica utiliza cada mes. Se toma una muestra de 75 casas y se registra el número de contenedores. La media es 3.2, con una desviación de 0.78. a. ¿Qué revelaría un intervalo de confianza del 92%? b. Sin embargo, el gerente siente que el intervalo anterior es demasiado amplio. ¿Cuántas casas deben tomar como muestra para estar 99% seguro de que el intervalo no estará errado en más de 0.10 contenedores? c. Se selecciona una muestra pequeña de 10 casas para estimar el número promedio de miembros de la familia por casa. Los resultados son 1,3,4,7,2,2,3,5,6 y 6 personas en cada casa. ¿Cuáles son los resultados de un intervalo de 99% para el número promedio de miembros de la familia? d. De las 75 casas de la muestra, 22 tienen ablandadores de agua en casa. ¿Cuál es el estimado del intervalo del 95% de la proporción de todas las casas del sector que tiene ablandadores? e. Si el intervalo oscila entre el 18.8% y el 39.2% de todas las casas que tienen ablandadores y carece de precisión, ¿qué tan grande debe tomarse una muestra para producir un intervalo de sólo el 10%?

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

156

157

Caso IV. Se pidió a 200 personas de una muestra identificar su principal fuente de información de noticias; 110 dijeron que esa fuente es los noticiarios televisivos. a. ¿Cuál es el estimado puntual de la proporción poblacional? b. Determine un intervalo de confianza de 95% para la proporción de las personas en la población que consideran a la televisión como su principal fuente de información noticiosa. Interprete los resultados. a. ¿Qué tamaño debe tener una muestra para estimar la proporción de la población, con un margen de error igual a 0.05 y un nivel de confianza de 95%?

Caso V. Al ensayar un nuevo método de producción, se seleccionaron 18 empleados al azar, y se les pidió lo probaran. La tasa de producción promedio muestral para los 18 empleados fue 80 partes por hora, y la desviación estándar muestral fue de 10 partes por hora. Suponiendo que la población tiene una distribución de probabilidad normal. a. Determine un intervalo de confianza de 90% de la tasa de producción promedio poblacional con el nuevo método, Interprete los resultados y Represente gráficamente. b. Construya un intervalo de confianza de 95% de la tasa de producción promedio poblacional con el nuevo método, Interprete los resultados y Represente gráficamente. c. Construya un intervalo de confianza de 99% de la tasa de producción promedio poblacional con el nuevo método, Interprete los resultados y Represente gráficamente. d. ¿Cuál es estimado puntual de la tasa de producción promedio poblacional con el nuevo método?

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

157

158

Caso VI. Media Metrix, Inc., vigila a los usuarios de Internet en siete países: Australia, Gran Bretaña, Canadá, Francia, Alemania, Japón y Estados Unidos. Según las cifras de medición recientes, los usuarios estadounidenses ocupan el primer lugar en el uso de Internet con un promedio de 13 horas por mes. Suponga que en un estudio de seguimiento en el participaron 145 usuarios de Internet canadienses, la media muestral fue de 10.8 horas por mes y la desviación estándar muestral fue de 9.2 horas. a. Formule las hipótesis nula y alternativa que servirán para determinar si los datos de la muestra sustentan la conclusión de que los usuarios de Internet canadienses tienen una media poblacional menor que el promedio estadounidenses de 13 horas por mes. b. Con un nivel de significancia de 0.01 ¿Cuál es el valor crítico para comprobar la estadística de prueba, y ¿cuál es la regla de rechazo? c. ¿Basado en la estadística de prueba y regla de decisión la información es correcta? d. Interprete los resultados, de sus conclusiones. e. Represente gráficamente la situación.

Caso VII. Una compañía de comunicaciones esta considerando un proyecto para prestar servicio telefónico de larga distancia. Se le pide a usted realizar un sondeo de opinión para estimar el porcentaje de los consumidores que esta satisfecho con su servicio telefónico de larga distancia actual. Usted quiere tener una confianza del 90% en que su porcentaje de muestra estará a menos de 2.5 puntos porcentuales del valor real para la población, y un sondeo sugiere que el porcentaje en cuestión anda alrededor del 85%. ¿Que tan grande deberá ser la muestra?

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

158

159

Estimadores y Estimaciones. Un estimador es el proceso mediante el cual se obtiene la estimación. Una estimación es el resultado numérico del estimador. Estimador: es una estadística de muestra (como la media de muestra) que se usa para aproximar un parámetro de población. Existen dos tipos de estimadores que se utilizan normalmente: - Estimador puntual - Estimador por intervalo Estimado puntual: es un valor individual (o punto) que se usa para aproximar un parámetro de población. Estimador Puntual: utiliza un numero único o valor para localizar una estimación del parámetro. La media de muestra es el mejor estimado de la media de población. Podemos decir que la media de la muestra es un estimador no predispuesto de la media de la población, lo que quiere decir que la distribución de las medias de muestra tiende a centrarse alrededor del valor de la media de la población. (Es decir, las medias de muestra no tienden a sobreestimar sistemáticamente el valor de , y tampoco tienden a subestimar sistemáticamente dicho valor. En vez de ello, tienden a centrarse en el valor de  misma). Estimación por intervalo: especifica el rango dentro del cual esta el parametro desconocido.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

159

160

Intervalo de Confianza: denota un rango dentro del cual puede encontrarse el parámetro. Los Estimadores deben ser: 1) Insesgados 2) Eficientes 3) Consistentes 4) Suficientes Estimador Insesgado. Un estimador es insesgado si la media de su distribución muestral es igual al parámetro correspondiente. E(') =   = al parámetro que se intenta estimar '= estimador E(X') = X" =  E(X') -  = 0 X"= estándar de las medias muestrales. Si E(X') -   0 , si excede  es un estimador sesgado (hacia arriba).

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

160

161

REPASO: Distribuciones de Datos Sesgadas. Una distribución de datos esta sesgada, si no es simétrica y se extiende mas hacia un lado que hacia otro. Sesgo describe la falta de simetría en una distribución.

Los datos sesgados a la izquierda se dice que tienen sesgo negativo; la media y la mediana están a la izquierda de la moda. Generalmente tiene la media a la izquierda de la mediana. Sesgo negativo describe distribuciones asimétricas en la que la mediana excede a la media; la cola de la distribución es hacia los valores bajos. Los datos sesgados a la derecha se dice que tienen sesgo positivo; la media y la mediana están a la derecha de la moda. Sesgo positivo describe distribuciones asimétricas en las que la media excede la mediana; los valores se alargan hacia los valores altos. En ambos casos, la moda es por definición la observación que ocurre con mayor frecuencia, por tanto esta en el pico de la distribución. Coeficiente de Sesgo de Pearson. P = 3 (Media - Mediana) s Si P < 0, los datos están sesgados a la izquierda. Si P > 0, los datos están sesgados a la derecha. Si P = 0, los datos están distribuidos normalmente. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

161

162

Estimador Eficiente. La eficiencia de un estimado depende de su varianza. '1 y '2 son dos estimadores insesgados, pero será un estimador eficiente aquel cuya varianza en muestreo repetidos con un tamaño muestral dado es menor.

Varianza de la Distribución Muestral de las Medias Muestrales: ²x'=(X'-X")²/K Si '1 es un estimador eficiente en relación a '2, la varianza de la distribución muestral de '1 es menor que la de '2. Los valores posibles para '2 están más dispersos. Estimador consistente. Un estimador es consistente si, a medida que n aumenta, el valor del estadístico se aproxima al parámetro. Para que un estimado sea consistente, debe ser insesgado y su varianza debe aproximarse a cero a medida que n aumenta. La varianza de la distribución muestral de las medias muestrales es ²x' es ²/n. A medida que n aumenta, ²x' se aproximara a cero. Por tanto, se puede decir que X' es un estimador consistente de . Estimador suficiente. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

162

163

Un estimador es suficiente si utiliza toda la información relevenate sobre el parámetro contenida en la muestra. Es decir, ningún otro estimador puede proporcionar mas información sobre el parámetro.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

163

164

En secciones anteriores determinamos (1) el estimado puntual, (2) intervalo de confianza y (3) determinamos el tamaño de la muestra para medias y proporciones, en esta sección los aplicaremos a la varianza de población ² o desviación estándar de población . Muchas situaciones reales, como el control de calidad en un proceso de fabricación, requiere estimar valores de varianzas o desviaciones estándar de población. Además de fabricar productos cuyas mediciones producen una media deseada, el fabricante debe elaborar productos con una calidad uniforme que no abarquen toda la gama desde extremadamente buenos hasta extremadamente deficientes. Dado que tal uniformidad a menudo se puede medir por la varianza o la desviación estándar, estas se convierten en estadísticas vitales para mantener la calidad de los productos. Distribución Chi cuadrada En una población distribuida normalmente con varianza ², seleccionamos aleatoriamente muestras independientes de tamaño n y calculamos la varianza de muestras s² para cada muestra. La estadística de muestra ²=(n-1)s²/² tiene una distribución llamada distribución Chi cuadrada. ²=(n-1)s²/² n = tamaño de muestra s²= varianza de muestra ²= varianza de población La distribución Chi cuadrada esta determinada por el numero de grados de libertad, por el momento usaremos n-1 grados de libertad. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

164

165

Propiedades de la Distribución de la estadística Chi cuadrada. 1.- La Distribución Chi cuadrada no es simétrica, a diferencia de las distribuciones normal y t Student (A medida que aumenta el número de grados de libertad, la distribución se vuelve más simétrica). 2.- Los valores de Chi cuadrada pueden ser cero o positivos, pero no pueden ser negativos. 3.- La distribución Chi cuadrada es diferente para cada número de grados de libertad, que es gl=n-1. A medida que aumenta el numero de grados de libertad, la distribución Chi cuadrada se acerca a una distribución normal. Caso I. Usando la tabla H Distribución Chi-cuadrado. Encuentre los valores críticos de ² que determinan regiones criticas que contienen un área de 0.025 en cada cola. Suponga que el tamaño de muestra pertinente es de 10, de modo que el numero de grados de libertad es 10-1=9 Solución: El valor critico de la derecha (²=19.023) se obtiene directamente localizando 9 en la columna de grados de libertad de la izquierda y 0.025 en la fila superior. El valor critico de  ²=2.700 de la izquierda también corresponde a 9 en la columna de grados de libertad, pero es preciso localizar 0.975 (que se obtiene de restar 0.025 a 1) en la fila superior porque los valores de esa fila siempre son áreas a la derecha del valor critico.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

165

166

Al obtener valores críticos de Chi cuadrada de la H Distribución Chi-cuadrado, obsérvese que los números de grados de libertad son enteros consecutivos del 1 al 30, seguidos de 40, 50, 60, 70, 80, 90 y 100. Si no se encuentra en la tabla un numero de grados de libertad (digamos 52), por lo regular puede usarse el valor critico más cercano. Por ejemplo, si el numero de grados de libertad es 52, remítase a la tabla y use 50 grados de libertad. (Si el numero de grados de libertad esta exactamente a la mitad entre dos valores de la tabla, como 55, simplemente calcule la media de los dos valores de ².) Para numeros de grados de libertad mayores que 100, use la ecuación siguiente: ²=1/2 [Z+(2k-1)]² donde k es el numero de grados de libertad. Caso II. Encuentre los valores críticos ²L y ²R que corresponden al grado de confianza y tamaño de muestra dados. 1. 95%;n=26 3. 90%;n=60

2. 99%;n=17 4. 95%;n=50

Estimadores de ². Dado que las varianzas de muestras s² (que se obtienen con la formula s²=[(x-x')²]/(n-1)) tienden a centrarse alrededor del valor de la varianza de la población ², decimos que s² es un estimador no predispuesto de ². Es decir, las varianzas de muestras s² no tienden a sobreestimar sistemáticamente ²; en vez de ello, tienden a centrarse en el valor de ² mismo. Además, los valores s² tienden a producir errores más pequeños al estar mas cerca de ² que otras medidas de variación. Por estas razones, el [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

166

167

valor s² es el mejor valor individual (o estimado puntual) de las diversas estadísticas que podríamos usar para estimar ². La varianza de muestra s² es el mejor estimado puntual de la variación de la población ². Dado que s² es el mejor estimado puntual de ², seria natural esperar que s sea el mejor estimado puntual de , pero no sucede así, porque s es un estimador predispuesto de . Por otra parte, si el tamaño de muestra es grande, la predisposición es tan pequeña que podemos usar s como un estimado razonablemente bueno de . Aunque s² es el mejor estimado puntual de ², no tenemos una indicación de lo bueno que es realmente. Para compensar esta deficiencia, deducimos un estimado de intervalo (o intervalo de confianza) que es mas revelador. Intervalo de confianza (o estimado de intervalo) para la varianza de población ². ²=(n-1)s²/² Despeje: ²=(n-1)s²/² El intervalo de confianza es: (n-1)s²/²R < ² < (n-1)s²/²L

El intervalo de confianza para la desviación estándar se obtiene calculando la raíz cuadrada de cada componente anterior: [(n-1)s²/²R] <  < [(n-1)s²/²L] [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

167

168

Con un área total de  dividida equitativamente entre las dos colas de una distribución Chi cuadrada, ²L denota el valor critico de cola izquierda y ²R denota el valor critico de cola derecha. Los limites de intervalos de confianza para ² y  se deben redondear aplicando la regla de redondeo siguiente: 1. Si usa el conjunto de datos original para construir un intervalo de confianza, redondee los limites del intervalo de confianza a una posición decimal mas que las empleadas en el conjunto de datos original. 2. Si desconoce el conjunto de datos original y solo usa las estadísticas resumidas (n,s), redondee los limites del intervalo de confianza al mismo numero de posiciones decimales que se usan para la desviación estándar o varianza de muestra. Caso I. La Panificadora Pepin produce bizcochos que se empacan en cajas cuyos rótulos dicen contienen 12 bizcochos con un total de 42 onzas. Si la variación entre los bizcochos es demasiado grande, algunas cajas pesaran menos de lo debido (engañando a los clientes) y otras pesaran más (reduciendo las utilidades). El supervisor de control de calidad determino que puede evitar problemas si los bizcochos tienen una media de 3.50 onzas y una desviación estándar de 0.06 onzas o menos. Se seleccionan aleatoriamente doce bizcochos de la línea de producción y se pesan, con los resultados que se dan aquí (en onzas). Construya un intervalo de confianza del 95% para ² y un intervalo de confianza del 95% para , y luego determine si el supervisor de control de calidad esta en problemas. 3.43 3.37 3.58 3.50 3.68 3.61 3.42 3.52 3.66 3.50 3.36 3.42 [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

168

169

Solución: Con base en los datos de muestra, la media de X'=3.504 parece excelente porque esta muy cerca del valor deseado. Los puntajes dados tienen una desviación estándar de s=0.109, que podría parecer mayor que el valor deseado de 0.06 o menos. Procedamos a obtener el intervalo de confianza para ². Con una muestra de 12 puntajes tenemos 11 grados de libertad. Con un grado de confianza del 95%, dividimos =0.05 equitativamente entre las dos colas de la distribución ² y nos remitimos a los valores de 0.975 y 0.025 en la fila superior. Los valores críticos de ² son ²L=3.816 y ²R=21.920. Utilizando estos valores críticos junto con la desviación estándar de muestra s=0.109 y el tamaño de muestra de 12 construimos el intervalo de confianza del 95% evaluando lo siguiente: (n-1)s²/²R < ² < (n-1)s²/²L (12-1)(0.109)²/21.920 algún valor

Caso I. Determinación de valores críticos o zona de no rechazo: Muchos pasajeros de cruceros usan parches cutáneos que suministran dramamina al cuerpo con el fin de evitar el mareo. Se prueba una aseveración respecto a la dosis media con un nivel de significancia de  = 0.05. Las condiciones son tales que es posible usar la distribución normal estándar (porque aplica el teorema del limite central). Encuentre el o los valores críticos de z si la prueba es (a) de dos colas, (b) de cola izquierda y (c) de cola derecha. Represente gráficamente el valor critico y la región critica.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

186

187

Caso II. Baskin-Robbins, la franquicia de helados, afirma que el numero de tiendas que se abre se ha incrementado por encima del promedio semanal de 10.4 experimentado en tiempo de escasez (The Wall Street Journal, febrero de 1997). ¿Existe alguna evidencia para sustentar esta afirmación si 50 semanas muestran una media de 12.5 y una desviación estándar de 0.66 tiendas? La gerencia esta dispuesta a aceptar una probabilidad del 4% de rechazo de la hipótesis nula si esta es cierta. Datos: n=50 semanas X'=12.5 tiendas de la muestra s=0.66 tiendas =4%=0.04 (nivel de significancia) Paso 1: Plantear las hipótesis. La afirmación de que el incremento es por encima del promedio semanal de 10.4 sirve como hipótesis alternativa debido a que  >10.4 no contiene el signo igual. Una prueba de cola a la derecha tiene una zona de rechazo solo en la cola derecha y se da bajo la condición de: Ho:  algún valor Ha: > algún valor Ha: > 10.4 tiendas semanal Ho:  10.4 tiendas semanal Paso 2: Con base en los resultados de la muestra, calcular el valor del estadístico de prueba Z. Para probar la hipótesis, se calcula el estadístico de prueba Z, y se compara con los valores críticos de Z.  = (X' - H)/(/n)  = (X' - H)/(s/n) en donde X' es la media muestral H es el valor de la media poblacional bajo hipótesis nula /n es el error estándar de la distribución muestral [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

187

188

Ho:  10.4 tiendas semanal n=50 semanas X'=12.5 tiendas de la muestra s=0.66 tiendas =4%=0.04 (nivel de significancia)  = (12.5 - 10.4)/(0.66/50)  = 2.1/0.093  = 22.5 Paso 3: Determinar la regla de decisión con base en los valores críticos de Z. El nivel de significancia del 4%. El 50% se resta de 4% para hallar el área de 0.46. En la tabla Z esta área de 0.46 da el valor critico de Z de 1.75. La Regla de Decisión es: "No se rechaza la hipótesis nula sí Z  1.75. Se rechaza sí Z>1.75. Paso 4: Interpretación y conclusiones. El paso final en la prueba de hipótesis es donde cae el valor del estadístico para la muestra y determinar si la hipótesis nula debería rechazarse o no. El valor del estadístico para la muestra produce una Z=22.5 ==> 22.5>1.75 y cae dentro de la zona de rechazo o región critica. Interpretación: La hipótesis nula se rechaza ya que en tiempo de escasez no se abren mas de 10.4 tiendas semanal

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

188

189

Caso III. Según Wall Street Journal (mayo 12 de 1997) muchas compañías de ropa deportiva están tratando de comercializar sus productos entre los mas jóvenes. El articulo sugirió que la edad promedio de los consumidores había caído por debajo de la media de 34.4 años que caracterizo los comienzo de la década. Si una muestra de 1000 clientes reporta una media de 33.2 años y una desviación de 9.4, ¿qué se concluye a un nivel de significancia de del 4%? Datos: n=1000 clientes X'=33.2 años (edad promedio de la muestra de los consumidores de ropa deportiva) s=9.4 años =4%=0.04 (nivel de significancia) Paso 1: Plantear las hipótesis. La afirmación de que la edad de los consumidores estaba por debajo de 34.4 años sirve como hipótesis alternativa debido a que  < 34.44 no contiene el signo igual. Una prueba de cola a la izquierda tiene una zona de rechazo solo en la cola izquierda y se da bajo la condición de: Ho:  algún valor Ha: < algún valor Ha: < 34.4 años (edad promedio de los consumidores de ropa deportiva) Ho:  34.4 años Paso 2: Con base en los resultados de la muestra, calcular el valor del estadístico de prueba Z. Para probar la hipótesis, se calcula el estadístico de prueba Z, y se compara con los valores críticos de Z.  = (X' - H)/(/n)  = (X' - H)/(s/n) en donde [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

189

190

X' es la media muestral H es el valor de la media poblacional bajo hipótesis nula /n es el error estándar de la distribución muestral Ho:  34.4 años n=1000 clientes X'=33.2 años (edad promedio de la muestra de los consumidores de ropa deportiva) s=9.4 años =4%=0.04 (nivel de significancia)  = (33.2 - 34.4)/(9.4/1000)  = -1.2/0.297254  = -4.04 Paso 3: Determinar la regla de decisión con base en los valores críticos de Z. El nivel de significancia del 4%. El 50% se resta de 4% para hallar el área de 0.46. En la tabla Z esta área de 0.46 da el valor critico de Z de 1.75. La Regla de Decisión es: "No se rechaza la hipótesis nula sí Z  1.75. Se rechaza sí Z -4.04 30, las diferencias son tan pequeñas que podemos utilizar los valores críticos de z en lugar de crear una tabla mucho más grande de valores críticos de t. Grados de libertad. El numero de grados de libertad de un conjunto de datos corresponde al numero de puntajes que puede variar después de haber impuestos ciertas restricciones a todos los puntajes. Es el numero de observaciones menos el numero de restricciones impuestas sobre tales observaciones. g.l. = n - 1 Podría parecer un poco extraño que, con una población distribuida normalmente, a veces utilicemos la distribución t para encontrar valores críticos, pero cuando se desconoce  el uso de s de una muestra pequeña incorpora otra fuente de error. A fin de mantener el grado de confianza deseado, compensamos la variabilidad adicional ensanchando el intervalo de confianza mediante un proceso que sustituye el valor critico Z por el valor critico más grande de t. El estadístico t t = (X'-)/(s/n) Prueba de dos colas para  Hay cuatro pasos involucrados en una prueba: Paso 1: Plantear las hipótesis. Paso 2: Con base en los resultados de la muestra, calcular el valor del estadístico de prueba Z. Paso 3: Determinar la regla de decisión con base [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

193

194

en los valores críticos de Z. Paso 4: Interpretación y conclusiones. Caso I Un distribuidor de bebidas plantea la hipótesis de que las ventas por mes promedian US$12,000. Diez meses seleccionados como muestra reportan una media de US$11,277 y una desviación estándar de US$3,772. Si se utiliza un valor  del 5%. ¿Que puede concluir acerca de la impresión que tienen el distribuidor sobre las condiciones del negocio? Ejercicios 33 al 40 Págs. 215-216.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

194

195

El Método de valor P para probar hipótesis. Dado una hipótesis nula y datos de muestra, el valor p refleja la verosimilitud de obtener los valores de muestra en cuestión suponiendo que la hipótesis nula realmente es verdad. Valor P (o valor de probabilidad) es la probabilidad de obtener un valor de la estadística de prueba que será al menos tan extremo como se obtiene a partir de los datos de muestra, suponiendo que la hipótesis es verdad. Valor P es el nivel más bajo de significancia (valor  mínimo) al cual se puede rechazar la hipótesis nula. Es el área en la cola que está más allá del valor del estadístico para la muestra. Los valores P miden la confianza que sentimos al rechazar una hipótesis nula. Por ejemplo, un valor P de 0.0002 nos llevaría a rechazar la hipótesis nula, pero también sugeriría que los resultados de muestra son extremadamente inusitados si el valor que se asegura que tiene  es en realidad correcta. En contraste, dado un valor P de 0.40, no rechazamos la hipótesis nula porque los resultados de muestra podrían ocurrir fácilmente si el valor que se asegura que tiene  si es el correcto. Algunos criterios de decisión basados exclusivamente en el valor P: - Rechazar la hipótesis nula si el valor P es menor que el nivel de significancia, o igual a él. - No rechazar la hipótesis nula si el valor P es mayor que el nivel de significancia.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

195

196

Valor P

Interpretación

Menor que 0.01

Muy significativo estadísticamente Indicios muy claros en contra de la hipótesis nula

0.01 a 0.05

Estadísticamente significativo Suficientes indicios en contra de la hipótesis nula

Mayor que 0.05

Insuficientes indicios en contra de la hipótesis nula

Caso I. A comienzo de los años 90 Sony Corporation introdujo su Play Station de 32 bits en el mercado de los juegos de video. La gerencia esperaba que el nuevo producto incrementara las ventas mensuales en Estados Unidos por encima de los US$283,000,000 que Sony había experimentado en la década anterior. Una muestra de 40 meses reporto una media de US$297,000,000. Se asume una desviación estándar de US$97,000,000. Pruebe la hipótesis nula a un nivel de significancia del 1%. Calcule e interprete el valor p. Datos: n=40 meses X'=US$297,000,000 ventas de la muestra s=US$97,000,000 =1%=0.01 (nivel de significancia) Paso 1: Plantear las hipótesis. La afirmación de que el nuevo producto incrementara las ventas por encima de US$283,000,000 sirve como hipótesis alternativa debido a que  > US$283,000,000 no contiene el signo igual. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

196

197

Una prueba de cola a la derecha tiene una zona de rechazo solo en la cola derecha y se da bajo la condición de: Ho:  algún valor Ha: > algún valor Ha: > US$283,000,000 (ventas mensuales) Ho:  US$283,000,000 (ventas mensuales) Paso 2: Con base en los resultados de la muestra, calcular el valor del estadístico de prueba Z. Para probar la hipótesis, se calcula el estadístico de prueba Z, y se compara con los valores críticos de Z.  = (X' - H)/(/n)  = (X' - H)/(s/n) en donde X' es la media muestral H es el valor de la media poblacional bajo hipótesis nula /n es el error estándar de la distribución muestral Ho:  US$283,000,000 (ventas mensuales) n=40 meses X'=US$297,000,000 ventas de la muestra s=US$97,000,000 =1%=0.01 (nivel de significancia)  = (297,000,000 - 283,000,000)/(97,000,000/40)  = 14,000,000/15,337,047.42  = 0.91 El valor Z para el nivel de insignificancia de 1% se obtiene en la tabla después de restar 0.5-0.01= 0.49, el cual corresponde a 2.33 [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

197

198

Paso 3: Determinar la regla de decisión con base en los valores críticos de Z. En la tabla Z el valor Z de 0.91 tiene el área de 0.3186. Por lo tanto el: valor P = 0.5 - 0.3186 = 0.1814 La Regla de Decisión es: - Rechazar la hipótesis nula si el valor P es menor que el nivel de significancia, o igual a él. - No rechazar la hipótesis nula si el valor P es mayor que el nivel de significancia. Paso 4: Interpretación y conclusiones. El paso final en la prueba de hipótesis es donde cae el valor del estadístico para la muestra y determinar si la hipótesis nula debería rechazarse o no. Como el valor de significancia es menor que 0.1814 para la muestra de Z=0.91 cae en la zona de no rechazo. Interpretación: La hipótesis nula no se rechaza. Ejercicios 27 al 32 Pág. 213.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

198

199

Caso II. En el verano de 1997, el Congreso de USA aprobó un presupuesto federal que contenía varias partidas para reducciones de impuestos. Los analistas afirmaron que ahorraría al contribuyente promedio US$800.00 dólares. Una muestra de 500 contribuyentes demostró una reducción promedio en los impuestos de US$785.10 con una desviación estándar de US$277.70. Pruebe la hipótesis a un nivel de significancia del 5%. Calcule e Interprete el valor p. Datos: n= 500 contribuyentes X'=US$785.10 s=US$277.70 =5%=0.05 (nivel de significancia) Paso 1: Plantear las hipótesis. Ha: = US$800.00 Ho:  US$800.00 Paso 2: Con base en los resultados de la muestra, calcular el valor del estadístico de prueba Z.  = (X' - H)/(/n)  = (X' - H)/(s/n)  = (785.10 – 800.00)/(277.70/500)  = -14.9/12.42  = - 1.20 El valor Z para el nivel de insignificancia de 5% se divide entre dos. Se obtiene en la tabla el valor de Z = 1.96.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

199

200

Paso 3: Determinar la regla de decisión con base en los valores críticos de Z. En la tabla Z, el valor Z de 1.20 tiene el área de 0.3849. Por lo tanto el: 0.5 - 0.3849 = 0.1151 valor P = 2 * 0.1151 = 0.2302 La Regla de Decisión es: - Rechazar la hipótesis nula si el valor P es menor que el nivel de significancia, o igual a él. - No rechazar la hipótesis nula si el valor P es mayor que el nivel de significancia. Paso 4: Interpretación y conclusiones. El paso final en la prueba de hipótesis es donde cae el valor del estadístico para la muestra y determinar si la hipótesis nula debería rechazarse o no. Como el valor de significancia es menor que 0.2302 para la muestra de Z = -1.20 cae en la zona de no rechazo. Interpretación: La hipótesis nula no se rechaza. Ejercicios 27 al 32 Pág. 213.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

200

201

Caso III. Forbes (Septiembre 1996) reportó que Freddie Maman, representante de la cantante de pop Madonna, estimó que las ventas diarias de su nuevo álbum excedería las de su éxito más grande de 1994, Like a Virgin, el cual tuvo un promedio de ventas de 27,400 copias.

¿Freddie está en lo cierto a un nivel de

significancia del 10% si 50 observaciones (días) poseen un media de 28,788 copias con una desviación estándar de 3,776? Calcule e interprete el valor p. Y Represente gráficamente incluyendo el valor P. Caso IV. La Asociación Internacional de Transporte Aéreo pide a los viajeros de negocios que califiquen los aeropuertos internacionales trasatlánticos. La calificación máxima posible es 10.

Una revista dedicada a los viajes desea clasificar a los

aeropuertos según la calificación que reciben. De los que tienen una calificación de media de población de 7 ó más se consideran que ofrecen un servicio superior. Suponga que a una muestra aleatoria de 12 viajeros se les pidió calificar al aeropuerto Heathrow de Londres, y que las calificaciones obtenidas son 7, 8, 10, 8, 6, 9, 6, 7, 7, 8, 9 y 8. Suponiendo que la población de calificaciones se puede aproximar con una distribución normal, ¿puede decirse que Heathrow ofrece un servicio superior? Usando un nivel de significancia de 0.05, necesitamos una prueba que determine si la media de la población de calificaciones para el aeropuerto es mayor de 7. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

201

202

Pruebas con dos Poblaciones Estimación con muestras grandes Intervalo de confianza para la diferencia entre dos medias poblacionales para muestras grandes:

I.C. para (µ1-µ2) = (X’1 – X’2) ± Zσx’1-x’2 Error Estándar de las diferencias entre medias muestrales:

σx’1-x’2 = √ (σ12/n1) + (σ22/n2) Estimación del error estándar de la diferencia entre medias muestrales:

sx’1-x’2 = √ (s12/n1) + (s22/n2) Intervalo de confianza cuando las varianzas son desconocidas:

I.C. para (µ1-µ2) = (X’1 – X’2) ± Zsx’1-x’2 Caso I. Vimenca transporta remesas entre Santo Domingo y Samana por dos rutas. Una muestra de 100 camiones enviados por la ruta del Este reveló un tiempo promedio de tránsito X’este=17.2 horas con una desviación estándar Seste=5.3 horas, mientras que 75 camiones que utilizan la ruta Norte necesitaron un promedio de X’norte=19.4

horas

con

una

desviación

estándar

de

Snorte=4.5horas. El transportador de Vimenca, desea desarrollar un intervalo de confianza del 95% para la diferencia en el tiempo promedio entre estas dos rutas alternas. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

202

203

N este = 100 camiones

Nnorte= 75 camiones

X’este = 17.2 horas

X’norte= 19.4 horas

Seste = 5.3 horas

Snorte= 4.5 horas

N.C. 95% RUTA X' S N

ESTE 17.2 5.3 100

NORTE 19.4 4.5 75

UNIDADES HORAS HORAS CAMIONES

Debido a que las desviaciones poblacionales son desconocidas, el error estándar es:

sx’1-x’2 = √ (s12/n1) + (s22/n2) sx’1-x’2 = √ (5.32/100) + (4.52/75) sx’1-x’2 = √ (0.2809) + (0.27) sx’1-x’2 = 0.7422 Intervalo de confianza cuando las varianzas son desconocidas:

I.C. para (µ1-µ2) = (X’1 – X’2) ± Zsx’1-x’2 I.C. para (µ1-µ2) = (17.2 – 19.4) ± (1.96)(0.7422) I.C. para (µ1-µ2) = – 2.2 ± 1.4547 -3.7 ≤ (µ1-µ2) ≤ -0.75 horas El transportador puede tener un 95% de confianza en que la ruta del norte toma entre 0.75 horas y 3.7 horas más.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

203

204

Pruebas con dos Poblaciones Estimación con muestras pequeñas con varianzas poblacionales iguales Estimado mancomunado de la varianza común a ambas poblaciones:

Sp2 = s12 (n1 - 1) + s22 (n2 - 1) n1 + n2 – 2 Intervalo de confianza para la diferencia entre medias poblacionaes cuando σ12 = σ22 desconocidas:

I.C. para (µ1-µ2) = (X’1 – X’2) ± t √ (sp2/n1) + (sp2/n2) Caso II. En la cafetería de los estudiantes de PUCMM, una máquina expendedora de bebidas dispensa bebidas en tazas de papel. Una muestra de 15 tazas da una media de 15.3 onzas con una varianza de 3.5. Después de ajustar la máquina, una muestra de 10 tazas produce un promedio de 17.1 onzas con una varianza de 3.9. Si se asume que s2 (varianza) es constante antes y después del ajuste, construya un intervalo de confianza del 95% para la diferencia entre los contenidos promedio de llenado. Se asume que las cantidades dispensandas están distribuidas normalmente. Entonces, N1 = 15 tasas

N2 = 10 tazas

X’1 = 15.3 onzas

X’2 = 17.1 onzas

S12 = 3.5 onzas

S22 = 3.9 onzas [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

204

205

TIPO X' S2 N

llenado 1 15.3 3.5 15

llenado 2 UNIDADES 17.1 ONZAS 3.9 ONZAS 10 TAZAS

Sp2 = s12 (n1 - 1) + s22 (n2 - 1) n1 + n2 – 2 Sp2 = 3.5 (15 - 1) + 3.9 (10 - 1) 15 + 10 – 2 Sp2 = 3.66 Intervalo de confianza para la diferencia entre medias poblacionaes cuando σ12 = σ22 desconocidas: Con un α = 0.05 (un nivel de confianza del 95%) y n1 + n2 – 2 = 23 g.l., la tabla t indica un valor de 2.069.

I.C. para (µ1-µ2) = (X’1 – X’2) ± t √ (sp2/n1) + (sp2/n2) I.C. para (µ1-µ2) = (15.3 – 17.1) ± 2.069 √ (3.66/15) + (3.66/10) I.C. para (µ1-µ2) = – 1.8 ± 1.61

-3.41 ≤ (µ1-µ2) ≤ -0.19 onzas Se puede tener un nivel de confianza del 95% en que el ajuste incrementó el nivel del contenido entre 0.19 onzas y 3.41 onzas.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

205

206

Pruebas con dos Poblaciones Estimación con muestras pequeñas con varianzas poblacionales desiguales Grados de libertad cuando las varianzas poblacionales non son iguales.

(s12/n1 + s22/n2)2______

g.l. =

(s12/n1) 2 / (n1- 1) + (s22/n2) 2 / (n2- 1) Intervalo para la diferencia entre medias poblacionales:

I.C. para (µ1-µ2) = (X’1 – X’2) ± t √ (s12/n1) + (s22/n2) Caso III.

El Listin Diario describió dos programas de

entrenamiento utilizados por GBM Dominicana. Doce ejecutivos a quienes se les dio primer tipo de entrenamiento obtuvieron un promedio de 73.5 en la prueba de competencia.

Aunque el

artículo de noticias no reportó la desviación estándar para estos 12 empleados, se asume que la varianza en los puntajes parae este grupo fue de 100.2. Quince ejecutivos a quienes se les administró el sugundo programa de entrenamiento obtuvieron un promedio 79.8. Se asume una varianza de 121.3 para este segundo grupo. Haga un intervalo de confianza del 95% para la diferencia en los puntajes promedio para todos los ejecutivos que ingresaron a estos programas: N1 = 12 ejecutivos

N2 = 15 ejecutivos

X’1 = 73.5 puntos

X’2 = 79.8 puntos

S12 = 100.2 puntos

S22 = 121.3 puntos

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

206

207

TIPO X' S N

PROGRAM 1 PROGRAM 2 UNIDADES 73.5 79.8 EJECUTIVOS 100.2 121.3 PUNTOS 12 15 PUNTOS

Grados de libertad cuando las varianzas poblacionales non son iguales. g.l. =

(s12/n1 + s22/n2)2______ (s12/n1) 2 / (n1- 1) + (s22/n2) 2 / (n2- 1)

g.l. =

(100.2/12 + 121.3/15)2______ = 24.55 (100.2/12)2 / (12-1) + (121.3/15) 2 / (14-1)

Si g.l. es fraccionario, se aproxima hacia abajo, hacia el entero inmediatamente anterior. G.L. = 24. Con un α = 0.05 (un nivel de confianza del 95%) y g.l. = 24, la tabla t indica un valor de 2.064. Intervalo para la diferencia entre medias poblacionales:

I.C. para (µ1-µ2) = (X’1 – X’2) ± t √ (s12/n1) + (s22/n2) I.C. para (µ1-µ2) = (73.5 – 79.8) ± 2.064√ (100.2/12) + (121.3/15) I.C. para (µ1-µ2) = - 6.3 ± 8.36

-14.66 ≤ (µ1-µ2) ≤ 2.06 puntos Debido a que el intervalo contiene cero, no existe una fuerte evidencia de que exista diferencia alguna en la efectividad de los programas de entrenamiento.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

207

208

Pruebas con dos Poblaciones Intervalos de confianza para la diferencia entre dos Proporciones Error Estándar de la diferencia entre dos proporciones muestrales:

Sp1-p2 = √(p1(1-p1))/n1) + p2(1-p2))/n2) Intervalo para la diferencia entre proporciones poblacionales:

I.C. para π1 – π2 = (p1 – p2) ± (Z) Sp1-p2 Caso IV. Una empresa realiza un estudio para determinar si el ausentismo de los trabajadores en el turno del día es diferente al de los trabajadores del turno de la noche. Se realiza una comparación de 150 trabajadores de cada turno. Los resultados muestran que 37 trabajadores diurnos han estado ausentes por lo menos cinco veces durante el ano anterior, mientras que 52 trabajadores nocturnos han faltado por lo menos cinco veces. ¿Qué revelan estos datos sobre la tendencia al ausentismo entre los trabajadores? Calcule un intervalo de confianza del 90% para la diferencia entre las proporciones de trabajadores de los dos turnos que faltaron cinco veces o más. N turno día = 150

p1 = 37/150 = 0.25

N turno noche = 150

p2 = 52/150 = 0.35

Error Estándar de la diferencia entre dos proporciones muestrales: Sp1-p2 = √(0.25*0.75/150) + (0.35*0.65/150) = 0.0526 [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

208

209

Intervalo para la diferencia entre proporciones poblacionales:

I.C. para π1 – π2 = (p1 – p2) ± (Z) Sp1-p2 I.C. para π1 – π2 = (0.25 – 0.35) ± (1.65) (0.0526) I.C. para π1 – π2 = – 0.10 ± 0.087

-18.7% ≤ (π1 – π2) ≤ - 1.3% La empresa puede estar 90% segura de que la proporción de trabajadores nocturnos ausentes en cinco o más oportunidades está entre 1.3% y 18.7% más alta que los del turno diurno. Pruebas de Hipótesis para dos medias con muestras independientes Hay cuatro pasos involucrados en una prueba: Paso 1: Plantear las hipótesis. Ho:1 = 2 Ha:1  2 O el equivalente Ho:1 - 2 = 0 Ha:1 - 2  0 Paso 2: Con base en los resultados de la muestra, calcular el valor del estadístico de prueba Z o t. Z = (X’1-X’2) – (µ1-µ2) SX’1-X’2 Paso 3: Determinar la regla de decisión con base en los valores críticos de Z o t. Paso 4: Interpretación y conclusiones.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

209

210

Caso V. Weaver Ridge Golf Course desea ver si el tiempo promedio en horas que requieren los hombres para jugar los 18 hoyos es diferente al de las mujeres.

Se mide el tiempo de cincuenta

partidos dobles de hombres y 45 de mujeres obteniendo, pruebe a nivel de confianza del 95%: SEXO X' S N

HOMBRES MUJERES 3.5 4.9 0.9 1.5 50 45

Paso 1: Plantear las hipótesis. Ho:1 = 2 Ha:1  2 Paso 2: Con base en los resultados de la muestra, calcular el valor del estadístico de prueba Z o t. Z = (X’1-X’2) – (µ1-µ2) SX’1-X’2 Estimación del error estándar de la diferencia entre medias muestrales:

sx’1-x’2 = √ (s12/n1) + (s22/n2) sx’1-x’2 = √ (0.92/50) + (1.52/45) = 0.257 Z = (3.5-4.9) – (0) 0.257 Z = - 5.45

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

210

211

Paso 3: Determinar la regla de decisión con base en los valores críticos de Z o t. Si α = 0.05 (con un nivel de confianza del 95%), el valor crítico de Z es ± 1.96. Regla de decisión: “No rechazar Z si esta entre ± 1.96. Rechazar si Z es menor que -1.96 o mayor que 1.96”. La Ho se rechaza porque la Z de la estadística de prueba es menor que – 1.96 de la Regla de Decisión. Paso 4: Interpretación y conclusiones. La evidencia sugiere que las mujeres toman más tiempo en promedio. Vale la pena notar también que el valor p relacionado con la prueba es virtualmente cero. Pruebas de Hipótesis para dos medias con muestras pequeñas con varianzas iguales Prueba de hipótesis con muestras pequeñas cuando σ22 = σ22 (desconocidas): t = (X’1-X’2) – (µ1-µ2) √ (sp2/n1) + (sp2/n2)

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

211

212

Caso VI. Las negociaciones salariales entre su empresa y el sindicato de sus trabajadores están a punto de romperse. Existe un desacuerdo considerable sobre el nivel salarial promedio de los trabajadores en la planta de Atlanta y en la planta de Newport News, Virginia. Los salarios fueron fijados por el antigua acuerdo laboral de hace tres anos y se basan estrictamente en la antigüedad. Debido a que los salarios están controlados muy de cerca por el contrato laboral, se asume que la variación en los salarios es la misma en ambas plantas y que los salarios están distribuidos normalmente. Sin embargo, se siente que existe una diferencia entre los niveles salariales promedio debido a los patrones de antigüedad diferentes entre las dos plantas. El negociador laboral que representa a la gerencia desea que usted desarrolle un intervalo de confianza del 98% para estimar la diferencia entre los niveles salariales promedio. Si existe una diferencia en las medias, deben hacerse ajustes para hacer que los salarios más bajos alcancen el nivel de los más altos.

Dados los siguientes datos, ¿qué ajustes se

requieren, si es el caso? Las muestras de trabajadores tomadas de cada planta revelan la siguiente información: Planta de Atlanta

Planta de Newport News

N1 = 23 empleados

N2 = 19 empleados

X’1 = US$17.53 por hora

X’2 = US$15.5 por hora

S12 = 92.10

S22 = 87.10 [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

212

213

PLANTA ATLANTA NEWPORT NEW UNIDADES X' 17.53 15.5 TRABAJADORES S2 92.1 87.1 US$/HORA N 23 19 US$/HORA

Paso 1: Plantear las hipótesis. Ho:1 = 2 Ha:1  2 Paso 2: Con base en los resultados de la muestra, calcular el valor del estadístico de prueba Z o t. t = (X’1-X’2) – (µ1-µ2) √ (sp2/n1) + (sp2/n2)

Estimado mancomunado de la varianza común a ambas poblaciones: Sp2 = s12 (n1 - 1) + s22 (n2 - 1) n1 + n2 – 2 Sp2 = 92.10 (23 - 1) + 87.10 (19 - 1) 23 + 19 – 2 Sp2 = 89.85 t = (17.53-15.5) – (0) √ (89.85/23) + (89.85/19)

t = 0.69

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

213

214

Paso 3: Determinar la regla de decisión con base en los valores críticos de Z o t. Si α = 0.02 (con un nivel de confianza del 98%), g.l. = n1 + n2 – 2 = 23+19-2 = 40, el valor crítico de t es ± 2.423. Regla de decisión: “No rechazar t si esta entre ± 2.423. Rechazar si t es menor que -2.423 o mayor que 2.423”. La Ho se acepta porque la t de la estadística de prueba está dentro del rango ± 2.423 de la Regla de Decisión. Paso 4: Interpretación y conclusiones. Parece que no hay diferencia en el salario promedio.

Esta

conclusión se confirma por el hecho de que intervalo contenía cero.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

214

215

Pruebas de Hipótesis para dos medias con muestras pequeñas con varianzas desiguales Prueba de hipótesis con muestras pequeñas cuando σ22 ≠ σ22: t = (X’1-X’2) – (µ1-µ2) √ (s21/n1) + (s22/n2)

Caso VII. Un negocio vende dos tipos de amortiguadores de caucho para coches de bebés.

Las pruebas de desgaste para medir la

durabilidad revelaron que 13 amortiguadores de tipo 1 duraron un promedio de 11.3 semanas, con una desviación estándar de 3.5 semanas; mientras que 10 del tipo 2 duraron un promedio de 7.5 semanas, con una desviación estándar de 2.7 semanas. El tipo 1 es más costoso para fabricar y el CEO (Director Ejecutivo) de Acme no desea utilizarlo a menos que tenga un promedio de duración de por lo menos ocho semanas más que el tipo 2. El CEO tolerará una probabilidad de error de sólo el 2%. No existe evidencia que sugiera que las varianzas de la duración de los dos productos sean iguales. N1 = 13 amortiguadores

N2 = 10 amortiguadores

X’1 = 11.3 semanas

X’2 = 7.5 semanas

S1 = 3.5 semanas

S2 = 2.7 semanas

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

215

216

Paso 1: Plantear las hipótesis. Ho:1 = 2 Ha:1  2 Paso 2: Con base en los resultados de la muestra, calcular el valor del estadístico de prueba Z o t. t = (X’1-X’2) – (µ1-µ2) √ (s21/n1) + (s22/n2)

t = (11.3-7.5) – (0) √ (3.5/13) + (2.7/10)

t = 2.94 Paso 3: Determinar la regla de decisión con base en los valores críticos de Z o t. Si α = 0.02 (con un nivel de confianza del 98%) Grados de libertad cuando las varianzas poblacionales non son iguales. g.l. =

(s12/n1 + s22/n2)2______ (s12/n1) 2 / (n1- 1) + (s22/n2) 2 / (n2- 1)

g.l. =

(3.52/13 + 2.72/10)2______ (3.52/13) 2 / (13- 1) + (2.72/10) 2 / (10- 1)

g.l. = 20.99 = 20 el valor crítico de t es ± 2.528.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

216

217

Regla de decisión: “No rechazar t si esta entre ± 2.528. Rechazar si t es menor que -2.528 o mayor que 2.528”. La Ho no se acepta porque la t de la estadística de prueba es mayor que 2.528 de la Regla de Decisión. Paso 4: Interpretación y conclusiones. La evidencia sugiere que el tipo 1 de amortiguador de caucho para coche de bebé presenta mayor durabilidad.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

217

218

Pruebas de Hipótesis para la diferencia entre dos proporciones

Z = (p1 – p2) - (π1 – π2) Sp1-p2 Error Estándar de la diferencia entre dos proporciones muestrales:

Sp1-p2 = √(p1(1-p1))/n1) + p2(1-p2))/n2) Caso VIII. Un minosta desea probar la hipótesis de que la proporción de sus clientes masculinos, quienes compran a crédito, es igual a la proporción de las mujeres que utilizan el crédito. Él selecciona 100 clientes hombres y encuentra que 57 compraron a crédito miestras que 52 de las 110 mujeres lo hicieron. Pruebe a un nivel del 1%. Paso 1: Plantear las hipótesis. Ho:π1 = π2 Ha:π1  π2 Paso 2: Con base en los resultados de la muestra, calcular el valor del estadístico de prueba Z o t. p1 = 57/100 = 0.57 hombres p2 = 52/110 = 0.473 mujeres

Z = (p1 – p2) - (π1 – π2) Sp1-p2 Error Estándar de la diferencia entre dos proporciones muestrales: [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

218

219

Sp1-p2 = √(p1(1-p1))/n1) + p2(1-p2))/n2) Sp1-p2 = √(0.57 * 0.43/100) + (0.473 *0.527/110) Sp1-p2 = 0.069 Z = (0.57 – 0.473) – 0 0.069 Z = 1.41 Paso 3: Determinar la regla de decisión con base en los valores críticos de Z o t. Si α = 0.01 (con un nivel de confianza del 99%), el valor crítico de Z es ± 2.58. Regla de decisión: “No rechazar Z si esta entre ± 2.58. Rechazar si Z es menor que -2.58 o mayor que 2.58”. La Ho no se rechaza porque la Z de la estadística está dentro del rango de ± 2.58 de la Regla de Decisión. Paso 4: Interpretación y conclusiones. El minorista no puede concluir a un nivel del 1% que las proporciones de hombres y mujeres que compran a crédito difieren.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

219

220

Pruebas no paramétricas En la practica, surgen muchas situaciones en las cuales simplemente no es posible hacer de forma segura ningún supuesto sobre el valor de un parámetro o sobre la forma de la distribución poblacional. Mas bien se deben utilizar otras pruebas que no dependan de un solo tipo de distribución o de valores de parámetros específicos. Estas pruebas se denominan Pruebas no paramétricas o libres de distribución. Pruebas no paramétricas. Son procedimientos estadísticos que pueden utilizarse para contrastar hipótesis cuando no son posibles los supuestos respecto a los parámetros o a las distribuciones poblacionales. Experimento multinomial. Es un experimento que satisface las siguientes condiciones. 1. El numero de ensayos es fijo. 2. Los ensayos son independientes. 3. Todos los resultados de ensayos individuales se deben clasificar en una y sólo una de varias categorías distintas. 4. Las probabilidades de las diferentes categorías se mantienen constantes para cada ensayo. Distribución Chi-cuadrado Las dos aplicaciones más comunes de Chi-cuadrado son: 1. Pruebas de bondad de ajuste. 2. Pruebas de independencia.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

220

221

Prueba de bondad de ajuste. Sirve para probar la hipótesis de que una distribución de frecuencia observada se ajusta a (o concuerda con) alguna distribución propuesta. Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma de distribución particular planteada como hipótesis. Si el ajuste es razonablemente cercano, puede concluirse que si existe la forma de distribución planteada como hipótesis. Por ejemplo, se puede plantear la hipótesis que la distribución poblacional es uniforme y que todos los valores posibles tienen la misma probabilidad de ocurrir. Las hipótesis que se probarían son: Ho: La distribución poblacional es uniforme. Ha: La distribución poblacional no es uniforme. Si existe una gran diferencia entre lo que realmente se observa en la muestra y lo que se esperaría observar si la hipótesis nula fuera correcta, en tal caso es menos probable que la hipótesis nula sea verdadera. Es decir, la hipótesis nula debe rechazarse cuando las observaciones obtenidas en la muestra difieren mucho del patrón que se espera que ocurra si la distribución planteada como hipótesis si se presenta. En las pruebas de bondad de ajuste usaremos la siguiente notación: Oi representa la frecuencia observada de un resultado. E representa la frecuencia esperada de un resultado. k representa el numero de diferentes categorías o resultados. n representa el numero de ensayos total. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

221

222

La prueba Chi-cuadrado tiene k-m-1 grados de libertad, en donde m es el numero de parámetros a estimar. En muchos casos, podemos determinar una frecuencia esperada multiplicando la probabilidad p de una categoría por el numero de ensayos distintos n: E = np Por ejemplo, si probamos la aseveración de que un dado es equitativo lanzándolo 60 veces, tendremos n = 60 (porque hay 60 ensayos) y p = 1/6 (porque un dado es equitativo sí los seis posibles resultados son igualmente probables, con la misma probabilidad de 1/6). Por tanto, la frecuencia esperada para cada categoría o celda es: E = np E = 60(1/6) = 10 Supuestos. Los supuestos siguientes aplican cuando probamos una hipótesis de que la proporción de población para cada una de las k categorías (de un experimento multinomial) es la que se asegura. 1. Los datos constituyen una muestra aleatoria. 2. Los datos de muestra consisten en conteos de frecuencia para las k diferentes categorías. 3. Para cada una de las k categorías, la frecuencia esperada es por lo menos 5. La prueba de Chi-cuadrado de bondad de ajuste es confiable solo si todo Ei es por lo menos 5. Estadística de prueba para pruebas de bondad del ajuste en experimentos multinomiales. ²=[(Oi-Ei)/Ei] [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

222

223

Valores Críticos. 1. Los valores críticos se encuentran en la tabla de Chi-cuadrado usando k-1 grados de libertad, donde k es el numero de categorías. 2. Las pruebas de hipótesis de bondad del ajuste siempre son de cola derecha. La forma de la estadística de prueba ² es tal que una concordancia cercana entre los valores observados y los esperados produce un valor pequeño de ². Un valor grande de ² indica una fuerte discrepancia entre los valores observados y los esperados. Por tanto, un valor significativamente alto de ² hará que se rechace la hipótesis nula de que no hay diferencia entre las frecuencias observadas y esperadas. Entonces, la prueba es de cola derecha porque el valor critico y la región critica se encuentran a la extrema derecha de la distribución. A diferencia de pruebas de hipótesis previas en las que teníamos que determinar si la prueba era de cola izquierda, de cola derecha o de dos colas, todas estas pruebas de bondad del ajuste son de cola derecha.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

223

224

Caso I. Jennifer Calcaño gerente de crédito del BHD, en la torre Principal en Santo Domingo, trata de seguir una política de extender un 60% de sus créditos a empresas comerciales, un 10% a personas naturales y un 30% a prestatarios extranjeros. Para determinar si la política se estaba siguiendo, José Rondón, vicepresidente de mercadeo, selecciona 85 créditos que se aprobaron recientemente. Encuentra que 62 de tales créditos se otorgaron a negocios, 10 a personas naturales, y 13 a prestatarios extranjeros. Al nivel del 10%, ¿parece que el patrón de cartera deseado se preserva? Pruebe la hipótesis de que: Ho: Se mantuvo el patrón deseado: 60% son créditos comerciales, 10% son prestamos personales y 30% son créditos extranjeros. Ha: El patrón deseado no se mantuvo. Tabla de Tipo de Crédito. Tipo de Credito

Oi

Ei

Comercial

62,00

51,00

Personal

10,00

8,50

Extranjero

13,00

25,50

Total

85,00

85,00

Estadística de prueba para pruebas de bondad del ajuste en experimentos multinomiales. El valor ² es ²=[(Oi-Ei)²/Ei] ²=[(62-51)²/51]+[(10-8.5)²/8.5]+[(13-25.5)²/25.5] = 8.76

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

224

225

Valores Críticos. 1. Los valores críticos se encuentran en la tabla de Chi-cuadrado usando k-1 grados de libertad, donde k es el numero de categorías. 2. Las pruebas de hipótesis de bondad del ajuste siempre son de cola derecha. Con un  = 10% y k = 3 categorías de crédito (comerciales, privados y extranjeros), existen k-m-1= 3-0-1=2 grados de libertad, el valor critico es ² 0.10,2 = 4.605 Regla de decisión: "No rechazar la hipótesis nula ²  4.605. Rechazar sí la hipótesis nula ² > 4.605.

Interpretación. Las diferencias entre lo que el VP José Rondón observo y lo que esperaba observar si el patrón de crédito deseado se alcanzaba era demasiado grande como para ocurrir por simple azar. Existe solo un 10% de probabilidad de que una muestra de 85 créditos seleccionados aleatoriamente pudieran producir las frecuencias observadas aquí demostradas, si el patrón deseado en la cartera de crédito del banco se estuviera manteniendo.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

225

226

Caso II. Prueba de normalidad. Las especificaciones para la producción de tanques de aire utilizados en inmersión requieren que los tanques se llenen a una presión de 600 libras por pulgadas cuadradas (psi). Se permite una desviación de 10 psi. Las especificaciones de seguridad permiten una distribución normal en los niveles de llenado. Usted acaba de ser contratado por Aqua Lung, un importante fabricante de equipos de inmersión. Su primera tarea es determinar si los niveles de llenado se ajustan a una distribución normal. Aqua Lung esta seguro de que media de 600 psi y la desviación estándar de 10 psi prevalecen. En este esfuerzo se miden n=1000 tanques y se halla la distribución presentada en la siguiente tabla. Sus hipótesis son: Ho: Los niveles de llenado están distribuidos normalmente. Ha: Los niveles de llenado no están distribuidos normalmente. Tabla de llenado para los tanques de buceo.

Frecuencia Probabilidades PSI

Real Oi

0 y por debajo de 580

20

580 y por debajo de 590

142

590 y por debajo de 600

310

600 y por debajo de 610

370

610 y por debajo de 620

128

6200 y por encma

30

Totales

1000

pi

Frecuencias Esperadas Ei

O-E

(O-E)^2

[(O-E)^2]/E

Determine la probabilidad para cada clase mediante la formula Z y complete la tabla de probabilidades y frecuencias esperadas.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

226

227

Valor Critico. Se desea probar la hipótesis al nivel del 5%. Debido a que tanto la media poblacional como la desviación estándar son dadas y no tienen que estimarse, m = 0. Existe k = 6 clases en la tabla de frecuencias, de manera que los grados de libertad son k-1=5. Se encuentra que el valor critico es ² 0.05,5 =11.07 Regla de decisión: "No rechazar la hipótesis nula si ² es menor que 11.07. Rechazar la hipótesis nula si ² es mayor que 11.07" Estadística de prueba para pruebas de bondad del ajuste en experimentos multinomiales. Determine el valor ² ²=[(Oi-Ei)/Ei]

Interpretación: Si la hipótesis nula se acepta. Las diferencias entre lo que se observo y lo que se espera observar si los contenidos estuvieran distribuidos normalmente con una media de 600 y una desviación estándar de 10 pueden atribuirse al error de muestreo. Si la media poblacional y la desviación estándar no fueran conocidas, se hubieran tenido que estimar de los datos muestrales de la tabla. Entonces m=2, y los grados de libertad serian k-2-1 o 6-2-1=3.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

227

228

Tablas de contingencia. Una prueba de independencia. Tabla de Contingencia o tabla de frecuencia bidireccional. Es una tabla en la que las frecuencias corresponden a dos variables. (Se utiliza una variable para clasificar las filas y otra para clasificar las columnas). Las tablas contingencias son aquellas que sirven para comparar dos variables. Prueba de independencia. Una prueba de independencia prueba la hipótesis nula de que la variable de fila y la variable de columna de una tabla de contingencia no están relacionadas. (La hipótesis nula es la declaración de que las variables de fila y de columna son independientes.) Es muy importante reconocer que, en este contexto, la palabra contingencia se refiere a dependencia, pero solo se trata de una dependencia estadística y no puede usarse para establecer un vinculo directo de causa y efecto entre las dos variables en cuestión. Supuestos. Al probar la hipótesis nula de independencia entre las variables de fila y de columna de una tabla de contingencia, aplican los supuestos siguientes (Obsérvese que estos supuestos no exigen que la población padre tenga una distribución normal ni alguna otra distribución especifica.) 1. Los datos de muestra se escogen aleatoriamente. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

228

229

2. La hipótesis nula Ho es la declaración de que las variables de fila y de columna son independientes; la hipotesis alternativa Ha es la declaracion de que las variables de fila y de columna son dependientes. 3. Para cada celda de la tabla de contingencia, la frecuencia esperada E es de por lo menos 5. Estadística de prueba para prueba de independencia. El valor ² es

²=[(Oi-Ei)/Ei]

Valores críticos. 1. Los valores críticos se encuentran en la tabla usando: grados de libertad = (r-1)(c-1) 2. Las pruebas de independencia con tablas de contingencia solo implican regiones criticas de cola derecha. Frecuencia esperada para una tabla de contingencia. Frecuencia esperada columna)]/Gran Total

(E)=

[(Total

de

fila)*(Total

de

La estadística de prueba nos permite medir el grado de discrepancia entre las frecuencias observadas y las que esperaríamos en teoría si las dos variables son independientes. Valores pequeños de la estadística de prueba ² indican coincidencia entre las frecuencias observadas y las frecuencias esperadas con variables de fila y de columna independientes. Los valores grandes de la estadística de prueba ² están a la derecha de la distribución Chi-cuadrada y reflejan diferencias significativas entre las frecuencias observadas y las esperadas. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

229

230

En muestreos grandes repetidos, la distribución de la estadística de prueba ² se puede aproximar con la distribución Chi-cuadrada, siempre que todas las frecuencias esperadas sean de por lo menos 5. Caso I. Santo Domingo Motors desea determinar si existe alguna relación entre el ingreso de los clientes y la importancia que dan al precio de los automóviles de lujo. Los gerentes de la compañía desean probar la hipótesis de que: Ho: Ingreso e importancia del precio son independientes. Ha: Ingreso e importancia del precio no son independientes. Atributo b: Atributo a: Nivel de Importancia Grande

Ingresos Bajo

Medio

Alto

Total

83

62

37

182

52

71

49

172

63

58

63

184

198

191

149

538

Frecuencia Esperada Moderado Frecuencia Esperada Poco Frecuencia Esperada Totales

Los clientes están agrupados en tres niveles de ingreso y se les pide asignar un nivel de significancia para poner precio a la decisión de compra. Los resultados se muestran en la siguiente tabla de contingencia. Debido a que 182/538=33.83% de todos los datos que respondieron a la encuesta agregan a un nivel de importancia "grande" al precio, entonces si el ingreso y el precio no están relacionados, se esperaría que 33.83% de ellos, en cada clasificación de ingresos respondan que el precio era de "gran" importancia. Por tanto, los Ei para un nivel de importancia "bajo" son (198)(0.3383)=66.98, (191)(0.3383)=64.62 y (149)(0.3383)=50.41 De forma similar los demás niveles de importancia. [Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

230

231

El valor ² es

²=[(Oi-Ei)/Ei]

Valores críticos. 1. Los valores críticos se encuentran en la tabla usando: grados de libertad = (r-1)(c-1) 2. Las pruebas de independencia con tablas de contingencia solo implican regiones criticas de cola derecha. Si se determina  en 1%, y con (f-1)(c-1)=(3-1)(3-1)=4 grados de libertad ²0.01,4=13.277 Regla de decisión: "No rechazar la hipotesis nula si ² es menor que 13.277. Rechazar la hipótesis nula si ² es mayor que 13.277" Interpretación. La hipótesis nula se rechaza. Existe solo 1% de probabilidad de que si no existe relación entre ingreso y significancia del precio, las diferencias entre Oi y Ei serian lo suficientemente grandes como para producir un Chi-cuadrado más grande que 13.277. Existe evidencia de una relación entre el ingreso de los clientes y la importancia dada al precio de un auto de lujo.

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

231

232

Caso I Jesús Diequez, Gerente de Calidad de Mars, Inc. asegura que sus dulces M&M están distribuidos según los porcentajes de color de 30% marrón, 20% amarillo, 20% rojo, 10% anaranjado, 10% verde y 10% azul. Usando los datos de muestra de la siguiente tabla y un nivel de significación de 0.905 pruebe la afirmación de que la distribución de colores es la que el gerente de calidad asegura. FRECUENCIAS DE LOS DULCES M&M

CATEGORÍA

FREC.

FREC.

DE COLOR

OBSERVADA

ESPERADA

MARRON

33

AMARILLO

26

ROJO

21

ANARANJADO

8

VERDE

7

AZUL

5

Caso II. A los compradores del centro comercial local se les pide calificar un nuevo producto en una escala continua que comienza en cero. Con base en los siguientes datos agrupados, ¿puede usted concluir al nivel del 5% que los datos están distribuidos normalmente, con una media de 100 y una desviación estándar de 25? CALIFICACIÓN

FRECUENCIA

MENOS DE 50

1

50-70

51

70-90

112

90-110

151

110-130

119

130-150

43

150-170

21

MAS DE 170

2

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

232

233

Caso III. Aída Henríquez, gerente de mercadeo de Trans World Airways (TWA) desea determinar si existe alguna relación entre el numero de vuelos que las personas toman y su ingreso. ¿A que conclusión llega al nivel del 1% con base en los datos para 100 viajeros en la tabla de contingencia? FRECUENCIA DE VUELOS INGRESO

NUNCA

RARA VEZ

CON FRECUENCIA

TOTALES

MENOS DE US$30,000

20

15

2

US30,000-US$50,000

8

5

1

US50,000-US70,000

7

8

12

MAS DE US$70,000

2

5

15

Totales

Caso IV. A los compradores del centro comercial local se les pide calificar un nuevo producto en una escala continua que comienza en cero. Con base a los siguientes datos agrupados, ¿puede usted concluir al nivel del 5% que los datos están distribuidos normalmente, con una media de 100 y una desviación de 25? CALIFICACION FRECUENCIA MENOS DE 50 1 50-70 5 70-90 112 90-110 151 110-130 119 130-150 43 150-170 21 MAS DE 170 2

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

233

234

Caso V. En un análisis de segmentación de mercado para tres cervezas, el grupo de investigación encargado ha planteado la duda de si las preferencias para las tres cervezas son diferentes entre los consumidores hombres y mujeres. Si la preferencia de las cervezas fuera independiente del sexo del consumidor, se iniciaría una campaña publicitaria para todas las cervezas. Sin embargo, si la preferencia depende del sexo del consumidor, se ajustarán los promociones para tener en cuenta los distintos mercados metas. Pruebe el supuesto a un nivel de significancia de un 5%. Los datos de la tabla constituyen las frecuencias observadas para las seis clases o categorías. CERVEZA PREFERIDA LIGERA CLARA SEXO HOMBRE 20 40 MUJER 30 30

OSCURA 20 10

Caso VI. La empresa National Computer Products, Inc. (NCP) fabrica impresoras y máquinas de fax en plantas de Atlanta, Dallas y Seattle, Estados Unidos. Para evaluar los conocimientos de sus empleados acerca de administración de calidad total se tomó una muestra aleatoria de seis empleados en cada planta y se les sometió a un examen de conciencia de la calidad. Las calificaciones de esos 18 empleados se presentan a continuación. Con estos datos, los gerentes desean probar la hipótesis de que la media de la calificación del examen es igual para las tres plantas con un nivel de significancia de un 5%.

PLANTA 1 ATLANTA 85 75 82 76 71 85

PLANTA 2 DALLAS 71 75 73 74 69 82

PLANTA 3 SEATTLE 59 64 62 69 75 67

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

234

235

Caso VII. Proquín contrata, anualmente, unos 400 empleados para sus cuatro plantas en todo el país. El director de personal pregunta si se podría aplicar una distribución normal a la población de las calificaciones obtenidas. Si se pudiera aplicar esa distribución, sería muy útil para evaluar calificaciones específicas. Esto es, las calificaciones de 20% superior, 40% inferior, etc., se podrían identificar con rapidez. En consecuencia se desea probar la hipótesis nula de que la población de calificaciones en la prueba de actitud se apega a una distribución de probabilidad normal. Si se toma una muestra una muestra de 50 calificaciones, cuya media es de 68.42 y su desviación estándar es de 10.41. Los datos se muestra a continuación en la siguiente tabla. Interprete los resultados. INTERVALO DE FRECUENCIA CALIFICACIONES OBSERVADA MENOS DE 55.1 5 55.1 59.68 5 59.68 63.01 9 63.01 65.82 6 65.82 68.42 2 68.42 71.02 5 71.02 73.83 2 73.83 77.16 5 77.16 81.74 5 81.74 O MAS 6 TOTAL 50

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

235

236

Caso VIII. Decoración Ruddy se especializa en arreglos de jardines residenciales. El costo estimado de mano de obra en determinada oferta de decoración se basa en la cantidad de árboles, arbustos, etc., que se plantan en el proyecto. Para fines de estimación de costos, los gerentes aplican dos horas de mono de obra plantar un árbol mediano. Los tiempos reales, en horas, para una muestra de 10 árboles plantados durante el mes pasado son los siguientes: 1.9 1.7 2.8 2.4 2.6 2.5 2.8 3.2 1.6 2.5 Con un nivel de significancia de 0.05, pruebe si la media del tiempo de plantación de árboles es mayor de dos horas. A. Establezca las hipótesis nulas y alternativa. B. ¿Cuál es el valor crítico para la prueba y cuál es la regla de decisión? C. Calcule la media muestral. D. Determine la desviación estándar. E. Calcule el valor del estadístico de prueba. F. ¿Cuál es su conclusión?

[Métodos Cuantitativos para Negocios I] | Ing. Rubén Darío Estrella, MBA – Cavaliere Ingeniero de Sistemas, Administrador, Matemático, Teólogo y Maestro

236

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.