IBM Software Business Analytics
IBM SPSS Complex Samples 22
IBM SPSS Complex Samples Realice Estadísticos de Muestras Complejas Correctamente Realice muestreos con un paquete estadístico especialmente diseñado para producir estimaciones correctas de muestras complejas de sus datos. IBM SPSS Complex Samples le permite computar estadísticos y los errores estándar de los diseños muestrales complejos. Usted puede utilizar IBM SPSS Complex Samples en: • Investigación mediante encuestas - Obtenga estadísticos descriptivos e inferenciales para datos de encuestas • Investigación de mercados – Analice datos de satisfacción de clientes • Investigación clínica - Analice grandes bases datos públicas sobre cuestiones de salud como nutrición, alcoholismo y accidentes de tráfico • Ciencias sociales – Realice investigaciones secundarias sobre bases de Características datos de opinión pública • Incremente la precisión de su • Investigación de la opinión pública - Caracterice las actitudes ante cuestiones políticas muestra o asegure muestras representativas con muestreo IBM SPSS Complex Samples le ofrece todo lo que necesita para trabajar estratificado con muestras complejas, e incluye: • Seleccione grupos de unidades de muestras con el muestreo conglomerado
• Un Asistente de Muestreo intuitivo que le va guiando paso a paso en el proceso de diseño y elección de la muestra • Un Asistente de Preparación para el Análisis que le ayuda a preparar conjuntos de datos ya muestreados para uso público como la Encuesta de • Seleccione la muestra inicial, Presupuestos Familiares, Encuestas Sociodemográficas, etc después cree una estación de • Predecir una variable de respuesta numérica a través del modelo lineal muestra con el muestreo general de muestras complejas (CSLGM) polietápico • Predecir una variable de respuesta ordinal a través de la regresión ordinal de muestras complejas (CSORDINAL) • Predecir una variable de respuesta categórica mediante regresión logística de muestras complejas (CSLOGISTIC) • Predecir el tiempo de un evento a través de regresión de Cox de muestras complejas (CSCOXREG)
IBM Software Business Analytics
Desde la etapa de planeación y muestreo en el proceso de análisis, IBM SPSS Complex Samples hace más sencillo obtener resultados precisos y confiables. Como IBM SPSS Complex Samples considera hasta tres etapas al momento de analizar datos de un diseño polietápico, usted obtiene resultados más precisos. Además, de darle la oportunidad de evaluar el impacto de sus diseños, IBM SPSS Complex Samples también le proporciona una imagen más precisa de sus datos porque la evaluación de las subpoblaciones considera otras subpoblaciones. Usted podrá utilizar los siguientes tipos de diseños muestrales: • Muestreo Estratificado – Incremente la precisión de la muestra y asegúrese de la representación en la muestra de los grupos clave, eligiendo la muestra dentro de los subgrupos de la población objetivo. Por ejemplo, los subgrupos pueden ser un número determinado de hombres o mujeres o contener personas de diferentes categorías laborales, de diferentes grupos de edad, etc. • Muestreo por Conglomerados – Seleccione los conglomerados que son grupos de unidades muestrales para su encuesta. Los conglomerados pueden incluir escuelas, hospitales o áreas geográficas cuyas unidades muestrales pueden ser estudiantes, pacientes o los mismos ciudadanos. La agrupación favorece que el proceso de análisis de encuestas resulte más eficaz en términos de costovariabilidad • Muestreo Polietápico – Seleccione una muestra inicial basada en conglomerados de elementos en la población: cree entonces una segunda etapa con una submuestra en cada unidad seleccionada en la muestra de la primera etapa. Repitiendo esta opción podrá obtener diseños polietápico
Obtenga resultados más confiables Como investigador, usted desea confiar en sus resultados. Los paquetes estadísticos más convencionales asumen que sus datos se obtienen de un muestreo aleatorio simple. Esta clase de muestreo, sin embargo, no es viable ni efectivo en términos de costo para encuestas a gran escala.
IBM SPSS Complex Samples 22
Analizar los datos de esas muestras con métodos tradicionales nos puede llevar a obtener resultados incorrectos. Por ejemplo, la estimación del error estándar de estadísticos es usualmente pequeña, lo que le da un falso sentido de precisión. IBM SPSS Complex Samples le permite realizar inferencias válidas para poblaciones de muestras complejas porque incorpora el diseño de la muestra en el análisis de la encuesta.
Trabaje fácil y eficientemente Sólo IBM SPSS Complex Samples le facilita el trabajo con muestras complejas y la comprensión de los resultados. A través de su intuitiva interfaz podrá analizar datos e interpretar resultados. Cuando termine podrá publicar sus bases de datos e incluir su muestra o el plan de análisis. Cada plan actúa como plantilla y le permite guardar todas las decisiones tomadas al momento de elaborar el plan. Esto le ahorra tiempo y mejora la precisión de sus planes con los datos, ya sea para replicar resultados o para continuar con el proyecto en donde usted lo dejó.
IBM Software Business Analytics
IBM SPSS Complex Samples 22
Figura 2. Un análisis preciso de los datos de encuestas es sencillo en IBM SPSS Complex Samples. Inicie con uno de los asistentes (su selcción depende de la fuente de sus datos) y utilice la interfaz interactiva para crear planos, analizar datos y interpretar resultados.
Para comenzar a trabajar con IBM SPSS Complex Samples, puede utilizar los asistentes, que le presentarán los factores que debe considerar antes de planificar su análisis. Si está creando sus propias muestras, utilice entonces el Asistente de Muestreo para definir el plan de muestreo. Si utiliza conjuntos de datos de uso público ya muestreados, entonces utilice el Asistente para la Preparación del Análisis, para especificar cómo se definieron las muestras y cómo estimar los errores estándar. Una vez creada la muestra o especificados los errores estándar, podrá crear planes, analizar sus datos y producir los resultados. Figura 1. Una tienda de autoservicio desea determinar si la frecuencia con la cual los clientes compran está relacionada con la cantidad gastada, controlándola por el género de los clientes e incorporando un diseño de muestra. Primero, la tienda especifica el diseño de la muestra utilizado en el Asistente de Preparación (arriba). Después, la tienda establece el modelo con el botón de Modelo General Linearizado de Muestras Complejas.
IBM Software Business Analytics
IBM SPSS Complex Samples le facilita trabajar y aprender con rapidez. Utilice el sistema de ayuda en línea, explore los estudios de casos interactivos o ejecute el tutorial en línea para aprender más sobre cómo utilizar mejor sus datos y aprovechar el trabajo con el software. Complex Samples le permite: • Lograr estimaciones puntuales correctas para estadísticos como totales, medias y ratios • Obtener los errores estándar de esos estadísticos • Generar intervalos de confianza y contrastes de hipótesis • Predecir resultados numéricos • Predecir resultados ordinales • Predecir resultados categóricos • Predecir el tiempo para un evento
Obtenga un valor adicional con colaboración Compartir y re-utilizar sus activos eficientemente, protegerlos de forma tal que se cumplan requerimientos internos y externos, y publicar resultados para que varios usuarios pueden visualizarlos e interactuar con ellos es posible con IBM SPSS Collaboration and Deployment Services.
IBM SPSS Complex Samples 22
Características Plan de muestras complejas (CSPLAN) Proporciona un entorno común para especificar el marco de muestreo para crear un diseño muestral complejo o una especificación del análisis utilizando los procedimientos de PASW Complex Samples. CSPLAN no extrae las muestras ni analiza los datos. Para extraer la muestra utilice un diseño muestra creado por CSPLAN como input en el procedimiento CSSELECT (descrito abajo). Para analizar los datos muestrales, emplee el diseño creado por CSPLAN como input de CSDESCRIPTIVES, CSTABULATE, CSGLM, CSLOGISTIC o CSORDINAL (descritos más adelante) • Cree un diseño muestral simple: utilizado para extraer unidades de muestreo desde el archivo activo • Cree un diseño de análisis: utilizado para analizar muestras complejas • Cuando crea un diseño muestral, el procedimiento guarda automáticamente el diseño del análisis en el archivo del plan. Se crea un archivo para diseñar la muestra que podrá ser utilizado tanto para la selección muestral como para el análisis • Muestra el diseño muestral o el diseño de análisis • Especifica el plan en un archivo de datos externo • Permite nombrar las variables que serán creadas cuando extraiga una muestra o la utilice como input para el proceso de selección o estimación con el subcomando PLANVARS - Especifique las ponderaciones muestrales para cada unidad que será utilizada en los procedimientos de análisis de PASW Complex Samples en el proceso de estimación - Indique las ponderaciones muestrales globales que serán generadas cuando el diseño muestral sea ejecutado en el procedimiento CSSELECT - Seleccione las ponderaciones que deben de ser utilizadas cuando se computen las ponderaciones del muestreo en un diseño polietápico • Controle los resultados desde el procedimiento CSPLAN con el subcomando PRINT - Muestra un resumen de las especificaciones de cada una de las etapas del usuario - Muestra una tabla con las especificaciones MATRIX • Etapas del diseño con el subcomando DESIGN. También podrá utilizar este subcomando para definir las variables de estratificación, las variables de conglomeración y crear etiquetas descriptivas para etapas particulares
IBM Software Business Analytics • Especifique el método de extracción muestral mediante el subcomando METHOD. Seleccione entre una variedad de métodos de probabilidades iguales y desiguales, incluyendo el muestreo aleatorio simple y sistemático. También puede optar por métodos de muestreo con probabilidades proporcionales al tamaño (PPS). Las unidades pueden ser extraídas con reemplazo (WR) o sin reemplazo (WOR) desde la población muestral - SIMPLE_WOR: Selecciona unidades con idéntica probabilidad. Extracción de unidades sin reemplazo - SEMPLE_WR: Selecciona unidades con idéntica probabilidad. Extracción de unidades con reemplazo - SIMPLE_SYSTEMATIC: Selecciona las unidades con un intervalo fijo a lo largo de todo el marco muestral o estrato. Se elige aleatoriamente el punto de inicio dentro del primer intervalo - SIMPLE_CHROMY: Selecciona unidades de forma secuencial con idéntica probabilidad. Extracción de unidades sin reemplazo - PPS_WOR: Selecciona unidades con probabilidad al tamaño. Extracción de unidades sin reemplazo - PPS_WR: Selecciona unidades con probabilidad proporcional al tamaño. Extracción de unidades con reemplazo - PPS_SYSTEMATIC: Selecciona unidades mediante muestreo aleatorio sistemático con probabilidad proporcional al tamaño. Extracción de unidades sin reemplazo - PSS_CRHOMY: Selecciona unidades de forma secuencial con probabilidad proporcional al tamaño. Extracción de unidades sin reemplazo - PPS_BREWER: Selecciona dos unidades desde cada estrato con probabilidad proporcional al tamaño. Extracción de unidades sin reemplazo - PPS_ MURTHY: Selecciona dos unidades desde cada estrato con probabilidad proporcional al tamaño. Extracción de unidades sin reemplazo - PPS_ SAMPFORD: Extiende el método Brewer a la selección de más de dos unidades desde cada estrato con probabilidad proporcional al tamaño. Extracción de unidades sin reemplazo - Control del número o porcentaje de unidades que son extraídas en cada etapa del diseño muestral. Puede elegir también variables del output como ponderaciones muestrales creadas durante el proceso del creación del diseño muestral - Métodos de estimación: Con reemplazo, sin reemplazo pero con probabilidad idéntica en la primera etapa y con distinta probabilidad y sin reemplazo - Puede elegir si incluir la corrección de población finita al estimar la varianza en el muestreo simple aleatorio (SRS)
IBM SPSS Complex Samples 22
- Estimación sin reemplazo con distinta probabilidad: requisito sólo para la primera etapa - Especifica las variables para el proceso de estimación, incluyendo las ponderaciones de la muestra y las probabilidades de inclusión • Especifique el número de unidades muestrales extraídas en la etapa actual con el subcomando SIZE • Especifique el porcentaje de unidades extraídas en la etapa actual, por ejemplo, la fracción de muestreo, utilizando el subcomando RATE • Especifique el número mínimo de unidades extraídas cuando especifica RATE. Esto se utiliza cuando el rango de muestreo para un estrato particular es muy pequeño debido al redondeo • Especifique el número máximo de unidades extraídas cuando el rango de muestreo para un estrato particular es muy grande debido al redondeo • Especifique la medida del tamaño de las unidades poblacionales en un diseño PPS. Especifica una variable que contiene los tamaños o requiere que se determinen cuando el procedimiento CSSELECT escanea el marco de la muestra • Obtenga las variables de información de las etapas al ejecutar un diseño muestral mediante el subcomando STAGEVARS. Podrá obtener: - La proporción de unidades extraídas en una determinada etapa empleando probabilidades de inclusión por cada etapa - Las etapas previas cuando se utilizan proporciones acumuladas del muestreo para una etapa determinada - Identificación única de las unidades seleccionadas más de una vez cuando el muestreo se realiza con reemplazo, con un índice de duplicación para las unidades seleccionadas en una determinada etapa - Tamaño poblacional para una etapa determinada - Número de unidades extraídas en una etapa determinada - Razón de muestreo por etapas - Ponderaciones de muestreo para una etapa determinada • Elija un método de estimación para el subcomando ESTIMATOR. Podrá indicar: -Probabilidades iguales de selección sin reemplazo -Probabilidades desiguales de selección sin reemplazo -Selección con reemplazo • Especifica el tamaño de la población para cada elemento de la muestra con el subcomando POPSIZE • Especifica la proporción de unidades extraídas de la población en una determinada etapa con el subcomando INCLPROB
IBM Software Business Analytics
IBM SPSS Complex Samples 22
• Especifique el nombre del archivo del plan creado mediante el procedimiento de CSPLAN, que contiene las especificaciones del diseño del análisis, con el subcomando PLAN • Especifique los nombres de los archivos de las probabilidades conjuntas de inclusión • Especifique las variables de análisis utilizadas por los subcomandos MEAN y SIM mediante el subcomando SUMMARY • Solicite el cálculo de las medias para las variables especificadas en el subcomando SUMMARY mediante los subcomandos MEAN y SUM - Solicite la prueba t de medias y el valor de la hipótesis nula a través de TTEST. Si define las subpoblaciones con el subcomando SUBPOP, entonces los valores de la hipótesis nula son utilizados en las pruebas para cada una de las subpoblaciones así como para la población total • Solicite la estimación de razones para las variables especificadas en el subcomando SUMMARY mediante el subcomando RATIO - Solicite la prueba t de ratios y asigne valor a la hipótesis nula a través de TTEST • Asocie la sintaxis con las estimaciones de medias, sumas o ratios, incluyendo: - El número de observaciones válidas en el conjunto de datos para cada una de las estimaciones de la media, suma o razón - El tamaño poblacional para cada media, suma o razón estimada - El error estándar para cada media, suma o ratio estimado - Coeficiente de variación - Efectos de diseño - Raíz cuadrada de los efectos de diseño - Intervalo de confianza • Especifica las subpoblaciones para las que se llevan a cabo análisis mediante el subcomando SUBPOP - Muestra los resultados para todas las Descriptivos de muestras complejas subpoblaciones en la misma tabla o en tablas (CSDESCRIPTIVES) separadas CSDESCRIPTIVES calcula medias, sumas y ratios, • Especifique el tratamiento de los valores perdidos y calcula sus errores estándar, los efectos del diseño, - Base cada uno de los estadísticos en todos los datos intervalos de confianza y contrastes de hipótesis para válidos para las variables de análisis utilizadas en el muestras extraídas mediante métodos complejos de cálculo del estadístico. Calcule las razones muestreo. El procedimiento estima las varianzas utilizando todos los casos con datos válidos para las teniendo en cuenta el diseño muestral utilizado en la variables especificadas. Puede basar los estadísticos selección de la muestra, incluyendo probabilidades para las diferentes variables en los diferentes iguales y métodos de muestreo como PPS, WR y tamaños muestrales WOR. Opcionalmente, CSDESCRIPTIVES le - Base únicamente los casos con datos válidos para servirá para analizar subpoblaciones todas las variables del análisis cuando calcule los estadísticos. Los estadísticos siempre se basan en el mismo tamaño muestral
Procedimiento de selección de muestras complejas (CSSELECT) CSSELECT selecciona muestras complejas basadas en criterios probabilísticas a partir de una población; elige unidades de acuerdo a un diseño de muestreo creado mediante el procedimiento CSPLAN • Controla el alcance de la ejecución y especifica la semilla con el subcomando CRITERIA • Controla si los valores perdidos de las variables de clasificación (estratificación y conglomerados) son tratados como valores válidos con el subcomando CLASSMISSING • Utiliza la versión actualizada del generador números aleatorios Mersenne Twister • Especifica las opciones generales concernientes a los archivos de resultados y de entradas con subcomando DATA - Opción para renombrar las variables existentes cuando el procedimiento CSSELECT escribe ponderaciones y la presentación de las variables de los resultados de las etapas requeridas en el archivo del plan. Tales como probabilidades de inclusión • Escribe un archivo externo con las unidades muestrales mediante la opción de variables keep/drop • Almacena automáticamente las probabilidades conjuntas de inclusión de primera etapa a un archivo externo cuando el archivo de plan especifica un método muestral PPS_WR • Genera opcionalmente archivos de texto que contengan las reglas que describen las características de las unidades seleccionadas • Controle el resultado a través del subcomando PRINT - Resumen de la distribución de los casos seleccionados en los estratos. La información se desglosa por etapa muestral - Produce un resumen del proceso por casos
IBM Software Business Analytics
IBM SPSS Complex Samples 22
- Tamaños poblacionales esperados estimados: utilice los tamaños poblacionales estimados bajo el supuesto de independencia estadística entre las variables de la tabla. Esta funcionalidad está disponible únicamente para tablas de doble entrada - Residuos: muestra la diferencia ente los tamaños esperados en cada una de las celdas. Esta funcionalidad está disponible únicamente para Tabulación de muestras complejas (CSTABULATE) tablas de doble entrada CSTABULATE muestra las tablas de una o dos entradas y los errores estándar asociados, los efectos - Residuos de Pearson: esta capacidad está disponible únicamente para tablas de doble entrada del diseño, los intervalos de confianza y las pruebas - Residuos de Pearson ajustados: esta capacidad está de hipótesis, para muestras extraídas mediante disponible únicamente para tablas de doble entrada métodos de muestreo complejo. El procedimiento estima las varianzas teniendo en cuenta el diseño • Estadísticos y pruebas para la tabla de entrada: muestral utilizado para seleccionar la muestra, - Prueba de homogeneidad de proporciones incluyendo los métodos de probabilidades iguales y - Prueba de independencia PPS y los procedimientos de muestreo con y sin - Cociente de ventajas (odds ratio) reemplazo. Opcionalmente, CSTABULATE crea - Riesgo relativo tablas para subpoblaciones - Diferencia de riesgo • Especifique el nombre de un archivo XML • Especifique las subpoblaciones para las cuales los mediante el procedimiento CSPLAN con el diseño análisis se llevan a cabo mediante el subcomando del análisis mediante el subcomando PLAN SUBPOP • Especifique el archivo donde se guardan las - Muestra los resultados para todas las probabilidades conjuntas de selección subpoblaciones en la misma tabla o en tablas • Utilice los siguientes estadísticos en una tabla: separadas - Tamaño de la población: calcula el tamaño de la • Especifica el tratamiento de los valores perdidos población para cada celda y marginales de tabla - Base cada tabla en los datos válidos para las - Error estándar: Cálculo del error estándar para cada variables de la tabulación empleadas. Puede basar tamaño poblacional estimado las tablas para las diferentes variables en diferentes Porcentajes de fila y columna: expresa la estimación tamaños muestrales del tamaño poblacional para cada celda en una fila - Emplee únicamente los casos con datos válidos o columna como porcentaje del tamaño poblacional para todas las variables de la tabulación durante el estimado para cada fila o columna. proceso de creación de la tabla. Utilice las tablas • Esta funcionalidad está disponible para tablas de para diferentes variables, siempre para el mismo doble entrada: tamaño muestral - Porcentajes de tabla: Expresa el tamaño aproximado - Excluya los valores perdidos entre los estratos, el de la población para cada celda de la tabla como conglomerado y las variables subpoblacionales – porcentaje del tamaño aproximado de la población por defecto en esa tabla - Incluya los valores perdidos entre los estratos, el - Coeficiente de variación conglomerado y las variables subpoblacionales - Raíz cuadrada de los efectos del diseño Trate los valores perdidos para esas variables como - Intervalo de confianza: especifica cualquier número datos válidos entre 0 y 100 como intervalo de confianza - Recuentos no ponderados: utilice recuentos no ponderados como número de observaciones válidas en el conjunto de datos para cada tamaño poblacional estimado - Tamaño poblacional acumulado estimado: utilice el tamaño poblacional acumulado para tablas univariantes - Porcentajes acumulados: utilice los porcentajes acumulados que corresponden al tamaño poblacional estimado para tablas univariantes - Excluya los valores perdidos entre los estratos, conglomerados y las variables subpoblacionales - Inclusión de los valores perdidos entre los estratos, conglomerados y variables subpoblacionales. Los valores perdidos para esas variables pueden ser tratados como datos válidos
IBM Software Business Analytics
Modelos lineales generales de muestras complejas (CSGLM) Este procedimiento le permite construir modelos de regresión lineal, modelos de análisis de la varianza (ANOVA) y de análisis de la covarianza (ANOVA) para muestras extraídas mediante métodos complejos de muestreo. Las varianzas estimadas por el procedimiento tienen en cuenta el diseño muestral utilizado para seleccionar la muestra, incluyendo probabilidades iguales, los métodos PPS y los procedimientos de muestreo con y sin reemplazo, WR y WOR. Opcionalmente CSGLM puede realizar análisis para subpoblaciones: • Modelos: - Efectos principales - Interacciones de orden n - Modelo saturado - Personalizables, incluyendo términos anidados • Estadísticos: - Parámetros del modelo: estimaciones, errores estándar, intervalos de confianza, efecto de diseño y raíz cuadrada de efecto de diseño para cada uno de los coeficientes estimados - Medias poblacionales de las variables dependientes y covariables - Ajuste del modelo - Información del diseño muestral • Pruebas de hipótesis - Estadísticos de prueba: Wald F, Wald F ajustado, Wald Chi cuadrado y Wald Chi cuadrado ajustado - Ajustes para comparaciones múltiples: diferencia mínima significativa, Bonferroni, Bonferroni secuencial, Sidak y Sidak secuencial - Grados de libertad de la muestra: se basa en el diseño muestral o determinados por el usuario • Medias estimadas: medias marginales estimadas para los factores e interacciones del modelo - Contrastes: simple, desviaciones, Herlmert, repetidas o polinomiales • Las variables del modelo pueden ser guardadas en el archivo activo y ser exportadas a archivos externos que contienen parámetros matriciales - Variables: valores predichos y valores residuales - Matriz de covarianza de los parámetros y los otros estadísticos (que podrán ser exportados como archivos de SPSS) - Parámetros estimados y/o matriz de covarianzas pueden ser exportados a un archivo XML • Resultados: - Información del diseño muestral (estrato y PSU) - Coeficientes de regresión estimados y pruebas t - Resúmenes sobre la variable dependiente, covarianzas y factores - Resúmenes sobre la muestra, incluyendo las frecuencias no ponderadas y el tamaño poblacional
IBM SPSS Complex Samples 22
- Límites de confianza para los parámetros estimados con niveles de confianza especificados por el usuario - Prueba Wald F para los efectos del modelo - Efecto de diseño - R2 múltiple - Conjunto de matrices de coeficientes de contraste (L) - Matriz de varianzas y covarianzas estimadas de los coeficientes de la regresión - Error cuadrático medio - Matrices de covarianzas y correlaciones para los coeficientes de regresión • Tratamiento de los valores perdidos - Supresión según lista de valores perdidos • Otros - Denominador de grados de libertad, utilización en el cálculo de p valores especificados por el usuario - Diagnósticos de colinealidad - El modelo puede ser ajustado por subpoblaciones Muestras complejas ordinales (CSORDINAL) CSORDINAL ejecuta análisis de regresión en una variable dependiente binaria u ordinal utilizando la función del enlace acumulativo para muestreos obtenidos por métodos de muestras complejas. El procedimiento estima las varianzas teniendo en cuenta el diseño de muestreo utilizado para seleccionar la muestra, incluyendo métodos de probabilidades iguales y PPS, como procedimientos de muestreo WR y WOR. De modo opcional, CSORDINAL ejecuta análisis para una subpoblación • Modelos - Efectos principales - Interacciones de orden n - Modelo saturado - Personalizadas, incluyendo términos anidados Estadísticos - Parámetros del modelo: estimaciones de los coeficientes, estimación de los términos exponenciales, errores estándar de las estimaciones, pruebas t para los coeficientes, intervalos de confianza, efectos de diseño y raíz cuadrada de los efectos de diseño muestral para cada coeficiente estimado, covarianzas de los parámetros estimados y correlaciones de los parámetros estimados - Ajuste del modelo: pseudos R2 y tabla de clasificación - Prueba de líneas paralelas: prueba de Wald, parámetros estimados para modelos generalizados, y covarianzas de los parámetros para los modelos generalizados - Resumen de los estadísticos para las variables del modelo - Información del diseño muestral
IBM Software Business Analytics • Prueba de hipótesis - Prueba de estadísticos: Wald F, Wald F cuadrado ajustado, Chi cuadrado de Wald - Ajustes para comparaciones múltiples: diferencia mínima significativa, Bonferroni, Bonferroni secuencial, Sidak y Sidak secuencial - Grados de libertad del muestreo: se basa en el diseño muestral o ajustado por el usuario • Las variables del modelo pueden ser exportadas en el archivo activo o ser exportadas a archivos externos que contienen matrices de parámetros - Variables: predice categorías, probabilidades de las categorías predichas, probabilidades de las categorías observadas, probabilidades acumuladas (una variable por categoría), probabilidades predichas (una variable por categoría) - Las matrices de covarianzas/correlaciones de los parámetros y demás estadísticos pueden ser exportadas como archivos SPSS - Los parámetros estimados y/o las matrices de covarianzas pueden ser exportados a un archivo XML • Tres métodos de estimación: Newton-Raphson, Fisher Scoring y Fisher Scoring seguido por Newton-Raphson • Función de enlace acumulativo para especificar el modelo: Cauchit, log-log complementario, log-log negativo y probit • Ratios de probabilidad acumuladas para el factor o factores o covarianza especificadas. El subcomando se encuentra disponible sólo para enlace LOGIT • Resultados: - Información del diseño muestral (estrato y PSU) - Resúmenes sobre la variable dependiente, covarianzas y factores - Resúmenes sobre la muestra, incluyendo las frecuencias no ponderadas y el tamaño poblacional - Límites de confianza para los parámetros estimados con niveles de confianza especificados por el usuario - Estadísticos de resumen del modelo - Prueba Wald F, Wald F ajustado, Wald Chicuadrado y Wald ajustado para los efectos del modelo - Efectos de diseño - Tablas de clasificación - Conjunto de matrices de coeficientes de contraste (L) - Matriz de varianzas y covarianzas estimadas de los coeficientes de la regresión - Tabla de función general estimable - Matrices de correlaciones para los coeficientes de regresión
IBM SPSS Complex Samples 22 • Tratamiento de los datos perdidos - Supresión de la lista de valores perdidos • Otros - Denominador especificado por el usuario, df, utilización en p valores informáticos - Diagnósticos de colinealidad - El modelo puede ser ajustado por subpoblaciones Regresión logística de muestras complejas (CSLOGISTIC) Este procedimiento realiza análisis de regresión logística binaria, así como regresión logística multinomial (MLR), para muestras procedentes de muestreos complejos. El procedimiento estima las varianzas considerando el diseño muestral utilizado para seleccionar la muestra, incluye probabilidades iguales y métodos de muestreo PPS, con y sin reemplazo. Opcionalmente, CSLOGISTIC lleva a cabo análisis para subpoblaciones: • Modelos - Efectos principales - Interacciones de orden n - Modelo saturado - Personalizadas, incluyendo términos anidados • Estadísticos -Parámetros del modelo: estimaciones de los coeficientes, estimación de los términos exponenciales, errores estándar de las estimaciones, pruebas t para los coeficientes, intervalos de confianza, efectos de diseño y raíz cuadrada de los efectos del diseño muestral para cada coeficiente estimado, covarianzas de los parámetros estimados y correlaciones de los parámetros estimados - Ajuste del modelo: R2 y tabla de clasificación - Resumen de los estadísticos para las variables del modelo - Información del diseño muestral • Prueba de hipótesis - Prueba de estadísticos: Wald F, Wald F ajustado, Wald Chi cuadrado y Wald Chi cuadrado ajustado • Ajustes para comparaciones múltiples: diferencia mínima significativa, Bonferroni, Bonferroni secuencial, Sidak y Sidak secuencial • Grados de libertad del muestreo: se basa en el diseño muestral o ajustados por el usuario • Las variables del modelo pueden ser guardadas en el archivo activo y ser exportadas a archivos externos que contienen matrices de parámetros - Variables: predice categorías y probabilidades - Las matrices de covarianza/correlaciones de los parámetros y demás estadísticos pueden ser exportadas como archivos de SPSS - Los parámetros estimados y/o las matrices de covarianza pueden ser exportados a un archivo XML
IBM Software Business Analytics
IBM SPSS Complex Samples 22
• Predictores: - Factores - Covarianzas - Predictores dependientes del tiempo • Subgrupos: análisis estratificado y/o limitado a una subpoblación en particular • Modelos - Efectos principales - Interacciones de orden n - Personalizadas, incluyendo términos anidados • Estadísticos - Diseño de muestras - Resumen de eventos y de censura - Parámetros del modelo: estimaciones de los coeficientes, estimación de los términos exponenciales, errores estándar de las estimaciones, pruebas t para los coeficientes, intervalos de confianza, efectos de diseño y raíz cuadrada de los efectos de diseño muestral para cada coeficiente estimado, covarianza de los parámetros estimados y correlaciones de los parámetros estimados - Supuestos del modelo - Prueba proporcional de riesgo - Estimación de parámetros para modelos alternativos - Matriz de covarianza para modelos alternativos - Base de supervivencia y funciones de riesgo cumulativo • Gráficos Regresión de Cox de muestras complejas - Función de supervivencia (CSCOXREG) - Función de supervivencia log-menos-log Este procedimiento aplica la regresión de Cox para - Función de supervivencia uno menos análisis de supervivencia – esto es, la cantidad de - Opción para desplegar intervalos de confianza tiempo antes de que ocurra un evento para una - Los factores de los gráficos y las covarianzas en muestra obtenida con métodos de muestreo niveles específicos complejo. CSCOXREG soporta predictores • Prueba de hipótesis categóricos y continuos, los cuales pueden ser - Estadísticos de prueba: prueba F, prueba F ajustada, dependientes del tiempo. CSCOXREG le Chi cuadrada, Chi cuadrada ajustada proporciona una manera fácil de localizar diferencias - Ajuste para comparaciones múltiples: diferencia en subgrupos, así como también analizar los efectos significativa mínima, Bonferroni, Bonferroni de un grupo de predictores. También, este secuencial, Sidak y Sidak secuencial procedimiento maneja datos en los cuales hay - Grados de libertad del muestreo: se basa en el múltiples casos (como por ejemplo, visitas a diseño muestral o ajustados por el usuario pacientes y observaciones para un solo sujeto) • Las variables del modelo pueden ser guardadas en • Tiempo y evento: especifica variables de el archivo y ser exportadas a archivos externos que supervivencia y valores que indican que el evento contienen matrices de parámetros ha ocurrido - Tiempo de supervivencia - Inicio de intervalo - Tiempo 0 - Varía según el objeto - Fin del intervalo - Evento como valores individuales o como rango de valores Resultado: - Información del diseño muestral (estrato y PSU) - Resúmenes sobre la variable dependiente, covarianzas y factores - Resúmenes sobre la muestra, incluyendo las frecuencias no ponderadas y el tamaño poblacional - Límites de confianza para los parámetros estimados con niveles de confianza especificados por el usuario - Estadísticos de resumen el modelo - Pruebas Wald F para los efectos del modelo - Efecto de diseño - Tablas de clasificación - Conjunto de matrices de coeficientes de contraste (L) -Matriz de varianzas y covarianzas estimadas de los coeficientes de la regresión - Error cuadrático medio - Matrices de covarianzas y correlaciones para los coeficientes de regresión - Tratamiento de los valores perdidos - Supresión de la lista de valores perdidos - Manejo de datos perdidos • Otros: - Denominador especificado por el usuario, df, utilización en p valores informáticos - Diagnósticos de colinealidad - El modelo puede ser ajustado por subpoblaciones
IBM Software Business Analytics
- Variables: función de supervivencia, límite inferior y superior de intervalo de confianza para la función de supervivencia, función de riesgo cumulativo, límite inferior y superior de intervalo de confianza para la función de riesgo cumulativo, valor predicho de un predictor lineal, residuo Schoenfeld (una variable por parámetro de modelo), residuo Martingale, desviación residual, Cox-Snell residual, calificación residual (una variable por parámetro de modelo), DFBeta residual (una variable por parámetro de modelo), Martingale residual agregado, desviación residual agregada, Cox-Snell residual agregado, calificación residual agregada (una variable por parámetro de modelo), y DFBeta resdidual agregado ( una variable por parámetro de modelo) • Exporte el modelo y/o la función de supervivencia - Exporte como un archivo de SPSS - Exporte la función de supervivencia como un archivo de SPSS - Exporte el modelo como un archivo XML • Opciones para especificar el criterio de estimación, métodos para computar las funciones de supervivencia y los intervalos de confianza, y manejar los valores perdidos del usuario - Estimación: iteraciones máximas, partición máxima, estimación de iteraciones limitadas basadas en los cambios de los parámetros, cambio de iteraciones basadas en la probabilidad de cambio, despliegue de la historia de iteraciones, y un método para la estimación de parámetros (Efron o Breslow) - Funciones de supervivencia: método para estimar la base de la función de supervivencia (Efron, Breslow o límite de producto), e intervalos de confianza para funciones de supervivencia (transformados o unidades originales) - Especifica el nivel de confianza del intervalo - Manejo de datos perdidos (tratados como válidos o inválidos)
IBM SPSS Complex Samples 22
Sobre IBM SPSS Business Analytics El software de IBM SPSS Business Analytics le proporciona conocimiento a través de sus datos que le ayuda a las organizaciones a trabajar de manera más inteligente y a superar a sus competidores. Este portafolio incluye soluciones para inteligencia de negocios, análisis predictivo, administración de decisiones, del desempeño y del riesgo. Las soluciones Business Analytics le permiten a las empresas identificar y visualizar tendencias y patrones en áreas como análisis de clientes, la cual tiene un efecto importante en el desempeño de los negocios. Podrá comparar escenarios, anticipar amenazas potenciales y oportunidades, realizar una mejor planeación de presupuestos y pronóstico de recursos, balancear el riesgo contra los ingresos esperados y trabajar para alcanzar los requerimientos regulatorios. Al hacer el análisis más disponible, las empresas alinean el proceso de decisión táctico y estratégico para alcanzar los objetivos del negocio.
IBM Software Business Analytics
IBM SPSS Complex Samples 22
© Copyright IBM Corporation 2012 IBM Corporation Software Group Route 100 Somers, NY 10589 IBM, the IBM logo, ibm.com and SPSS are trademarks of International Business Machines Corporation registered in many jurisdictions worldwide. Other product and services names might be trademarks of IBM or other companies. A current list of IBM trademarks is available on the Web at “Copyright and trademark information” at www.ibm.com/legal/copytrade.shtml
BeSmart, antes AMSS Mardoqueo Fernández 207 Providencia | Santiago F: +56 224153478 M:
[email protected]
The content in this document (including currency or printing references which exclude applicable taxes) is current as of the initial date of publication and may be changed by IBM at any time. Not all offerings are available in every country in which IBM operates. THE INFORMATION IN THIS DOCUMENT IS PROVIDED “AS IS” WITHOUT ANY WARRANTY, EXPRESS OR IMPLIED, INCLUDING WITHOUT ANY WARRANTIES OF MERCHANT ABILITY, FITNESS FOR A PARTICULAR PURPOSE AND ANY WARRANTY OR CONDITION OF NON-INFRIGEMENT. IBM products are warranted according to the terms and conditions of the agreements under which they are provided.