Story Transcript
BLOQUE TEMÓTICO B (M.E.U) PARTE B1: TEMA 1-2-3-4-5-6 TEMA 1: CONCEPTOS BÓSICOS A.) ESCALAMIENTO: Parte de la PsicometrÃ−a cuyo objetivo pral es desarrollar escalas de medición. Puede clasificarse en : -Escalamiento psicofÃ−sico: Se ocupa de desarrollar escalas de dimensones psicológicas que tienen un referente fÃ−sico inmediato. Por ej: Si se está escalando el peso percibido que manifiesta un sujeto para un conjunto de objetos, dado que la ordenación o la escala de objetos que se genera a partir de las respuestas del sujeto puede contrastarse con la medición fÃ−sica del peso de los objetos que arroja una balanza. -Escalamiento psicológico: Se ocupa de desarrollar escalas de dimensiones psicológicas que NO tienen un referente fÃ−sico inmediato. Por ej: Si se está escalando un conjunto de objetos en función de su belleza o en función de su utilidad percibida, la escala resultante no puede contrastarse con una escalad e medidas fÃ−sicas sobre belleza o sobre utilidad. Estas dos dimensoines no tienen un referente fÃ−sico mesurable. En Psicometria se habla de escalamiento psicológico. B.) ESCALA: -Procedimiento de medida (se usa como sinónimo de medición en gnal) -Instrumento de medida particular (test o prueba especÃ−fica) -Subconjunto de Ã−tems dentro de un test que miden una misma cosa, que se refieren a una misma dimensión -Serie de objetos ordenados por el grado o la intensidad con que manifiestan una propiedad -Números asignados a los objetos en función del grado con que manifiestan una propiedad -Relación o tipo de rlación entre los números y los objetos en función del grado en que manifiestan una propiedad -Conjunto formado por: -Serie de objetos ordenados por el grado o intensidad con que manifiestan una propiedad -Números asignados a los objetos -Relación o tipo de relación que describe cómo estan asociados los números a los objetos en función del grado en que manifiestan una propiedad. Las definiciones a, b y c pueden considerarse usos gnales; la d, e, f y g usos técnicos. 1
-Usos generales: El concepto de escala, se utiliza, a veces para referirse a cualquier medición o resultado de la misms;”escalar es medir”; escala=test. Por ej: “la escala de inteligencia de Raaven”. Escala como un subconjunto de items dentro de una prueba que miden una misma dimensión o un mismo factor, o en el test se puntuan por separado. Por ej: “la escala B del 16 PF”. -Usos técnicos: Las escalas suelen estar formada por tareas, problemas o enunciados que se denominan Ã−tems. à stos están ordenados en función de alguna propiedad o dimensión psicológica relevante. La definición g es la más completa. Incluye el concepto tanto de los Ã−tems mismos que constituyen fÃ−sicamente el instrumento como los números asociados a ellos y la relación particular que hace insustiutible los objetos por los números, en función del grado en que aquellos manifiestan alguna propiedad. • ESCALAMIENTO UNIDIMENSIONAL Y MULTIDIMENSIONAL: -Escalamiento unidimensional: Un conjunto de objetos puede ser escalado en sólo una propiedad o en más de una propiedad simultáneamente. Cuando un objeto se representansobre una única dimensión. Permiten asignar un número a cada objeto en función del grado en que el objeto presenta una determinada caracterÃ−stica. Los objetos se ubican a lo largo de una dimensión. -Escalamiento multidimensional: Cuando un conjunto de objetos se representa sobre un plano bidimensional o sobre un espacio de tres o cuatro dimensiones en función del grado en que presentan diversas propiedad o caracterÃ−sticas. Permite asignar a cada objeto varios números (uno por cada dimensión considerada) en función del grado en que cada objeto posee una de las caracterÃ−sticas o dimensiones. Propósito: estudiar la estructura de un conjunto de datos representándolo. D.) ESCALAR PARA MEDIR: El propósito del escalamiento psicológico es elaborar escalas psicológicas. Las escalas psicológicas servirán para efectuar mediciones psicológicas. POR EJ: tres Ã−tems podrÃ−an tener los valores de escala 1 (actitud radicalmente contra el aborto); 5 (actitud intermedia) y 10 (actitud favorable al aborto libre). Una vex que tengamos la escala graduada podremos utilizar ésta para medir sujetos, preguntándoles a aquellos que nos digan cuáles de estos Ã−tems ordenados representan su actitud. POR EJ: a un sujeto se le presentan los tres Ã−tems anteriores y se ls solicita que diga si está de acuerdo o no con cada enunciado. Si el sujeto dice que el enunciado C representa su punto de vista entonces obtiene 10 puntos, lo que le sitúa en el extremo de la escala favorable al aborto libre. Si pudiéramos encontrar otros Ã−tems que ocuparan posiciones intermedias entre A y B, y entre B y C, podrÃ−amos mejorar la exactitd de nuestra medición. • Escala de medida: Conjunto de Ã−tems ordenados A,B y C y sus respectivos valores de escala 1,5 y 10. El término escala puede utilizarse tanto para referirse a los Ã−tems (objetos a escalar) como a sus valores numéricos asociados (valores de escala). El acto de ordenar los Ã−tems en la dimensión y asignarles su valor de escala es el acto de escalar los Ã−tems. -Métodos de escalamiento: métodos que permiten atribuir de un modo objetivo valores de escala a un 2
conjunto de objetos (Ã−tems) en función de alguna propiedad de los mismos. Algunos métodos pueden utilizarse con el propósito de escalar objetos. También hay algunos que permiten medir sujetos directamente, sin necesitar el paso previo de escalar primero los Ã−tems. Genera una escala de referencia sobre la que los sujetos se miden directamente, sin importar la posición de los Ã−tems. De este modo se simplifica el procesos de construcción de un instrumento de medida. -Escalar los Ã−tems: ubicar los Ã−tems en su posición dentro de la dimensión, situarlos sobre una recta o atribuirles un valor numérico que represente esa posición. Los métodos de escalamiento necesitan algún procedimiento y algún criterio de trabajo para poder asignar los números a los objetos: función de escalamiento. Una vez que los Ã−tems estan escalados podemos utilizarlos para medir. Lo + usual es que se le presenten al sujeto los Ã−tems y se le pida que decida de algún modo cuáles representan su propia situación. -Función de puntuación: especifica de qué modo se opera con los valores de escala de los Ã−tems para obtener el valor de escala del sujeto. -Medición del sujeto: determina cuál es la posición (valor numérico) de un sujeto en una escala. Medir a un sujeto es ubicarlo sobre la dimensión considerada. Es importante distinguir entre el proceso de escalar los Ã−tems y el proceso de medir a los sujetos. F.) CARÓCTER SUBJETIVO DE ESCALAMIENTO PSICOLà GICO: El escalamiento psicológico se caracteriza por escalar objetos en dimensiones que no tienen un referente fÃ−sico inmediato. La dimensión “actitud ante el aborto” no tiene un referente fÃ−sico inmediato. Estamos tratando con opiniones o actitudes subjetivas. Nuestro propósito es escalar opiniones subjetivas. Por eso nuestro material de trabajo habrá de ser opiniones subjetivas. El punto de partida es la información subjetiva acerca de qué enunciados son + o - favorables a la dimensión. Es obvio que la opinión de un solo sujeto no parece suficiente. Se trata de tener en cuenta en la ordenación y asignación de valores de escala la opinión de una muestra de sujetos. Los métodos de escalamiento habrán de partir de las opiniones de muestras de sujetos; su objetivo es convertir la percepción que una muestra de sujetos tiene sobre un mismo conjunto de Ã−tems en una escala de esos Ã−tems. Los métofos en sÃ− mismos son objetivos, son rigurosos, operan siempre del mismo modo, ofrecen los mismos resultados independientemente de quién lo utilice. Pero si material de trabajo son opiniones humanas y sus resultados escalas de medida basadas en opiniones de muestras de sujetos. Quizás no hay otro modo de escalar opiniones que partiendo de opiniones. Los métodos de escalamiento permiten estudiar opiniones humanas de modo que puedan ser puestas en relación con otras variables y contribuyan a nuestra comprensión de qué piensan y por qué actúan como lo hacen las personas y los grupos sociales. TEMA 2: PROCESO GNAL DE ESCALAMIENTO Y MEDICIà N A.) PROCESO DE ESCALAMIENTO DE LOS à TEMS Objetivo: Llegar a obtener un conjunto de Ã−tems escalados; llegar a asiganr los valores de escala a un conjunto de Ã−tems. • Generación de Ã−tems y análisi racional de los Ã−tems: Cuestión de creatividad y habilidad del autor de la escala. No obstante existen algunas reglas al crear Ã−tems. • Obtención de información para escalar Ã−tems: escalar opiniones; para ello hay que considerar 3
cuales son las opiniones de muestras de sujetos. Los métodos de captación d einformación se refiren a cómo presentar los Ã−tems y cómo preguntar acerca de ellos a los sujetos para obtener la manifestación de sus opiniones, Objetivo: ordenar y escalar Ã−tems. • Elaboración del valor de escala de los Ã−tems: Utilizar la info que nos brindan los sujetos en sus respuestas ante los Ã−tems para llegar a asignar un valor de escala a cada Ã−tem. Función de escalamiento: función que atribuye valores de escala a los objetos de un modo sistemático. B.) PROCESO DE EVALUACIà N DE LA ESCALA Objetivo: asegurar que la escala tiene propiedades de bondad adecuadas. Es posible tener un conjunto de Ã−tems bien escalados que no obstante no resulten una escala de medida adecuada. Pueden realizarse con datos obtenidos en el proceso de escalamiento de los Ã−tems, pero otras requiere utilizar datos obtenidos en el proceso de medición de los sujetos. • Análisis de Ã−tems: Establecer las propiedades de los Ã−tems, que son: 1.Homogeneidad del Ã−tem, expresada como una correlación entre el Ã−tem y el total de la escala. • Validez del Ã−tem • Dificultad del Ã−tem, de interés solo para los Ã−tems que tienen una respuesta verdadera implicada o confundida con la obtención de valor de escala de estos Ã−tems. • Análisis de dimensionalidad: Responder a la pregunta: ¿Estos Ã−tems forman una única dimensión? Es posible estudiar la estructura de un conjunto de Ã−tems para contrastar si en realidad representan una, dos o + dimensiones. Para estudiar la dimensionalidad se pueden utilizar 3 grupos de técnicas estadÃ−sticas: 1.técnicas de análisis factorial; 2. técnicas de análisis cluster; 3. técnicas de escalamiento multidimensional. Los métodos de escalamiento unidimensional operan como si los Ã−tems estuvieran bien representados por una única dimensión, pero la mayoria de ellos no proponen un contraste de su dimensionalidad. Hay 2 grandes consideraciones que deben tenerse en cuenta. Primero, dos técnicas de análisis de la dimensionalidad, incluso de la misma familias no suelen arrojar la misma solución, y técnicas muy dispares entre sÃ− pueden dar soluciones muy diferentes. Segundo, la dimensionalidad es casi siempre relativa e implica supuestos y decisiones arbritarias.Diferentes propuestas o métodos para evaluar la unidimensionalidad pueden dar también diferentes resultados. • Análisis de fiabilidad: Se refiere a 2 aspectos: 1.Consistencia interna: en qué medida los diferentes Ã−tems o componentes de la escala son consistentes entre sÃ−, es decir,están relacionados midiendo de modo semejante. Responder a cuestiones como: ¿miden lo mismo los Ã−tems pares que los impares?. El coeficiente alfa es la expresión más común de la consistencia interna. 2. Estabilidad temporal: si la escala mantiene una medición estable después de un periodo de tiempo, se mide y un tiempo después se vuelve a medir. • Análisis de validez: Aspecto +importante. Existen 3 tipos de validez: • Validez de contenido: Se refiere a la capacidad de la escala para representar bien el contenido que debe medir. • Validez criterial: Correlacionar adecuadamente con criterios externos. • Validez de constructo: Satisfacer las hipótesis que cabrÃ−a esperar que cumpliera esa escala de 4
medida en función de su cometido. Este tipo de validez engloba cualquier tipo de ellas. Es esencial tanto en el escalamiento psicológico orientado a medir actitudes y opiniones como en cualquier otra parte de la medición psicológica. Es tan esencial evaluar de una escala para medir la actitud ante las drogas como de un test de inteligencia. Los métodos de escalamiento se centran en el proceso de escalamiento de los Ã−tems y consideran también el proceso de medición de los sujetos. Pero éstos NO garantizan la bondad de la escala. Independientemente de qué método de escalamiento se utilice, las escalas resultantes deben ser evaluadas. Este proceso se realiza después de escalar los Ã−tems y antes de poder comenzar a medir sujetos. Suele modificar la escala de diversas formas. Por ej: rechazar Ã−tems, reestructurar la escala en varias subescalas, añadir Ã−tems. Cuando se producen estas reestructuraciones suele ser necesario volver al paso de escalar los Ã−tems con la nueva versión, antes de volver a evaluar. Se produce un bucle de trabajo del que sólo se sale cuando se cumplen las condiciones de calidad necesarias. • Obtención de baremos--->normas de grupo: Conocer la distribución de las puntuaciones en la muestra de interés y establecer equivalencias entre las puntuaciones en la prueba y las posiciones relativas en esa muestra. El procedimiento + simple y + utilizado es calcular percentiles. Este tipo de normas permiten interpretar las puntuaciones de los sujetos en relación a un grupo. C.) PROCESO DE MEDICIà N DE LOS SUJETOS Objetivo: = al proceso de escalamiento; se trata de llegar a asignar a cada sujeto el valor de escala que mejor lo representa, ubicarlo sobre la dimensión. • Obtención de información para medir a los sujetos: Con el propósito de medir a los sujetos. Se trata de cómo presentar los Ã−tems a los sujetos, y cómo preguntarles a los sujetos acerca de los Ã−tems, de modo que sus respuestas puedan ser utilizadas para establecer cual es la opinión del sujeto. Para establecer “qué mide” el sujeto en esa dimensión Muchas veces los mismos métodos de capatción que sirven para escalar los Ã−tems sirven también para medir a los sujetos. • Elaboración de la puntuación de los suejetos en la escala.: componer los puntos que el sujeto ha obtenido en los Ã−tems en una única puntuación que represente la puntuación del sujeto. • Función de puntuación: Aquella que atribuye valores de escala a los sujetos de modo sistemático a partir de sus respuestas a los Ã−tems. TEMA 3: ELABORACIà N DE à TEMS Los métodos de escalamiento no siempre escalan Ã−tems en el sentido de enunciado o problemas que constituyen la unidad mÃ−nima de tests e instrumentos de medición. Los métodos de escalamiento pueden escalar cualquier tipo de OB (personas, palabras...), sobre los que los sujetos pueden manifestar opiniones o tener percepciones diferentes. Pero lo + frecuente es que los métodos de escalamiento unidimensional se utilicen para escalar Ã−tems con el propósito de medir sujetos. *Concepto de Ã−tem:
5
Cada uno de los estÃ−mulos mÃ−nimos que demandan una respuesta del sujeto. Molécula de una escala o de un test, la unidad mÃ−nima en que puede subdividirse una escala conservando su significado de medición. Unidad mÃ−nima de una medida psicológica. Es para el sujeto, una unidad de comprensión o significación y una unidad de demanda de respuesta y para el psicólogo una unidad de calificación psicométrica. No tienen porque ser enunciados escritos, pueden ser problemas orales, gráficos...etc. Lo + frecuente es que se trate de Ã−tems en forma de enunciados escritos a los que el sujeto debe responder. La sencillez, economia y utilidad mostrada por las pruebas de “lápiz y papel” han hecho de ellas el canal de medición + utilizado. *¿Cómo elaborar los Ã−tems? No hay un procedimiento universal. Depende de la creatividad y los conocimientos del creador de la escala. Puede obtenerse cualquier tipo de fuente para obtener sugerencias. Existen algunas consideraciones: Hay que estar bien informado sobre el tema; y hay que intentar establecer partes, contenidos, variantesd, zonas o manifestaciones que tiene aquello que se quiere medir, con el propósito de que el instrumento de medida refleje esa variedad y composición. Se dice que un instrumento tiene validez de contenido cuando muestra bien todo el rango de contenidos de aquello que se quiere medir. El instrumento de medida debe muestrear adecuadamente el contenido de la dimensión a medir. Puede resultar útil apuntar todos los items que se sea capaz de generar para después pasar a un análisis racional y a una elaboración de lo aprvechable de los mismos. Si se trabaja en grupo, algunas técnicas como el “ brainstorming” (tormenta de ideas) puede ser de utilidad. Los items deben pasar un análisis racional y tener en cuenta ciertas propiedades recomendables. *Propiedades recomendables: Pueden resumirse en sencillez y claridad de expresión y contenido, indicados para el contenido a medir y muestrearlo adecuadamente y favorecer que se manifiestan las diferencias individuales en la dimensión a medir. Según EDWARDS (1957): -Lenguaje sencillo, claro y directo -Items redactados en forma de frases simples -Cada item debe expresar un solo pensamiento completo -Evitar palabras de contenido absoluto (“nada”, “simepre”...). Que pueden favorecer la ambigüedad del enunciado. Sobre todo, los items con negaciones o doble negaciones resultan muy confusos. -Evitar palabras imprecisas (“meramente”, “precisamente”...) -Evitar que los items puedan interpretarse de + de un modo -Evitar que los items sean irrelevantes al OB psicológico bajo estudio -Seleccionar items que cubran todo el rango afectivo de la actitud bajo estudio. Por ej :deben incluirse items desde el extremo de rechazo absoluto hasta el de aceptación absoluta, muestreando los puntos intermedios
6
-Evitar items que sean afirmados o negados por casi todos. -Evitar items cuyo contenido se refiera al pasado en lugar de al presente - Evitar items que se refieran o que pueden interpretarse como referidos a cuestiones de hecho, cuya respuesta se basa en el conocimiento de datos reales. Si un item contiene una afirmación tenida como un hecho, difÃ−cilmente su respuesta dependerá de la actitud del sujeto. TEMA 4: PROCEDIMIENTOS DE CAPTACIà N DE INFORMACIà N : TAREAS DE JUICIO Y DE RESPUESTA TORGERSON (1958) es el encargado de hacer esta distinción (de orientación): • Los métodos de juicio: Se solicita al sujeto que juzgue un Es o un conjunto de Es respecto de las propias caracterÃ−sticas del Es, sin referencia a las preferencias, actitudes o caracterÃ−sticas del sujeto que contesta. • Los métodos de respuesta: Se pregunta al sujeto sobre su relación con el Es; se trata de saber si entre el sujeto y el estÃ−mulo existe una relación particular. Un ejemplo con los siguientes items: A.Creo en Dios, como un ser superior, todopoderoso, del que todo viene y hacia el que todo va. B. Creo que Dios no existe, se trata tan solo de una invención cultural humana. Si enfrentamos a una persona religiosa con estas 2 frases, y le solicitamos que escoja la que representa un punto de vista + religioso (tarea de juicio), elegirá la afirmación A. Si una persona atea realiza la misma tarea de juicio, también escogerá la afirmación A. AsÃ−, una persona religiosa y otra atea estarán de acuerdo, pero si le preguntamos a estas dos personas cuál de ambos enunciados representa mejor su punto de vista, su opinión personal (tarea de respuesta) una persona religiosa escogerá el enunciado A y una persona atea el enunciado B. Uso de las tareas de juicio y respuesta: Algunas veces no se puede distinguir entre las tareas de juicio y de respuesta. Si por ejemplo le presentamos a un sujeto dos obras de arte y le preguntamos que cuál de ellas le parece + bella, no es fácil decidir si la respuesta del sujeto se debe a una cualidad de las obras de arte (juicio) o del sujeto (respuesta). Es + probable el uso de las tareas de juicio para escalar los items (es `frecuente), pero también se utilizan las tareas de respuesta. La medición de los sujetos supone utilizar tareas de respuesta. El proceso + corriente en los métodos de escalamiento consiste en utilizar una tarea de juicio para obtener información para escalar los items y después utilizar esos items en una tarea de respuesta para conseguir medir los sujetos. Un mètodo de obtención de información es un procedimiento o tarea por el cual obtenemos el juicio o la respuesta de un sujeto ante un Ã−tem o un conjunto de Ã−tems. à ste acba en la respuesta o juicio del sujeto ante la tarea. Cómo se valoreesa rspuesta o juicio y qué se haga con las puntuaciones hasta obtener la escala es ya cuestión del procedimiento de escalamiento que se utilice. Los datos recogidos por un mismo método pueden utilizarse con distintos procedimientos de escalamiento. Lo inverso también es cierto: un mismo procedimiento de escalamiento puede utilizar diferentes métodos de obtención de información. Sin embargo, no todos los procedimientos de escalamiento pueden utilizarse con todos los métodos de 7
obtención de información. Los métodos de obtención de información y los procedimientos de escalamiento son piezas distintas dentro de un método de escalamiento es sentido global. Por el tipo de tarea pueden clasificarse en: A.) CATEGà RICAS: (TAREAS DE ELECCIà N): • Tarea de estÃ−mulo simple: Al sujeto se le presentan los n Es de uno en uno (k=1), ante cada Es el sujeto escoge “si” o “no” dependiendo de si el estÃ−mulo cumple o no una propiedad. Por ej: ¿considera usted que esta opinión es favorable al aborto? a) Si b)No Como aprovechar este método para escalar los Ã−tems? De esta tarea de estÃ−mulo simple (juicio) puede derivarse información que permita escalar los Ã−tems. Si tenemos una muestra de sujetos, cada uno de los cuales realiza esta tarea para cada Ã−tem, entonces para cada item tendremos la frecuencia de sujetos que ha dicho “si”. Rsulta claro que pueden ordenarse los items de más (más frecuencia de “sies”) a menos favorable al aborto, y utilizar la frecuencia de “sies” como información para determinar las puntuaciones escalares de los items. II.) Tarea de elección de alternativas: Al sujeto se le presentan los n Es de uno en uno (k=1). Ante cada Es el sujeto escoge entre tres o más alternativas aquella que mejor describe en que grado el Es cumple una propiedad (escala gradual) Por ej: ¿en qué medida considera usted que este enunciado representa una opinión favorable al aborto. Escoja una de las alternativas. a.)nada favorable b.)poco favorable c.)bastante favorable d.)muy favorable El sujeto está calificando cada Ã−tem con una puntuación de 1 a 4 en función de la favorabilidad al aborto de cada item. Cada sujeto da a cada item una puntuación de 1 a 4. El texto que acompaña o explica cada grado se denomina “anclaje” o “anclaje verbal”, para indicar un lugar de la escala al que se ha pretendido dar significado en lenguaje común. ¿Como aprovechar este método para escalar los Ã−tems? Si sumamos los puntoa que ha obtenido cada item a través de todos los sujetos podremos clasificar los items del más favorable (puntuación más alta) al menos favorable, y estas puntuaciones ofrecerán la información de partida para determinar los valores de escala. Una variante de este método consiste en promediar la puntuación que ha obtenido cada item de todos los sujetos y utilizar estos promedios para obtener el valor de la escala. *Variante de asignaciónn libre de puntuación dentro de un rango: Hay una variante de este método que a veces se utiliza tanto con fines de juicio como de respuesta. Consiste en permitir que el sujeto asigne al estÃ−mulo no sólo los valores enteros que acompañan a las alternativas, sino cualquier valor decimal comprendido entre el máximo y el mÃ−nimo de la escala. De este modo se pretende que el sujeto pueda expresar de un modo más preciso su evaluación del estÃ−mulo.A veces el procedimiento se vuelve más 8
abierto suprimiendo las “alternativas” entera y sus textos. Se pide al sujeto que asigne un número entre un máximo y un mÃ−nimo.l uso de un máximo y un mÃ−nimo sin textos que actúen como anclajes vuelve más ambigua y subjetiva la interpretación de la escala de respuesta. B.) COMPARATIVAS: III.) Comparación de Es por pares: Al sujeto se les presentan los n Es en grupos de dos (k=2). Ante cada par el sujeto decide cual de ambos cumple en + grado con una propiedad. Por ejemplo: supongamos que tenemos los 3 estÃ−mulos A, B y C, podemos formar todos los pares posibles entre ellos: AB- BC-AC Le presentamos el primer par de enunciados (Par A-B) a un sujeto y le preguntamos: ¿Cuál de estos dos Es es más favorable al aborto”? Después les presentamos el siguente par y le volvemos a hacer la misma pregunta. Y asÃ− con todos los pares. Después se repite el mismo proceso con cada sujeto. ¿Como aprovechar este método para escalar los Ã−tems? Cada Es aparece en el mismo número de pares. Si hay n Es, cada Es aparece en n-1 pares. Un Es concreto aparece en un par con cada Es que no es el mismo. Por tanto, si un sujeto dice que un Es concreto es el “mayor” en cada par en que aparece ese Es, como máximo lo habrá escogido como el mayor n-1 veces, cada vez que se le ha presentado en un par. Si un Es A ha sido escogido por un sujeto n-1 veces, ningún otro Es B puede ser escogido n-1 veces. Dado que el sujeto sólo puede escoger nedesariamente un Es de cada par; y dado que hay uno y sólo un par (A,B), entonces, un Es B puede ser escogido en el caso máximo en n-2 casos. Si se generaliz este razonamiento se encontrará que el método permite obtener, para cada sujeto, un conjunto de elecciones graduadas. Si hay N sujetos, tenemos N(n-1) informaciones sobre cada Es. Para escalar los items a partir de esta información bastará con contar el número de veces que cad Es ha sido preferido a los demás. Por ej: el Es A: ¿Cuantas veces ha sido elegido como más favorable al aborto? Como máximo el Es A puede haber sido elegido N (n-1) veces como el +favorable al aborto (en el supuesto de que fuera el Es + favorable al aborto y todos los sujetos estuvieran de acuerdo en ello), y como mÃ−nimo 0 veces (en el supuesto de que fuera el - favorable al aborto y los N sujetos que actúan como jueces estuvieran de acuerdo). De este modo, después de una tarea de comparación de Es por pares, cada Es ha recibido una puntuación entre 0 i N (n-1). Puntuación fácil para escalar los items. *Número de pares: Este método presenta la dificultad práctica de que el número de pares a presentar a cada sujeto crece muy deprisa al incrementarse el número de Es a escalar. Para 3 Es sólo hacen falta 3 pares, ero para 10 Es ya son necesrios 45 pares. Por ello casi nunca rsulta práctico utilizar este método de captación con + de 10 Es. Cuando el número de Es es grande también es posible obtener todos los pares pero no presentar todos los pares a los sujetos. Se puede presentar una muestra, aleatoria o compensada, de pares. Puede utilizarse la misma muestra para todos los suejtos o diferentes muestras aleatorias para todos o parte de los suejetos. *Consistencia de los sujetos: un par es un conjunto de dos elementos donde importa el orden. Con el conjunto C formado por los Es A y B pueden formarse los pares A-A, A-B, B-A y B-B. Sin embargo, aquÃ− hemos utilizado el término par de un modo diferente, para designar cualquier combinación sin repetición de lpos 9
Es. En este uso el par A-A no tiene sentido, dado que no tiene sentido preguntarle a un sujeto si el Es A tiene + o - de una ualidad que el Es A. En este uso el par A-B se considera el mismo que el par B-A. Si los sujetos responden de un modo lógico y sin errores,entonces se puede suponer que si escogen A como mayor que B en el par A-B harian lo mismo en el par B-A. En la práctica, esto puede no ser siempre asÃ−. Algunas veces puede resultar d einterés poner a prueba esta hipótesis ofreciendo ambos pares- en posiciones distanciadas- para que el sujeto los juzgue. Si en una tarea de escalamiento se introducen los dos pares que contienen los mismos dos elementos, se puede contrastar- salvo efectos de memoria- la consistencia de los jueces. Por otra parte, si tenemos 3 Es A, B y C y un sujeto ha afirmado que A>B y que B>C, entonces deberÃ−a afirmar que A>C. Sin embargo, es posible que un sujeto responda que C>A; en este caso, no queda claro cuál de los 3 Es es el que presenta mayor grado la cualidad. Cuando esto sucede se dice que se ha formado una trÃ−ada circular. El número de trÃ−adas circulares que aparecen en unos datos sirve para poner de manifiesto el grado de consistencia de los sujetos. Algunas veces si unos Es presentan inconsistencias, mediante el control de pares o mediante el control de trÃ−adas, ello puede ser atribuido a que los Es no son escalables, en lugar de atribuirlo a que los sujetos no son consistentes en sus juicios o en sus respuestas. En realidad, lo único que tenemos, si esto sucede, son unos datos inconsistentes que pueden deberse a que los sujetos no son conscientes, a que los Es no son escalables, a otros defectos prácticos -por ej: los sujetos no entendieron bien las instrucciones o por distracciónLa repetición del proceso (variando los sujetos, variando los Es) puede ofrecer datos acerca de cual es la razón de la dificultad. *Comparación de Es por pares y método de las comparaciones apareadas de Thurstone: El método de comparaciones apareadas es el nombre de un método de escalamiento en su totalidad, cread por Thurstone. Este método utiliza la comparación de Es por pares como método de captación de información, pero no como un método de escalamiento que es, asume además determinados supuestos y procesos particulares para escalar los items. Por eso, no puede confundirse el método de las comparaciones apareadas, que es un método de escalamiento con todos sus pasos hasta la medición del sujeto, con el método de comparación de Es por pares, que es tan solo un método de obtención de info. IV.) Comparación de Es por grupos: Al sujeto se le presentan los n Es en grupos de tres o más (k>2). Ante cada grupo el sujeto decide qué Es cumple en + grado con una propiedad. Por ej: podemos agrupar 5 enunciados, con contenidos sobre el tema de la discriminación racial, en todas las combinaciones posibles de 3 enunciados, y pedirle al sujeto que elija cual de los 3 enunciados de cada grupo enuncia una idea + xenófoba. En este caso se tratarÃ−a de una tarea de comparación de Es por trÃ−os, orientada a juicio. A. Todas las personas han de ser iguales ante la ley, sin distinciones por razones de raza, sexo o religión. B. DeberÃ−a limitarse el nº de emigrantes extranjeros que acepta la Com.Europea, de lo contrario no habrá trabajo para los europeos. C. Iun extranjero sin dinero y sin trabajo debe ser inmediatamente expulsado. D. Los servicios sociales deberÃ−an atender preferentemente a los extranjeros sin recursos, sin trabajo o sin vivienda E.DeberÃ−an arbitrarse fórmulas legales para limitarse la estancia de extranjeros emigrantes, protegieno 10
sus derechos y los de los trabajadores locales. Se forman todas las combinaciones posibles de 3 enunciados: ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE En total, 10 combinaciones o grupos de 3 enunciados. Ahora se les presentan a cada sujeto, y ante cada trÃ−o de enunciados se le pregunta: ¿Cúal de estos 3 enunciados cree Ud que expresa una idea + contraria a los extranjeros? El sujeto produce una elección por cada trio. Por ej: ante el primer trio de enunciados, ABC, un sujeto puede responder que el enunciado C es el + xenófobo. Esto puede representarse asÃ−: C> (A ó B) El sujeto emite tantos juicios como trÃ−os se les presentan: 10 en este caso. El procedimiento puede también realizarse con grupos de 4 Es, de 5 es, de 6 Es...El tamaño del grupo de Es que se presentan juntos al sujeto (=k), puede variar entre 3 y n, siendo n el nº total de Es a escalar: 3n Nº de grupos en que aparece un Es: Cada Es aparece en el mismo nº de grupos. En el ejemplo anterior cada enunciado aparecÃ−a en 6 trios. Dados n Es, que queremos presentar en todos los grupos posibles de k Es, cada Es estará en tantos grupos como combinaciones de k-1 Es puedan formarse con n- 1 Es. *Mirar pà g 48-49-50 (fòrmules). *Variantes del método respecto al número de grupos preentados a cada sujeto: Cuando el nº de Es es grande, es posible obtener todos los grupos pero no presentar todos los grupos a los sujetos. Se puede presentar una muestra, aleatoria o compensada, de esos g grupos. Puede utilizarse la misma muestra de grupos para todos los sujetos o diferentes muestras aleatorias, sucesivas o ordenadas, para todos o parte de los sujetos. Por ej: si tenemos un valor g muy alto, es posible presentar a los sujetos una parte del total de grupos en un proceso cÃ−clico. Es decir, los 10 primeros grupos se presentan al sujeto 1, los 10 segundos al sujeto 2,etc. 11
Cuando se terminan los pares se vuelve a empezar. Fijado N de la muestra, el nº de grupos que se presenta a cada sujeto, nº que denominaremos d., determina el nº de sujetos que juzga cada Es. El valor de d se escoge de modo que sea un valor razonable y queg/d sea exacto (en lo posible). El valor N/(g/d) también debe ser exacto para que cada grupo, y cada Es haya sido enjuiciado , al final, el mismo nº de veces. Estas posibilidades permiten también obtener para cada Es el nª total de veces que ha sido preferido a otros y a partir de ese total, operar par obtener el valor de la escala. También se puede estudiar la consistencia de los sujetos. *El caso particular k=n: Si k (nº de Es que se presentan en cada grupo) es igual a n (nº total de Es), entonces la tarea se reduce a presentar todos los Es a la vez y preguntarle al sujeto cuál de ellos presenta + o - de una cualidad concreta. Si tenemos N sujetos a los que se presenta una tarea de comparación de Es con k=n, entonces la puntuación de un Es concreto puede variar entre 0 (ningún sujeto lo escoge como el mayor de la dimensión) y N (todos los sujetos lo escogen como el mayor de la dimensión). Una tarea de comparación con k=n simplifica el trabajo de los suejtos y el cómputo de puntos recibidos por cada Es;pero, reduce la información disponible para escalar los Es. Si los N sujetos coinciden en considerar a un Es determinado como el que posee en + grado la cualidad bajo consideración, la puntuación de ese Es en este método será N, pero todos los demás Es presentarán una puntuación 0, porque no habrán sido escogidos ni una sola vez. Cuanco k tiende a n el proceso tiende a volverse más sencillo (- grupos que presentar a cada sujeto) pero el resultado tiende a ser + tosco (oportunidades tienen los sujetos de mostrar los amtices de sus preferencias). Cuando k tiende a n el método tiende a perder precisión, a ofrecer - info. * Nº de grados de desigualdad que pueden extraerse de n Es presentados a elección en grupos de k.: Si tenemos 4 elementos A,B,C y D y los presentamos en un solso grupo (k=n=4), u sujeto sólo puede establecer o manifestar la desigualdad entre un Es y todos los demás. Po ej: el Es A es el que presenta más cualidad, el + alto de la dimensión: A> (B,C ó D) AquÃ− solo se ha obtenido un grado de desigualdad, una relación de desigualdad. Sabemos que A es mayor que cualquiera de los otros tres Es, pero no sabemos qué relación hay entre B y C, entre B y D o entre Cy D; sólo sabemos que cualquiera de los 3 está por debajo de A en la dimensión bajo consideración. Con 4 Es y k=4 sólo hemos podido establecer un grado de desigualdad. Si 4 Es lo presentamos en grupos de 3 (k=3), un sujeto sólo puede establecer dos grados de desigualdad, por ej: A>B>(C ó D) Si los presentamos por pares (k=2) un sujeto puede manifestar la desigualdad ente todos los Es, por ej: A>B>C>D. Estableciendo tres grados de desigualdad que es el máximo de desigualdades encadenadas que puden realizarse con 4 elementos. En gnal, con n elementos se pueden establecer como máximo n-1 grados de desigualdad. En gnal, con n Es a escalar y k Es en cada grupo, siendo 2
de los Es.el hecho de que cuando k>2 no se pueda obtener el orden completo de Es hace este método recomendable. *Redundancia y control de consistencia: Al aumentar el valor de n el nº de pares redundantes crece muy deprisa, mientras que el nº de pares significativos crece despacio. La diferencia entre info significativa y redundante crece rápidamente en función de n. Sea cual sea el valor de k, toda la info redundante puede utilizarse para controlar la consistencia de los sujetos en sus respuestas. En cualquier caso, el investigador no necesita grados tan altos de redundancia, lo que suele llevar a preferir métodos de captación de info + sencillos. *Paradoja entre consistencia de los jueces y precisión del escalamiento: Si todos los suejtos están de acurdo en que un Es A es el que posee en + grado una cualidad, entonces en el caso n=k, todos elegirán ese Es, y su puntuación será N. Ello impica, una situación de escalamiento muy pobre: el Es A es el mayor y no sabemos nada acerca de todos los demás Es, excepto que son menores que A en la cualidad bajo consideración. Sin embargo, ello indica una perfetca consistencia. Si todos los jueces eligen un mismo Es como el mayor, los jueces actúan unos con otros consistentemente. Si ocurre la situación contraria donde: A>B>C>D; Se podrá escalar de un modo preciso cada Ã−tem pero ello es asÃ− debido a que los jueces son inconsistentes. En la medida que tenemos precisión ello denota inconsistencia y en la medida en que tenemos inconsistencia de ella derivamos precisión. *La información métrica como producto de la inconsistencia: Cuando se usan N jueces aparecen discrepancias en la info ordinal que dan, aparecen inconsistencias en sus juicios de desigualdad. Esas inconsistencias se traducen en las frecuencias con que un Es es juzgado mayor que otro. Por ej: en un par (a-b) el 80% de los jueces puede afirmar A>B y el 20% restante B>A, mientras que en un par (B-C) el 60% de los jueces dice B>C mientras que el 40´% restante dice C>B. Algunos métodos de scalamiento utilizan de diferentes modos esa frecuencias para calcular las distancias entre los Es. En el caso (A-B) si el 80% dice A>B y sólo el 20% dice que B>A debe ser que la diferencia entre A y B es más clara y por tanto, mayor que la diferencia entre By C. A>B>C pero que la distancia entre A y B es mayor que la distancia entre ByC, y todavia más, cuantifica es distancia a partir de las diferencias en frecuencias. (exemple pà g.57) Lo que se está escalando no es solo los Es en función de sus cualidades sino también la inconistencia de los jueces. ( TAREAS DE ORDENACIà N) V.) Ordenación de Es por grupos: Al sujeto se le presentan los n Es en grupos de tres o más (k>2). Ante cada grupo el sujeto decide en qué orden de mayor a menor cumplen los Es una propiedad. *Puntuación mÃ−nima y máxima: En cada trÃ−ada cada enunciado puede haber recibido un 1 (posición + 13
baja), un 2 (posición intermedia) o un 3 ( + alta). La puntuación máxima de cada trÃ−ada depende de k. Es decir, en cada grupo los Es se puntúan de 1 hasta k. *Redundancia y control de consistencias; 1.ABC 2.ABD 3.ACD 4.BCD Y el sujeto las puntúa asÃ−: c=3, b=2 y a=1. Significa que ha establecido dos grados de desigualdad:C>B>A. Y solo nos queda sber qué posición ocupa el Es D para tener la ordenación completa. Después se presenta la terna ABD y lo puntúa: D=1,A=2 y B=3. El sujeto ha ordenado los items asi: B>A>D. Observamos que: ya tenemos la escala completa: C>B>A>D,por tanto ya no necesitamos presentar ninguna terna más, toda la info que nos dieran otras ternas servirÃ−a como control de consistencia. Y aún dentro de esta terna: B>A es redundante, y solo sirve como control de consistencia. La mayorÃ−a de las veces el investigador no necesita tanta redundancia de info como control de consistencia. Por eso, este procedimientono resulta práctico. VI.) Ordenación total de los Es: Al sujeto se le presentan los n Es a la vez (k=n). El sujeto decide en que orden de mayor a menor cumplen los Es una propiedad. Con este procedimiento cada Es obtiene para cada sujeto una puntuación entre 1 y n. para N sujetos, por tanto, entre N y Nn. En una muestra de N sujetos cada Es puede haber recibido una puntuación total entre 0 y N (n-1) Los investigadores suelen preferir esta variante con n=k porque da una tarea más clara, que los sujetos entienden y que resulta sencilla y rápida, permitiendo obtener el orden completo de los Es. *Carácter ipsativo de los datos de ordenación de Es: el rango de puntuaciones que un sujeto puede escoger para un Es depende del rango de puntuaciones que haya fijado para el/los Es anteriores enjuiciados. La puntuación de unos Es depende de la que han recibido otros. En el caso del último Es a juzgar la dependenci es total, por eso, para describir n Es basta con concocer n-1 puntuaciones. Lo que diferencia a este método respecto los otros es que este mismo método fuerza al sujeto a ser consistente consigo mismo. --->Cualquiera de estas tareas de puede presentar con orientación de juicio o de respuesta -Relación entre los métodos de obtención de información• La tarea III es un caso particular de la IV, ya que en ambos casos se trata de comparación de Es por grupos. La tarea IV es un caso particular de la V, ya que en ambos casos se trata de ordenación de Es por 14
grupos. El caso IV puede considerarse en un caso particular del caso V. Que el caso IV es un caso truncado del V se ve claro cuando consideramos k=2. Con k=2 es igual que se pida una tarea de ordenación o de elección; escoger un Es de 2 es ordenar dos Es; por eso el caso III es a la vez un modo del caso V. • Los casos I a IV pueden considerarse métodos de elección: en todos ellos el sujeto brinda una sola unidad de respuesta ante cada cuestión que se le pregunta. El sujeto escoge bien una sola alternativa (caso I y II), bien un solo Es (caso III y IV) . Los casos V y VI son métodos de ordenación ; donde en todos ellos el sujeto brinda tantas respuestas ante cada cuestión como k Es. • Los métodos I y II no producen información redundante. Tampoco el método IV en su variante k=n. El método VI produce una única información redundante independientemente del valor de n o de k. • Los casos I y II no utilizan unos Es como punto de referencia para las afirmaciones sobre otros. Todos los demás métodos (III, IV, V i VI) sÃ−. En los cuatro últimos casos los grados de desigualdad se establecen como una relación entre los Es. Los casos III, IV, V i VI están diseñados para expresar cadenas de desigualdad entre Es donde cada Es tiene un lugar de orden y sólo un lugar de orden y cada lugar de orden tiene uno solo Es. El caso I sólo permite expresar un grado de desigualdad de modo que cada Es tiene un lugar; pero un lugar (si n>2) ha de tener más de un Es. El caso II permite expresar cadenas de desigualdad donde cada Es tiene un lugar pero varios Es pueden albergarse en un mismo lugar. Los casos I y II pueden interpretarse como un modo de los métodos de elección con k=1. Los casos I y II pueden interpretarse como métodos que comparan los Es con una “escala de Rs” previa, y no con otros Es. • El caso I puede verse como un caso particular del II (con el nº de alternativas reducidas a 2); o bien, al revés, el caso II puede verse como una extensión del I, aumentando el nº de opciones graduadas de Rs por encima de 2. • Los métodos de escalamiento pueden caracterizarse en función de: • Cuántos elementos se presentan al suejeto en cada grupo (k) • Cuántas decisiones ha de ofrecer el sujeto en cada grupo (1 para los métodos de elección; k-1 para los métodos de ordenación) • Cuántos grupos de decisión de los posibles se les presentan al sujeto (posible muestras). -Métodos frecuentemente aplicados-: -En la práctica es muy común utilizar los métodos I y II con orientación de respuesta. -Con orientación de juicio han tenido un gran uso determinadas interpretaciones del caso II, el caso III i el caso IV. -Los métodos de escalamiento presentan diferentes modos de aprovechar esas puntuaciones brutas transformándolas en los valores de escala de los Es. -Otros métodos-: -Agrupamiento libre de los Es en grupos en función de su similitud -Comparación de Es con uno tomado como modelo, decidiendo si son semejantes o no. -Comparaciones de pares. El sujeto dice cuál de dos pares tiene Es + semejantes -Estimación de semejanzas. El sujeto dice en qué cantidad de una escala son semejantes 2 Es. -Otros. Mà TODOS DE OBTENCIà N DE INFORMACIà N
15
MÃ TODOS DE JUICIO I.A
I. TAREAS DE ES SIMPLE II. TAREAS DE ELECCIà N DE ALTERNATIVAS II.A II.1.Asiganción libre de puntuaciones III.COMPARACIà N DE ES POR PARES IV. COMPARACIà N DE ES POR GRUPOS
MÃ TODOS DE RESPUESTA I.B II.B
II.1.A
II.1.B
III.A
III.B
IV.A
IV.B
IV.1. Cso de k=n V. ORDENACIÃ N DE ES POR V.A GRUPOS VI. ORDENACIÃ N DEL VI.A GRUPO TOTAL DE ES
V.B VI.B
PARTE B2: Mà TODOS DE ELABORACIà N DEL VALOR DE LA ESCALA DE LOS ESTà MULOS (TEMA7-8) TEMA 7: PROCEDIMIENTO DE ESCALAMIENTO DE LOS ESTà MULOS Los procedimientos de captación de información permiten a los sujetos expresar sus juicios o respuestas ante los ob (estÃ−mulos, enunciados...) que se trata de escalar. Esa información hay que elaborarla hasta obtener el valor de la escala de esos objetos, su ubicación numéricamente definida, sobre la dimensión bajo consideración. -Función de escalamiento: Asigna valores de escala a los OB partiendo de la información (juicios o respuestas) emitidas por los sujetos. En la práctica se traducen en procedimientos o métodos para obtener el valor de la escala a partir de la información ofrecida por los OB. Los métodos de obtención de información no son los únicos modos de obtener puntuaciones brutas o directas a partir de aquéllos. Pero éstos son modos muy frecuentes de aprovechar las respuestas o juicios. Los métodos de obtención del valor de la escala a partir de las puntuaciones directas pueden presentar una diversidad de formas- pero consisten en transformaciones de esas puntuaciones directas y en la elección de algún tipo de estadÃ−stico de las distribuciones de las mismas como valor de escala para los estÃ−mulos. -ALGUNOS Mà TODOS DE ELABORACIà N DEL VALOR DE LA ESCALA DE LOS ESTà MULOS• ESTADà STICO DE TENDENCIA CENTRAL • Media • Mediana Tomar un estadÃ−stico de tendencia central (media, mediana, moda) como valor de la escala. Genalmente se usa la media, pero algunos métodos prefieren la mediana. EJEMPLO:
16
Tenemos cuatro Es: A,B,C,D, y cuatro sujetos que actúan como jueces: s,d,f,g. A cada juez se le presenta cada estÃ−mulo separadamente y han de decir en qué grado: 1.Nada 2. Poco 3. Regular 4. Bastante 5. Mucho Los estÃ−mulos tienen la propiedad P. El sujeto s asigna al estÃ−mulo A un 3, al B un 5, al C un 1 y al D un 2. en la siguiente tabla se reflejan las puntuaciones que han dado los 4 jueces a los 4 Es: ABCD s3512 d2522 f2513 g3522 Ahora podemos calcular el valor de escala de cada Es como el promedio de las puntuaciones que le han dado los jueces. Valor de escala del Es A: 3+2+2+3/4= 2'5 ..... Que podemos representar en una escala: 0 0'5 1 1'5 2 2'5 3 3'5 4 4'5 5 CDAB • PROPORCIà N A UN VALOR DADO -Proporción al máximo • máximo teórico • máximo empÃ−rico -Proporción al máximo-mÃ−nimo -Proporción de una respuesta respecto N -à ndice de dificultad
17
-Porcentajes (o proporciones) acumuladas. -A través de alternativas -A través de items -Percentiles (=valores de la vv que dejan por debajo de si determinado porcentaje). Muy útil en los métodos de obtención de baremos en teoria de tests. Calcular una proporción (porcentaje) a algún valor dado -gnalmente al máximo o a la diferencia entre el máximo y el mÃ−nimo de las puntuaciones directas. EJEMPLO: Tenemos los Es Q,W,E,R y una muestra compuesta por los sujetos a,s,d,f,g,h. Cada sujeto ha decidido si cada uno de los Es presenta o no en suficiente grado una cualidad (tarea de Es simple) QWER a1010 s1010 d1001 f1010 g1101 h1010 En lugar de tomar estas puntuaciones como valores de escala pueden expresarse como proporción respecto a la punt.total máxima: Es P.D % Q61 W 1 0'166 E 4 0'666 R 2 0'333 Los valores se representan en una escala. Hay otros modos de utilizar proporciones para obtener los valores de la escala. Ejemplo: se puede suponer que dado que el Es W es el que - puntos ha obtenido puede tomárselo como punto de origen de la dimensión y reconvertir todas las puntuaciones a un origen 0 colocado en el Es W. Basta con restar la puntuación directa del Es tomado como 0 de la escala (en este caso el valor es 1) a todos los Es. Y después calcular la proporción que cada uno supone del total de la nueva escala.
18
Los valores de escala obtenidos depeden no solo del método de obtención de información que se utilice sino también del método de elaboración. Con los items relativos a aptitudes o conocimientos, items que tienen una respuesta verdadera, se utiliza frecuentemente un sencillo método de proporciones para establecer su valor de escala. (ej pág. 82-83) La proporción de personas que aciertan un item= Ã−ndice de dificultad del Ã−tem. Otro uso consiste en acumular las proporciones desde el punto más bajo. Esas proporciones representan la posición del Es (o del sujeto) en la escala de que se trate. • ESCALAS EN PUNT.Tà PICAS -Puntuaciones tÃ−picas -Puntuaciones tÃ−picas derivadas -Puntuaciones D -Puntuaciones T Es una de las transformaciones de las puntuaciones directas más comúnmente utilizadas en Psicologia. EJEMPLO: Hemos sometido 20 Es a juicio de 100 sujetos en una tarea de elección simple i: Es P.D 1 15 2 25 3 27 ... ... Tenemos que calcular la media y la desviación tÃ−pica de las P.D y utilizarlas para calcular la P.T. de esos Es Media= 46'20 D.T= 35'6674 Para tipificar una puntuación le restamos la media y el resultado lo dividimos por la D.T Es P.D P.Diferencial P.T 1 15 15-46'3= 31'20 31'2/35'6674= 0'8747 En lugar de utilizar las puntuaciones directas de los Es se utilizan P.T y asÃ−, la escala de los Es resultante será comparable a otras escalas de este tipo de Es elaboradas por el mismo procedimiento. -La media de las P.T es siempre = 0 y la desviación tÃ−pica=1. No alteran la forma de la distribución de las 19
puntuaciones directas (solo desplazan en su origen y cambian la escala, la anchura de las distancias). -Transformaciones linealesSi a todos los valores se les suma una constante “a” y se les multiplica por otra “b”, el resultado es una nueva escala con un nuevo origen y una nueva distancia entre 2 valores. T= a+bX -La P.T son una transformación lineal de las P.D. -Tienen la propiedad de no alterar las relaciones lineales de las puntuaciones con otras vv. -Son muy utilizadas, se utilizan muchas veces para cambiar el origen y las unidades en que está expresada una escala numérica, -Puntuaciones tÃ−picas derivadasSon transformaciones lineales que cambian el origen y la unidad de las P.T. Las más conocidas son: Escala D: D= 50+20z Escala T: T= 50+10z Su función es: eliminar los valores negativos (sumar a) y los números decimales (multiplicar por b) No alteran la forma de la distribucion original, ni su relación lineal con otras vv, • ESCALAS EN PUNTUACIONES Tà PICAS NORMALIZADAS Distribución Normal: Su representación gráfica es la curva normal. Donde: Y= la frecuencia de un valor dado de X, la altura (ordenadas) de la curva sobre el eje de las X. Los sucesivos valores y para cada valor de x son los que trazan la curva normal con su aspecto de campana. X= Puntuación X, puntuación de la vv X. Se representa sobre el eje horizontal (abcisas). Se refiere a los valores de la vv. N= Número de casos de la muestra ... Distribución Normal Tipificada: Si se considera el caso de una distribución normal con la media =0 y la D.T=1, es decir, expresada en P.T, y considerando que N=1. CaracterÃ−sticas -Curva simétrica en torno a la media, con forma de campana. La ordenada + alta (0'8939) corresponde a la 20
media. -Sus funciones permiten calcular las ordenadas (o tablas propias) Uso Distribución empÃ−rica puede adoptar la forma de la curva normal---->usar una escala tÃ−pica normalizada. Proceso: Convertir cada valor real de la vv en el valor z' de una distribución normal tipificada que le hubiera correspondido de acuerdo con las frecuencias acumuladas si la distribución hubiera sido normal. EJEMPLO: Las P.T de nuesto ejemplo se mueven entre -1'2953 y +1'5084; sin embargo, si representamos el polÃ−gono de frecuencias de la distribución de P.D. Se observa que no adopta una forma semejante a la de la distribución normal: P.D Frecuencia Proporción Pr.acumulada 0 2 2/20=0'1 0'1 5 1 1/20=0'05 0'1+0'05=0'15 P.D Proporción acumulada Valor z' 0 0'1 -1'2816 5 0'15 -1'0364 Paradoja del uso de las puntuaciones tÃ−picas normalizadas: Las puntuaciones tÃ−picas normalizadas z', resultado de forzar la distribución tratándola como si fuese normal no tienen nada que ver con las P.T reales de esta distribución. La P.T reales son una transformación lineal de las puntuaciones originales que no produce ninguna distorsión salvo decimales, de las puntuaciones originales. Su suma es 0 y su desviación tÃ−pica es 1. la correlación entre las P.T i las P.D de las que provienen es 1; es decir, hay una relación perfecta. O son la misma vv expresada de forma distinta. Sin embargo, las P.T normalizadas son el fruto de una transformación deformadora que fuerza a adoptar a cada puntuación directa un valor z' que no es su verdadera P.T; es la tÃ−pica que hubiera correspondido si la distribución hubiera sido normal. Las proporciones z' no suman o, ni tienen la media en 0 ni su D.T es 1, ni su correlación es 1, sino 0'9709. Cuanto + cercana a la normal es una distribución - sentido tiene forzarla a ser normal porque ya casi lo es, y al revés, cuanto - normal es una distribución - sentido tiene forzarla a ser normal porque más distorsión se comete contra los datos originales. • ESTUDIO DE PATRONES DE RESPUESTA Algunos métodos de escalamiento no asignan un valor de escala a cada OB o enunciado. Sino que estudian qué configuración de relaciones se produce entre los Es.
21
EJEMPLO: Método de captación de ordenación total A>C>B>E>D Permite disponer los Es en ese orden de presentación sin llegar a determinar un valor de escala para cada Es. Después los Es pueden utilizarse para medir sujetos presentándose en una tarea de respuesta de Es simple, asignando a cada sujeto un punto por cada item a que dice si. (los métodos de Guttman y de Coombs operan con este modelo). En su ánimo de simplificar las tareas de escalamiento y medición el método de Likert es un buen ejemplo de cómo pueden obviarse estas tareas. TEMA 8: PROCEDIMENTOS DE PUNTUACIà N DE LOS SUJETOS Cuando ya se ha asignado un valor de escala a cada Ã−tem y la escala en su conjunto ha sido evaluada y adecuada, ésta se utiliza para medir sujetos. Los items, normalmente, se presentan al sujeto mediante alguno de los 6 métodos de captación de información, aplicados como orientación de respuesta. Pero todavia queda como asignamos una puntuación al sujeto. La mayoria de los métodos de escalamiento proveen valores de escala de los items y este es el punto de partida para obtener la puntuación del sujeto, pero hay muchas variantes. Función de puntuación: Aquella que determina el valor de escala del sujeto, a partir de los valores de escala de los items. En la práctica consiste en algún procedimiento para determinar los puntos o total que ha obtenido el sujeto. Estas funciones abarcan dos aspectos: -La puntuación asignada a cada item que se utiliza, es decir, la valoración del item. -El modo en que se componen esas puntuaciones en un total que constituirá la puntuación directa del sujeto, es decir, la obtención del total. Mà TODOS DE ELABORACIà N DE LA PUNTUACIà N DE LOS SUJETOS • VALORACIà N DE LAS RESPUESTAS AL ITEM (orientada a respuesta) -RESPUESTAS TIPO I. ACIERTO O ACEPTACIà N OPCIà N 1: Asignar valor de escala; El valor de escala se habrá determinado previamente con algún método de escalamiento. En los items de alternativas esta opción consiste en asignar el valor asociado a la alternativa elegida. OPCIà N 2: Asignar “1”: Asignar un punto a cada enunciado acertado Para los items que tienen una Rs verdadera la Rs de acierto supone escoger odar la contestación correcte. Para los items que no tienen una Rs verdadera, una Rs de aceptación es aquella en la que el sujeto señala un enunciado como representante del mismo (de su actitud, de su experiencia...) -RESPUESTAS TIPO II. ERROR O NO ACEPTACIà N
22
OPCIà N 1: Asignar “0” OPCIà N 2: Ignorarlas: no asignar ningún valor OPCIà N 3: Penalizar: asiganr un valor negativo o penalizar: cuando el sujeto puede acertar un item por azar se puede utilizar una penalización de los errores que suele ser proporcional a la probabilidad de acertar por azar. Para los items con Rs verdadera una Rs de error es aquella que consiste en escoger o dar una contestación incorrecta. Para los items que no tienen una Rs verdadera una respuesta de no aceptación consiste en hacer explÃ−cito en la contestación que un enunciado no representa el punto de vista del sujeto. -RESPUESTAS TIPO III. OMISIà N OPCIà N 1: Asignar “0” OPCIà N 2: Ignorarlas: no asignar ningún valor Se refiere a aquellos items que quedan sin contestar sin que ello signifique un no acierto o una no aceptación del sujeto. Por ej: son omisiones los items que quedan sin constar al final de un test porque el sujeto no ha tenido tiempo de llegar a ellos. • PUNTUACIà N TOTAL -Mà TODO H1. SUMA DE LOS VALORES ASIGNADOS A LOS ITEMS: Se obtiene la P.D total de un sujeto como la suma de los valores asignados a sus respuestas (método + sencillo y + utilizado). Es indiferente si las Rs tipo II y III se valoran 0 o se ignoran (Ejemplos página 100) Variante: Método H1 Ponderado: suma ponderada: Es una variante del método H1 que se utiliza con propósitos especiales,como predecir alguna variable. Se obtiene la P.D total de un sujeto como la suma de los valores asignados a sus respuestas multiplicados por sus ponderaciones. Para el método es indiferente si las respuestas tipo II y III se valoran o (opción 1) o se ignoran (opción 2). EJEMPLO: El test se valora con un punto para los aciertos y 0 para errores y omisiones. Se utilizan las ponderaciones 0'12, 0'15,0'35, 0'75 y 1'25, asignadas respectivamente a cada item. Un sujeto acierta los items 1,3 y 4. Falla el 2 y no contesta el 5. Su puntuación será: P.D total: (1X0'12)+ (0X0'15)+(1X0'35)+(1X0'75)+(0X0'25)=1'22-Mà TODO H2. MEDIA DE LOS VALORES ASIGNADOS A LOS ITEMS: Se obtiene la suma de los valores asignados a las respuestas en todos los items (valores de escala, puntos y penalizaciones). Se divide por el número total de items no ignorados (que tinguen assigant el valor de escala, 1 punt o un 0) en la valoración. Significa que la valoración de las respuestas II y III determina el denominador con el que se obtiene la media, lo que varia el resultado. (Ejemplos 102-3).
23
-Mà TODO H3. VALORACIà N DE PATRONES DE RESPUESTA: Un uso no muy frecuente, no se considera una valoración de cada item o enunciado. Se dispone de ciertos patrones o configuraciones de respuestas de acierto o aceptación y los sujetos se clasifican en algún tipo o categorÃ−a según el patrón de respuestas que ofrecen. --->Existen otros modos de construir o elaborar el total. Por ej: utilizando otros estadÃ−sticos de tendencia central sobre los valores de la escala, utilizando otros estadÃ−sticos no de tendencia central, como porcentajes, máximos...Sin embargo, no son usuales. • PROCEDIMIENTOS FRECUENTES DE PUNTUACIà N DE LOS SUJETOS -Procedimiento H1; I:1; II:1ó2;III:1 ó 2 Asignar el valor de escala a la respuesta de aceptación o acierto del sujeto (I:1), ignorando o asignando 0 a las respuestas de no aceptación o no acierto (II:1 ó 2), y a las omisiones (III:1 ó 2). el total se obtiene como suma de los valores de escala de los items acertados o aceptados-por eso es igual asignar 0 o ignorar los errores, las no aceptaciones y las omisiones. -Procedimiento H1; I:2; I:1 ó 2; III:1 ó 2: Asignar un punto a la respuesta de aceptación o acierto del sujeto (I:2), ignorando o asignando 0 a las respuestas de no aceptación o no acierto (II: 1 ó 2) y a las omisiones (III:1 ó 2). el total se obtiene como suma de puntos de los items acertados-por eso es igual asignar 0 o ignorar los errores, las no aceptaciones. -Procedimiento H1; I:2; II:3; III:1 ó 2: Asignar un punto a la respuesta de aceptación o acierto del sujeto (I:2), penalizar las respuestas de no aceptación o no acierto (II:3), e ignorar o valorar 0 a las omisiones (III:1 ó 2). el total se obtiene como suma de los valores de escala de los items acertados menos las penalizaciones. Este es un modelo propio de las pruebas de aptitud o conocimientos donde los sujetos pueden acertar respondiendo al azar. -Procedimiento H2; I:1; II:2; III:2: Asignar el valor de escala del enunciado a la respuesta de acierto (I:1), sin aportar ninguna información en caso contrario (II y III:2). Promediar los items no ignorados (H2); que significa promediar los items acertados. Es el modelo de valoracion de muchas escalas de actitudes. -Procedimiento H2; I:2; II:1; III:1: Asignar un punto por respuesta de aceptación (I:2) un 0 en caso contrario (II y III:1). Promediar los items (H2); lo que significa calcular la proporción de items acertados. --->Existen muchas otras variantes, pero éstas son las más frecuentes. Una vez valoradas las Rs de los sujetos a los items, queda la cuestión de cómo componer esas valoraciones en un total (Métodos H) Mà TODOS DE ESCALAMIENTO
24
B3: Mà TODO DE LAS COMPARACIONES APAREADAS DE THURSTONE CONTINGUT C Es uno de los procedimientos de escalamiento de más tradición dentro de la medición psicológica. Utiliza como método de obtención de información la comparación de estÃ−mulos por pares, en una tarea orientada a juicio. Las elecciones se convierten en valores de escala mediante la conversión de los % de preferencia en P.T normalizadas. Los costos de esfuerzo y tiempo que supone la comparación de Es por pares, influye en que se prefieran otros métodos más sencillos y rápidos. Mà TODO 1. Aplicar el método de comparación de estÃ−mulos por pares con orientación de juicio (III.A) Si los objetos o Es a escalar son items, entonces previamente se habrá elaborado la lista de los mismos y se habrán sometido a los controles racionales. Aplicar este método implica: -Decidir en qué dimensión se van a escalar los Es. -Formar todos los pares posibles con los Es a escalar (combinaciones de n Es tomados de 2 en 2). el núemro de Es a escalar, n, no puede ser muy grande. -Presentar todos los pares a una muestra de sujetos que actúan como jueces -Cada juez tiene que escoger en cada par aquel objecto que tenga + (o -) de la dimensión en que se van a escalar los Es. Cada sujeto emite un juicio en cada par. 2. Obtener los valores de escala de los objetos: 1. Se forma una matriz de OB x OB en la que cada celdilla contiene la proporción de sujetos que han dicho que el objeto de la fila es mayor que el objeto de la columna en la dimensión. Si todos los sujetos han contestado a todos los pares con una elección, entonces la suma de las celdillas simétricas respecto a la diagonal pral, debe dar 1. En las celdillas de la diagonal se considera que hay un 0'5; es decir, que un OB no se considera ni mayor ni menor a sÃ− mismo en la dimensión (por supuesto, a los sujetos no se les da a juzgar ningún par con los dos elementos iguales). 2. La proporciones se transforman en P.T de una distribución normal. Utilizando una tabla, se obtiene qué puntuación z'corresponderia en la distribución normal a un valor que deja por debajo de sÃ−, la proporción indicada en la celdilla. En la diagonal pral, correspondiendo a una proporción de 0'5, quedan puntuaciones z' igual a 0'00. 3. Se calculan las medias de las columnas. La puntuación tÃ−pica z' media que corresponde a las proporciones de preferencia de cada Es (si un Es ha sido elegido más veces que los otros con los que ha formado pares, habrá tenido proporciones de elección más altas y puntuaciones z' más altas y por tanto un promedio de z' más alto). 4. Basta restar a todas las z' promedio asÃ− obtenidas la z' promedio del Es que la tenga + baja. El resultado de estas restas es ya el valor de escala de los Es. 25
Con esta resta el Es con z' promedio + baja queda siempre en una puntuación de escala igual a 0, y las puntuaciones de todos los demás expresan la distancia a ese Es 0. Los valores de escala obtenidos pueden utilizarse de diversas formas para medir sujetos. Quizá el procedimiento + sencillo para obtener información consista en utilizar una tarea de estÃ−mulo simple con orientación de respuesta (I.B) Después, para obtener la puntuación de los sujetos se utiliza un método de media de los valores de escala asignados a los items acertados o aceptados (H2; I:1; II:2; III:2) No obstante, el método de medición de los sujetos por el que se opte, no es parte del método de comparaciones apareadas. EJEMPLO Estamos realizando un estudio sobre el valor que conceden los sujetos a su tiempo de ocio y alos diversos tipos de ocio, dentro de su jornada cotidiana. Escalamos diversas actividades cotidianas en función de la importancia que éstas tienen en la vida diaria de una muestra de sujetos. La dimensión a estudiar es la importancia que le conceden en la vida diaria a cada actividad. Las actividades a escalar son: A. Deporte B. Televisión C. Familia D. Amigos E. Lectura 1. Se forman los 10 pares posibles y se presentan a los 100 sujetos de la muestra. Tabla 1: MATRIZ DE FRECUENCIAS DE ELECCIà N DE PARES DE ES. A A B C D E N= 100
10 30 50 65
B 90 45 90 85
C 70 55 60 90
D 50 10 40
E 35 15 10 10
90
Las celdillas de la tabla recogen cuantos sujetos han dicho que dedican más tiempo a la actividad de la column que a la de la fila. Po ejemplo: 90 sujetos han dicho que dedican más tiempo a la TV que al deporte, mientras que los 10 restantes dicen dedicar más tiempo al deporte que a la TV. Por ello, la suma de dos celdillas simétricas respecto a la diagonal vacÃ−a es siempre N, en este caso 100. 26
2. Tabla 2: MATRIZ DE PROPORCIONES DE ELECCIÃ N DE PARES DE ES: A A B C D E N=100
0.10 0.30 0.50 0.65
B 0.90 0.45 0.90 0.85
C 0.70 0.55 0.60 0.90
D 0.50 0.10 0.40
E 0.35 0.15 0.10 0.10
0.90
Para obtener las proporciones anteriores hemos dividido cada frecuencia por N. Ahora, con la ayuda de una tabla de la curva normal, buscamos que valores z' corresponden a esas proporciones (qué valores z' dejan por debajo de sÃ− esa proporción). Tabla 3: MATRIZ DE PUNTUACIONES Z A 0 -1'2816 -0'5244
B 1'2816 0 -0'1257 1'2816
C 0'5244 0'1257 0
D 0 -1'2816 -0'2533 0
E -0'3853 -1'0364 -1'2816
A B C D E ... 1'2816 0 A veces un valor concreto no se encuentra en la tabla, con lo que solemos tomar la z' cuya proporción acumulada de acerca más a la que buscamos. Al ser simétrica la distribución normal, cada proporción tiene la misma z' que su complementaria a 1, pero con el signo opuesto. La z' para 0'5 es 0, porque la media de la distribución normal está en z'=0. 4. Ahora sumamos las columnas y dividimos por el número de Es (hallamos la z' media de cada columna) A 0 -1'2816 -0'5244
B 1'2816 0 -0'1257 1'2816
A B C D E ... SUMA: -1'4207 3'4739 2'1850 -0'2533 -3'9849
C 0'5244 0'1257 0 1'2816
D 0 -1'2816 -0'2533 0
E -0'3853 -1'0364 -1'2816 0
MEDIA: -0'2841 0'6948 0'4370 -0'0507 -0'7970 PodrÃ−amos tomar esos sumatorios o medias como los valores de escala de los 5 Es. Pero, para que la escala tenga como punto 0 el Es menor, se resta a la media de cada Es el valor de la media del Es menor. En este caso la actividad E ha quedado clasificada como la menor en la dimensisón con una z' media de .0'7970. Ahora se resta este número a todas las z' medias para conseguir que el Es E quede ubicado en 0 y los valores de todos los demás expresen la distancia de E en puntuaciones z' medias.
27
Ejemplo: Si A tiene un valor de z' media =-0'2841, le restamos la menor z' media =-0'7970 i el valor de escala resultante es 0'5129. Ahora todos los Es tendrán un valor de escala positivo y el Es E se ha convertido en el origen relativo 0. Al conocer los valores de escala, podemos presentar los items a los sujetos para medirlos. Lo más habitual es calcular la puntuación del suejeto mediante H2, con I:1;II:2;III:2 Supongamos que un sujeto J contesta SI a los enunciados B y C y NO ante los enunciados A y D. la puntuación total será: J=( 1'4918 + 1'2340)/2=2'7258/2=1'3629 CONTINGUT A FUNDAMENTOS Thustone fue el pionero en el campo del escalamiento psicológico. Habiendo trabajando incialmente en el escalamiento psicofÃ−sico dió el paso hacia el escalamiento psicológico. El método de las comparaciones apareadas es el que evoca de forma más clara un método psicofÃ−sico de comparación de estÃ−mulos. Thustone elaboró: el método de las comparaciones apareadas, el método de los intervalos sucesivos y el de los intervalos aparentemente iguales. Los 3 se fundamentan en lo que se denomina: “La ley del juicio comparativo”. Según Torgerson: “Es un conjunto de ecuaciones que relacionan la proporción de veces que un estÃ−mulo cualquiera k es juzgado mayor en un atributo dado que otro estÃ−mulo cualquiera j, con los valores escalares y las dispersiones discriminales de los 2 estÃ−mulos en el continuo psicológico”. Thustone supone que con suficiente nombre de jueces, la distribución de las posiciones en la escala que los sujetos asignan a un mismo estÃ−mulo, tendrá forma de curva normal. Por tanto, la mediana, media y moda de sa distribiución coincidirán en un mismo valor de escala: ese valor de escala lo denomina: “proceso discriminal modal” y constituye la mejor expresión de la posición del Es sobre la dimensión. La desviación tÃ−pica de esa distribución Normal significa el grado de dispersión o discrepancia entre los jueces a la posición en la escala de un Es, la denomina: “dispersión discriminal modal”. Cuanto mayor sea la dispersión, menor es el acuerdo entre los jueces en el valor de escala de un Es. En el método de las comparaciones apareadas los sujetos juzgan cuál de los Es es mayor en una dimensión ; por ejemplo, cuál de los 2 Es es más grave. Entonces...cómo se relaciona la concepción de la distribución de los juicios de los sujetos como una curva normal con las elecciones que los sujetos producen en los pares? Si 2 Es están próximos en su valor de escala, sus distribuciones estarán muy solapadas, con las medias próximas. Ellos supone que para un número de jueces un Es será mayor que el otro, y para los otros al revés. El % de sujetos que dicen que el primero es mayor que el segundo estará próximo del 50% y el porcentaje de sujetos que dicen que el segundo es mayor que el primero estará también cerca del 50%. si por el contrario, 2 Es están muy lejos en su valor de escala, las medias que representan esos valores de escala estarán muy alejadas la una de la otra. Las distribuciones estarán poco solapadas, y por tanto habrá un alto % de sujetos que dirá que un Es es mayor que el otro y sólo un pequeño % que sostendrá lo contrario. La clave de ste razonamiento reside en que muestra cómo el % de sujetos que dice A es mayor que B es proporcional a la distancia entre A y B.
28
La diferencia entre el % que produce una elección y el porcentaje complementario que produce la elección inversa es muy grande cuando la diferencia en los valores de escala de los Es es muy grande, y muy pequeña cuando la diferencia en los valores de escala es muy pequeña. Es decir, esa diferencia es proporcional a la diferencia en valores de escala (MIRAR PÔGS. 127-8-9) Nunca se sabe dónde está ubicado un Es dentro de una dimensión; pero las proporciones de elecciones en comparaciones apareadas pueden utilizarse para obtener puntuaciones tÃ−picas que expresen la distancia relativa entre los Es. CONTINGUT B SUPUESTOS Y LIMITACIONES Entre ellas pueden destacarse los fuertes suspuestos que el método implica, las dificultades derivadas de utilizar los sujetos como jueces para comparar los Es, la cuestión de la dimensionalidad de las escalas y los elevados costes en tiempo y en tarea del método. -Supuestos del método: En la medida en que los datos se alejen de esos supuestos el método pierde valor y puede llegar a considerarse inadecuado. La clave del método reside en que se llega a igualar la diferencia entre 2 Es, expresada en P.T en una curva normal, a la diferencia entre las posiciones escalares de los Es, lo que permite dar el salto entre una proporción de elecciones y una distancia entre Es sobre una dimensión. Eso es posible asumiendo que: -La respuestas de los sujetos ante los Es adoptan una distribución Normal sobre la dimensión escalar subyacente. Las varianzas de los Es sobre esta distribución son iguales. -Los juicios de los sujetos ante los Es no están correlacionados entre si. Sin estas 3 suposiciones no seria posible efectuar el escalamiento según el método (ecuación de la ley del juicio comparativo) -Sujetos como jueces: En la fase de escalamiento de los items, una muestra de sujetos (muestra I) actúa como jueces respecto a los estÃ−mulos. Los sujetos se utilizan como calibradores de los Es. La cuestión es si los sujetos son buenos calibradores y si deciden correctamente en cada comparación. Estas objecciones tiene dos grandes componentes. Primero, está la cuestión de si los sujetos pueden ser un buen instrumento de medida. Segundo, está la cuestión de la imparcialidad de los sujetos. La cuestión de si los sujetos puden ser un buen instrumento tiene varios aspectos. Primero puede discutirse si los sujetos discriminan adecuadamente estre Es ubicados en diferentes puntos del continuo. Segundo, si los sujetos son consistentes en sus juicios consigo mismos, con otros y a través del tiempo. La cuestión de la imparcialidad de los sujetos hace referencia a la medida en que los sujetos son influidos por su propia posición en la dimensión medida al comparar Es. Por ej: al escalar los items A y B que representan actitudes + o - pacifistas se les pide a los sujetos que digan cuál de los 2 es + pacifista que el otro. La tarea implica comparar los Es como si los sujetos fueran jueces justos que sólo están influidos en su elección por la magnitud de pacifismo contenido en los items A y B y no por su posición personal respecto al tema. 29
La tarea de los sujetos de la muestra I es la de comparar los Es por si mismos, no por la relación que ellos mantienen con los Es. Si no fuera de este modo, no quedarÃ−a patente que los Es mismos difieren ubicándose en diferentes puntos del continuo.la posición de los jueces en el continuo es independiente de sus juicios sobre los items. Hay que considerar que intervienen 2 procesos en las fases de escalamiento de los items (muestra I) y de medición de los sujetos (muestra II). Cuando el objetivo es solo escalar los Es la dificultad no aparece. Pero cuando escalamos un conjunto de items para medir después sujetos con ellos, este problema es patente. A los sujetos que actúan como jueces para escalar items (muestra I) se le pide que comparen los Es en razón de la magniud con que los Es mismo contienen una propiedad. A los sujetos que se desea medir (muestra II) se les pide que se comparen ellos mismos con los Es y digan si ellos están ubicados en el mismo punto del continuo de cada Es. En algunos casos, la muestra I puede ser usada como muestra II, pero eso no afecta el núcleo del problema. La dificultad reside en que el método asume que las posiciones de los items en el continuo serán las mismas para ambos procesos independientemente de la tarea que los sujetos realicen respecto a los mismos. Pero puede ser que debido a que la tarea demandada a los sujetos a los que se quiere medir es distinta, es posible que las respuestas de estos a los items estén determinados por factores no considerados al elaborar la escala, resultando en una medición no válida -La cuestión de la dimensionalidad: Es compleja y afecta de diferentes modos a todos los métodos de escalamiento. Primero, dado un conjunto de Es, cuántas dimensiones son necesarias para representarlos de un modo adecuado. Y dado un conjunto de Es representados en un número dado de dimensiones, en qué medida están bien representados por ellas. Los métodos de escalamiento de Thurstone permiten ubicar los Es sobre una dimensión , es decir, escalarlos unidimensionalmente. La limitación del método consiste en que supone que los Es pueden escalarse unidimensionalmente y que esa representación es adecuada, pero no presenta un procedimiento de contrastación empÃ−rica de la unidimensionalidad. -Costes del escalamiento: Tiene altos costes temporales y de esfuerzo. Porque presenta separado el proceso de escalamiento de los items y el de medición de los sujetos. Porque la tarea solicitada a cada sujeto en la fase de escalamiento de los items puede ser costosa. El método depende de una tarea de comparación de Es por pares que es el procedimiento de obtención de información + costoso. En el método el número de Es a escalar ha de ser muy limitado. El número de juicios a realizar crece rápidamente al aumentar al número de Es a escalar. Por eso resulta muy largo. TEMA 10: Mà TODO DE LOS INTERVALOS APARENTEMENTE IGUALES DE THURSTONE (Sà LO Mà TODO) 1. Generación de opiniones Escoger y definir aquella actitud sobre la que se desea elaborar una escala de medida las actitudes no pueden medirse directamente. Para generar opioniones que sirvan para la construcción de la escala, se selecciona varios grupos, distintos en cuanto a la actitid objeto de estudio. Después de solicita a esta muestra (muestra A) que haga una descripción escrita libre de sus opiniones hacia el objeto de estudio. 2. Construcción de items 30
Se seleccionan y elaboran un conjunto de 100 a 150 enunciados (versión I) que expresen todas las posiciones posibles hacia el tema. La elaboración de los enunciados debe atenerse a ciertas recomendaciones. Después de haber seleccionado de 100 a 150 items, se selecciona un número menor, entre 80 y 100 (versión II). 2.1. Propiedades para los items de actitud -Los items deben cubrir el continuo de la actitud -Disponer de enunciados neutros que puedan ubicarse en el centro del continuo y evitar que la escala se rompa en dos según su signo -Los enunciados deben ser breves para evitar la fatiga -Construirse de tal modo que la respuesta de aceptación o de rechazo dependa de la actitud del lector, de su aceptación o rechazo del Ob de actitud. Los items deben suscitar esa aceptación o rechazo. -La aceptación o rechazo del item no debe ser una cuestión de conocimientos o de información -Evitar los items ambiguos o de doble argumento -Evitar items ajenos al objeto de actitud. 3. Clasificación de los items Cada sujeto clasifica cada item en uno de los 11 montones graduados de 1 a 11. 4. Calibración de los Ã−tems El 1 como el extremo negativo y el 11 como el positivo. Thurstone toma la mediana como valor de escala del item. Para un item, por ejemplo, que sea ubicado por el 50% de los sujetos de la muestra B por debajo del valor 7'33, quedando el 50% restante de las puntuaciones por arriba de 7'33, tomamos como su valor de escala 7'33. el item está ubicado en 7'33. De este modo tenemos descrita por su mediana la posisción de cada item en el continuo de 1 a 11. La calibración de cada item indica cuán positivo o negativo es hacia el objeto de actitud. La media también se puede utilizar. Este proceso que permite ubicar a cada item en algún punto de la recta que representa el continuo de actitud es lo que se denomina calibrar o escalar un item. 5. Evaluación de la constancia de las calibraciones Aquellos items que mantienen las calibraciones constantes podrÃ−a admitirse que han sido calibrados con independencia de las actitudes personales de los sujetos de la muestra. Aquellos con calibraciones discrepantes no pordrÃ−amos incluirlos en la escala definitiva, porque no sabriamos su valor escalar seguro. Garantiza más la calibración escalar de un item cuanto + estable haya permanecido su valor de escala a través de más muestras B de calibración. La constancia de las calibraciones en diversas muestras aumenta nuestra confianza en la escala. Los valores escalares nos resultan más confiables si el estudio ha sido replicado a través de diversas muestras y a través de diversos métodos. 6. Evaluación de la ambigüedad de los Ã−tems 31
La calibración ha de permanecer lo + estable posible para los diferentes sujetos de una misma muestra. Cuanto menor sea la dispersión de la distribución de puntuaciones de cada item mejor. Cuanto mayor es esa dispersión + ambiguo es el item - claro es el término de actitud i menos adecuado. Quiere decir que además de utilizar la mediana para indicar el valor del item, también debe atenderse a estadÃ−sticos de dispersión para descartar los items con mucha dispersión. Se utiliza el rango semi inter-cuartil i/o la D.T. El rango es una medida de dispersión que establece cual es la mitad de la distancia escalar entre los cuartiles 1 y 3. La D.T. utiliza la media para determinar el valor de la escala. Se estudia la ambigüedad para eliminar los items ambiguos, los de mayor dispersión. 7. Evaluación de la irrelevancia de los items Un item puede presentar un valor de escala, una reducida dispersión i aún no ser adecuado debido a su irrelevancia. Es la cualidad que hace que ciertos items no sean escogidos en una tarea de respuesta, comparativamente con otros de su mismo valor de escala. Si dos items tienen un mismo valor bien determinado pero los sujetos no admiten uno de ellos en proporción semejante al otro, el item - aceptado es posible que sea irrelevante. 8. Selección de items y elaboración de la escala de medida de actitudes Hemos obtenido informaciones valiosas sobre los 100 items (versión II) que seleccionamos al principio a partir de una muestra inicial de items mucho mayor (versión I). se trata de usar las informaciones obtenidas en los pasos anteriores para seleccioanr un conjunto + reducido de 20 0 30 items (versión III) que formen la escala de medida. Para ello: -Se eliminan los items con demasida ambigüedad -Se eliminan los items que hayan mostrado ser irrelevantes para la escala -De los items restantes todos ellos relevantes y poco ambiguos, se seleccionan entre 20 y 30 de tal forma que sus calibraciones estén repartidas de forma uniforme y equidistante como sea posible a lo largo del continuo. En este punto ya se dispone de una escala destinada a la medición con todos sus items calibrados y bien distribuidos a lo largo del continuo. 9. Medición de actitudes La escala (versión III) obtenida como fruto del paso anterior está ya lista para medir las actitudes de una muestra de sujetos (muestra D). Para medir sujetos se administra la lista de items a los sujetos para que indiquen con qué items están de acuerdo y con qué no. Qué items representan su actitud. Los items con los que el sujeto manifiesta estar de acuerdo se entiende que reflejan la actitud del sujeto (TAREA DE ESTIMULO SIMPLE CON ORIENTACIà N DE RESPUESTA: I.B) Para ubicar a cada sujeto, medirlo, necesitamos aprovechar la información de calibración de los items.se toma como puntuación de la persona en el continuo de actitud, la media de los valores de escala de aquellos items con los que ha manifestado acuerdo. Situa al sujeto en la dimensión de actitud del mismo modo que la calibración habÃ−a situado a los items (H2: I:1; II:2;III:2) 10. Observaciones adicionales al proceso de construcción de la escala
32
-Evaluación de la dimensionalidad de la escala: es compleja. Si el conjunto de items elaborado por el procedimieno está correctamente representado en una única dimensión. -Obtención de pruebas para la fiabilidad: -Consitencia interna del instrumento -Estabilidad temporal de las puntuaciones (test-retest): Las actitudes pueden ser sensibles a cambios situacionales importantes y las evaluaciones para periodos largos pueden diferir porque los suejtos cambian. También porque en periodos cortos, con escalas con pocos items, factores de memoria o de intencionalidad pueden actuar sobre las segundas puntuaciones. Esto puede dificultar la fiabilidad de los resultados. -Obtención de validez: trata la independencia de las calibraciones de la muestra B, la cuestión de la ambigüedad y la cuestión de la irrelevancia, como parte de estudio de la validez. Un estudio importante consistiria en medir,para una muestra D además de la actitud objeto de estudio otras actitudes y comportamientos que están relacionados. Si el cuestionario no mantuviera las relaciones esperadas con otra medidas consideradas aceptables, realizadas mediante otras pruebas, no se podrÃ−a defender su validez. Esta cuestión es compleja. -Necesidad de un cumplimiento de los supuestos del método -Dificultades de los sujetos como jueces y calibradores de los items -Costes de esfuerzo y tiempo TEMA 11: Mà TODO DE LOS INTERVALOS SUCESIVOS DE THURSTONE Y Mà TODO DE LAS CATEGORà AS SUCESIVAS DE GREEN (B5) CONTINGUT A Mà TODO DE LOS INTERVALOS SUCESIVOS DE THURSTONE Es un procedimiento para escalar Es que después pueden ser utilizados para medir sujetos. Parte de un método de obtención de información de elección de alternativas con orientación de juicio (II.A). El procedimiento que utiliza para obtener los valores de escala es + semejante al del método de las comparaciones apareadas, haciendo uso de P.T normalizadas. Mà TODO 1. Obtener información para escalar los items mediante un procedimiento de elección de alternativas con orientación de juicio (II.A). A una muestra de sujetos se le presentan los Es a juszgar y se les pide que los ubiquen en una categoria dentro de un nº discreto y graduado de las mismas. Por ej: 5,7 u 11 categorÃ−as que expresan grados de la dimensión bajo consideración, desde “nada o muy poco” a “todo o mucho”. La tarea de los sujetos consiste en asignar cada Es a una sola categorÃ−a. El resultado de este procesos es que para cada Es disponemos de una distribución de N puntuaciones, siendo N el nº de sujetos tomados como jueces. Si hay n Es dispondremos de n distribuciones. Esas n distribuciones son el punto de partida del procedimiento de escalamiento de los items. 2. Obtener los valores de escada de los items 33
1. Tabla en la que el eje horizontal presenta las categorias y el vertical los Es; cada celdilla contiene el nº de sujetos que ha clasificado ese Es en esa categorÃ−a. 2. Las frecuenias se convierten en proporciones, dividiendo el contenido de cada celdilla por N 3. Se acumulan las proporciones dentro de la distribución de cada Es, comenzando por la categoria más baja. 4. Transformación de las proporciones acumuladas en la P.T normalizada z' (se excluyen las proporciones menores de 0'02 y mayores de 0'98). 5. Para cada Es se obtienen las distancias entre las z' consecutivas. La distancia de la categoria 2 a la de la categoria 1, etc i etc. 6. Para cada distancia entre dos categorias, se promedian las z' distancias correspondientes. Se suman todas las z' distancias obtenidas y se dividen por el nº de z' distancia consideradas. Las nuevas z' distancia promedio que se obtienen se consideran la amplitud de las categorÃ−as. 7. Utilizando las amplitudes, se obtiene la escala, fijando los lÃ−mites superiores e inferiores de las categorias. 8. Utilizando esta escala se calcula la MEDIANA de la distribución de cada Es que será el valor de escala. Entonces ya podemos utilizar los enunciados para medir sujetos. Utilizar un método de Es simple con orientación de respuesta (I.B), construyendo la puntuación total mediante un método de media de los valores de escala asignados a los items (H2; I:1;II:2;III:2) -Ventajas y limitaciones-: Ventajas: No presupone la amplitud de los intervalos, ocupándose el método de calcularla. Limitaciones: El procedimiento de obtención de los valores de escala es engorroso y presenta la dificultad de que no se disponde de información sobre las categorÃ−as extremas. Tampoco se disponde de información sobre alguna/s categorÃ−as más lindantes con las extremas. Y además, el uso de las P.T siempre entraña supuestos difÃ−ciles de sostener. EJEMPLO: Supongamos que tenemos 6 enunciados relativos a la actitud de los sujetos ante la apresencia y difusión de los medios de comunicación social y deseamos escalarlos. Se presentan una muestra de 250 sujetos que hande clasificar cada enunciado en una de cinco categorias, desde una perspectiva + negativa (cat.1) hasta la más positiva (cat.5), pasando por el enunciado neutro (3). los 250 sujetos han clasificado los items: Tabla 1: FRECUENCIAS
A B C D
1 5 80 90 0
2 30 150 90 10
3 100 20 45 50
4 90 0 25 120
5 25 0 0 70 34
E F
0 25
0 50
10 100
130 50
110 25
Presenta la frecuencia de sujetos que ha clasificado a cada Es en cada categoria. Por ej: 25 sujetos han clasificado al Es F en la categoria 1... Tabla 2: PROPORCIONES 1 0'02 ...
2 0'12
3 0'40
4 0'36
A B C ... D ... ... E F ... Convertimos las frecuencias en proporcioens dividiendo por N, en este caso N=250
5 0'10 ...
...
A continuación acumulamos las proporciones en la distribución de cada Es, desde la categoria inferior hasta la superior: Tabla 3: 1 0'02 ...
2 0'14
3 0'54
4 0'90
A B C ... D ... ... E F ... Transformamos cada proporción acumulada en la puntuación z' corespondiente
5 1 ...
...
(tabla 4). A continuación, para cada fila, obtenemos la distancia de cada z' respecto de la z' de la categoria anterior si es posible. Las distancias resultantes se consideran la amplitud del intervalo de esa categoria para ese Es. Cada una de las medias se interpreta como la amplitud de intervalo de las categorias. AsÃ−, la amplitud de intervalo de la categoria 2 es 1'1362. Dado el procedimiento de trabajo no se conoce la amplitud de intervalo ni de la primera ni de la última categoria. Ahora, considerándose como 0 el lÃ−mite superior del intervalo correspondiente a al primera categoria, se puede establecer la escala sumando amplitudes de intervalo. Escala: Cat: 1 2 3 4 5 Ampl: 1'1362 0'9932 1'2823 LÃ−m: 0 1'1362 2'1294 3'4117
35
A continuación se calcula la mediana de cada enunciado de acuerdo con las frecuencias acumuladas y la escala común. Después, podemos aplicar los valores de la escala para medir los sujetos, mediante una tarea de Es simple con orientación de respuesta (I.B) TEMA 13 Y 14: Mà TODO DE LOS RANGOS DE DUNNRANKIN I Mà TODO DE LIKERT (B6) CONTINGUT B Mà TODO DE DUNN-RANKIN Es uno de los procedimientos + sencillos para obtener el valor de escala de un conjunto de Es. Se basa en conocer el orden en que cada sujeto, en una tarea de juicio, ordena los n Es. Los porcentajes respecto al máximo posible de las sumas de los rangos a través de sujetos son los valores de escala. Se utiliza una tarea de comparaciones apareadas con orientación de juicio (III.A) como método de captación de información. Pero el método más recomendado para esta tarea es el de ordenación total (VI.A) Si los 5 Es fueran items podrÃ−an utilizarse para medir sujetos. La forma + sencilla de aprovecharlos en la medición de sujetos es mediante una tarea de estÃ−mulo simple con orientación de respuesta (I.B), obteniendo el promedio de los valores de escala de los items aceptados (H2; I:1; II:2;III:2). Debido a su sencillez de manejo y comprensión el método se ha convertido en uno de los más utilizados. CONTINGUT A Mà TODO DE LAS ALTERNATIVAS DE LIKERT Es probablemente el procedimiento de escalamiento unidimensional + sencillo y quizás el más utilizado en el conjunto de las ciencias sociales. El procedimineto no permite escalar los items, ocupándose directamente de obtener la puntuación de los sujetos. Consiste en crear un conjunto de enunciados relativos al objeto bajo medición, presentarlos con una escala de respuestas graduadas en una tarea de respuesta (II.B) y obtener la puntuación total de cada sujeto como suma promedio de los valores de las alternativas que ha escogido (H1 ó H2; I:1;II:2;III2). Y es posible establecer diferentes variantes sobre este procedimiento. No hay propiamente un procedimiento de escalamiento de los Es. Simplemente las alternativas graduadas llevan asociado un entero que refleja su posición en el grupo de opciones de respuesta, y la puntuación de los sujetos es la suma o promedio de esos enteros. Por ello, se pone el acento en aspectos de valoración de la escala: análisi de items, análisis de la fiabilidad y análisis de validez. Mà TODO Se procede a elaborar enunciados relativos al objeto de medición. Por ejemplo: frases que expresen una determinada opinión ante un objeto de actitud. Se elabora un conjunto de alternativas graduadas que pueden expresar grados de acuerdo o desacuerdo, aceptación o rechazo de los enunciados. Cada alternativa está compuesta de un nº o puntuación o valor de la alternativa, que expresa su posición en el conjunto de las mismas, y de un pequeño texto (“anclaje verbal”) que expresa el grado de aceptación o de rechazo.
36
à stos son algunos de los modelos de alternativas + frecuentes: Ejemplos de 3 alternativas: 1.Si 2.Indiferente 3.No 1.De acuerdo 2. Indiferente 3. En desacuerdo Ejemplos de 5 opciones: 1. Nada 2. Poco 3. Regular 4. Bastante 5. Mucho Ejemplos de 7 opciones: 1. Nunca 2. Rara vez 3. Alguna vez 4. Pocas veces 5. Con cierta frecuencia 6. Bastante frecuentemente 7. Muy frecuentamente Ha habido discusión sobre cual es el nº de alternativas + adecuado. Lo + común es inclinarse por un modelo de 5 alternativas, pero las soluciones de 3 y 7 también son muy utilizadas. Las soluciones pares no suelen presentar un punto “medio” verbal, lo que a veces se utiliza para forzar al sujeto a decidirse. Cuanto mayor es el nº de opciones + difÃ−cil es encontrar anclajes verbales idóneos que expresen bien la posición dentro de la escala graduada. Por eso, a veces, con los modelos de 5 o 7 opciones, pero también si se utilizan modelos de 9 u 11, se escriben sólolos anclajes verbales de los extremos, representando gráficamente la escala y solicitando que el sujeto marque su respuesta en el lugar donde gráficamente 37
corresponda. Por ejemplo: Negativo Positivo -4 -3 -2 -1 0 +1 +2 +3 +4 Una vez elaborados los enunciados y la escala de alternativas, se presentan a una muestra de sujetos en una tarea de elección de alternativa con orientación de respuesta (II.B). Es distintivo del método no utilizar una tarea de juicio para captar información. Como no se persigue escalar los items es suficiente con una tarea de respuesta. La escala numérica de las alternativas es el esquema de referencia sobre el que los sujetos juzgan su relación con los items. La puntuación de un sujeto es la suma o promedio de las alternativas que ha aceptado, una por cada item. Items que miden es sentido inverso: Los items invertidos son aquellos que por su significado o su formulación miden en sentido contrario al resto del cuestionario. Por ejemplo: tenemos una escala que quiere medir bienestar psicológico y que va presentando una serie de afirmaciones ante las que el sujeto debe contestar a la pregunta: ¿Con qué frecuencia me ha sucedido a mÃ− en las últimas semanas?, utilizando la siguiente escala: 1. nunca 2. pocas veces 3. bastantes veces 4. muchas veces Los items: A. Estar contento B. Disfrutar de un rato divertido C. Tomarme un respiro D. Estar tenso o nervioso E. Sentirme relajado y feliz Los items A, B, C y E miden en un mismo sentido, el bienestar. Cuanto mayor sea el nº de la alternativa escogida por un sujeto, mejor se siente él mismo. Sin embargo, el item D funciona al revés, mide en sentido inverso. Cuanto mayor sea el nº de la alternati escogida por el sujeto en el item D, peor está él. La puntuación (nº de alternativa escogida) de un sujeto en un item invertido no puede sumarse a las demás puntuaciones. Si no se advierte que en un cuestionario hay uno o + items invertidos, y estos se suman a la puntuación total, pueden aparcer efectos extraños en el proceso de valoración de la escala total. No significa que deban evitarse los items invertidos sino que deben desinvertirse.
38
La solución + sencilla es desinvertirlos. Darle la vuelta a su escala numérica con lo que ya pueden sumarse a los demás para formar el total. Para invertir la escala de un item invertido y dejarlo midiendo el mismo sentido que los demás: X' = (Xmax + Xmin) -X Donde: X: Valor de alternativa del item invertido Xmin: Valor de alternativa mÃ−nimo posible Xmax: Valor de alternativa máximo posible X': Nuevo valor de escala puesto ya en el sentido adecuado. La cuestión de los items invertidos no es exclusiva de las escalas tipo Likert. Afecta a cualquier método que utilice items en formato de alternativas o en formato dicotómico: afecta a las tareas de elección de alternativas y a las tareas de Es simple. La solución es la misma. Para que una escala elaborada por este método pueda utilizarse, es necesario realizar procesos de evaluación de la escala que incluyen el análisis de los items, de la fiabilidad, de la validez y de la dimensionalidad. Valoración de una escala: • ANÓLISIS DE LOS ITEMS: • à ndide de homogeneidad: Es la correlación del item con el total de la escala. Si todos los items miden una misma cosa, se espera que estas correlaciones sean altas, eliminando aquellos items con coeficientes de homogeneidad bajos. Como la puntuación del item analizado también forma parte del total de la escala, la correlación item-total esta inflada por esta razón; como solución puede calcularse la correlación del item con el total excluido el item. • Ordenar la muestra en función de la puntuación total en la prueba y separar el 27% superior de la muestra y el 27% inferior de ella: tenemos una submuestra que representa los sujetos en una posición alta en la dimensión y otra que representa el segmento opuesto. Si un item determinado mide aquello que mide la escala total deberia ser capaz de discriminar entre estos 2 grupos. CabrÃ−a esperar que en promedio, los sujetos de la muestra inferior obtuvieran una posición inferior en la escala del item y los sujetos de la muestra superior obtuvieran una media superior en el item. Si los 2 grupos obtienen en el item medias que no difieren significativamente, entonces es que el item es incapaz de discriminar entre ambos grupos. El modo de averiguar si la media de 2 grupos en una vv es diferente, es utilizar una prueba t de contraste de medias. Likert pensaba que los items que no presentaban una adecuada consistencia interna o que no eran capacee de discriminar entre grupos extremos debÃ−an eliminarse de la escala. • FIABILIDAD DE LA ESCALA: Calcular la correlación entre 2 mitades de la prueba y aplicar la “fórmula de Sperman-Brown para el caso de longitud doble”. Si todos los items miden los mismo entonces puede esperarse una elevada fiabilidad Pero en la actualidad serÃ−a corriente calacular el coeficiente alfa para evaluar la consistencia interna y la correlación test-retest para evaluar la estabilidad temporal de la escala. Además, en la evaluación de la escala no basta con el análisis de los items y el de la fiabilidad, faltarÃ−a efectuar un análisis de la 39
dimensionalidad y habrÃ−a que estudiar la validez de la misma. Por último, es frecuente que con las escala Likert se obengan normas centiles para permitir la interpretación de las puntuaciones de los suejtos en el marco de un grupo normativo. CONTINGUT A Una variante sobre el método de Likert para obtener valores de escala de los items: Aunque Likert elaboró su método para producir mediciones de sujetos sin necesidad de escalar los items, se pueden utilizar los datos obtenidos para calcular valores de escala de los items, en los casos particulares en que ello es adecuado y razonable en función del significado de la escala. Se pueden utilizar las medias obtenidas para cada item a través de sujetos como valor de escala de los items. Para simplificar la tarea se puede presentar a los sujetos una tarea de Es simple con orientación de Rs (I.B), en lugar de una tarea de alternativas (II.B) que es propio de Likert. Utilizando una tarea de Es simple con orientación de respuesta (I.B) podemos obtener la puntuación de los sujetos como promedio del valor de escala de los items aceptados (H2; I:1;II:2;II:2). En general, utilizar una tarea con orientación de respuesta no permite obtener valores de escala de los items. Puede no tener sentido para obtener el valor de escala. Puede reconvertirse el método y aplicar una tarea de elección de alternativas con orientación de juicio (II.A) a una muestra, calcular las medias como valor de escala de los items y utilizar esos items en una tarea de Es simple con orientación de respuesta (II.B) para medir sujetos. El método se asemejaria al de los intervalos aparentemente iguales. El método de Likert, no está diseñado para obtener valores de escala. No puede decirse que sea un método que no llega a escalar los items. Se trata de una respuesta práctica a la cuestión de medir sujetos sin resolver el problema de como crear una escala de medida. CONTINGUT A TEMA 15: Mà TODO DE ESCALAMIENTO RECà PROCO DE MELIÔ (B7) 1. Todos los métodos de escalamiento que se han visto o bien utilizan una tarea de juicio como medio para obtener datos para escalar los items (Thurstone, Green y Dunn-Rankin) o bien renuncian a escalar los items (Likert). Ningún método utiliza una tarea de respuesta para escalar los items. 2. Cuando se escala los items con informacuón obtenida con una tarea de juicio y se mide a los sujetos con otra de respuesta, ni siquiera se usa la misma tarea. Lo común es encontrar tareas de elección de alternativas (II.A) , de comparación de Es (III.A y IV.A) y de ordenación de Es (V.A y VI.A) en el proceso de obtención de valores de escala, mientras que para medir a los sujetos se suelen utilizar tareas de Es simple (I.B) y tareas de elección de alternativas (II.B). 3. Cuando se consigue escalar los items, la tarea encargada a los jueces lleva apartejados los supuestos de objetividd y consistencia mientras que de los suejtos que después son medidos se supone que expresan su subjetividad. En el primer caso, se supone que los sujetos son instrumentos de medida fieles que no se dejan influir por su propia opinión. En el segundo caso, se espera que los suejetos se expresen acerca de su relación con los Es. El problema reside en que utilzar una tarea de respuesta no permite obtener valores de escala para los items.
40
Una tarea de respuesta no permite obtener valores de escala, pero si utilizamos dos tareas de respuesta sumultáneas, las puntuacions arrojadas por una permitira´n escalar las respuestas de otra de un modo recÃ−proco. (esta es la idea central del método) 4. Los métodos de escalamiento que escalan items utilizan procedimientos costosos para obtener esos valores de escala. Sin embargo, raramente se utilizan. -El método de las comparaciones de items por pares (III) es lento, ofrece una cantidad de información redundante que suele ser innecesaria y puede resultar desmotivador para los sujetos a los que se administran cuestionarios -El método de las comparaciones de items por grupos (IV) tiene las mismas desventajas y presenta el inconveniente de que no aporta la información necesaria. -El método de comparación de Es por grupos (V) comparte algunas de las dificulatdes de costes temporales, motivación y pérdida de información. -El método de ordenación de grupo total de Es (VI) parece que podrÃ−a solventar las dificultades anteriores. Rápido, fácil de entender y ofrece toda la info necesaria sobre el orden de los Es. Sin embargo, las puntuaciones que produce son de carácter ipsativo. De estas crÃ−ticas solo quedan libres dos tipos de procediminetos, las tareas de Es simple (I) y las de elección de alternativas (II). Estas dos son las estrategias + sencillas. El método recÃ−proco está pensado para construir escalas utilizando ambos procedimientos (items dicotómicos y de alternativas) en la obtención de información para escalar los items (Tareas I.B y II.B) y con la posibilidad de utilizar cualquiera de ambos en la medición de sujetos (Tareas I.B y II.B) 5. Una de las dificultades asociadas al uso de un método de elección de alternativas consiste en que el valor de las altrenativas es asignado sin que se determine empÃ−ricamente cuál es su valor de escala. El método recÃ−proco permite calcular el valor de escala de los items y el valor de escala de las alternativas a partir de una orietación de Rs. 6. Los demás métodos separan el procedimiento de escalamiento y medición del proceso de evaluación de la escala. Dada la importancia del proceso de evaluación de la escala, deberÃ−s guiar el proceso de escalamiento y medición en lugar de quedarse separado. El método recÃ−proco (=Likert), incluye el proceso de valoración como guÃ−a en la construcción de la escala. Mà TODO Presenta una solución simple para escalar los items y medir sujetos, y además, un conjunto de posibilidades (variantes) que permiten calcular los valores de escala de los items de diferentes formas y calcular los valores de escala de las alternativas de diferentes formas. 1. Generación de items El proceso de generación de items supone un proceso de elaboración de items y otro de selección racional de los mismos. La particularidad del método es que el conjunto final de items se va a poner a prueba, en 2 versiones: 41
-Como items para una tarea de Es simple con orientación de Rs ante los que el sujeto efectuará una acción de aceptación o no. se denominarán V/F. -Como items para una tarea de elección de alternativas con orientación de Rs. Hay que elaborar una escala de alternativas común a todas ellos que exprese grados de aceptación , acuerdo o no, según el tema. Quizás sea recomendable utilizar una escala de alternativas impar y amplia /7,9 u 11 alternativas) Cada item tendrá una presentación dicotómica y otra de alternativas. 2. Obtención de información para escalar los items A una muestra se le administra las 2 escalas, ambas con orientación de Rs. Se toman además mediciones de los mismos sujetos en aquellas otras vv criterio con las que se espere por hipótesis que el constructo medido está relacionado. El método de obtención de einformación es una tarea de estÃ−mulo simple con orientación de Rs (I.B) y una tarea de elección de alternativas con orietanción de Rs (II.B). 3. Valoración y selección de items Utiliza un análisis de items (=Likert) como medio para contribuir a seleccionar aquellos que formarán la escala final. Se efectúa tanto para los items V/F como para los items de alternativas. Para ambos se analizan la homogeneidad y la validez de los items. Análisis del poder discriminativo y homogeneidad de los items dicotómicos. Si un item dicotómico es adecuado y mide como cabe esperar, entonces los sujetos que contestan V al item diferirian de los que contestan F al item. Cabe esperar que un item dicotómico adecuado sea capza de discriminar a quienes puntúan más alto y más bajo en el mismo item en la versión de alternativas y en el total de esta versión. Si los que contestan F no se diferencian de los que contestan V parece que el item no es capaz de discriminar entre dos niveles de la dimensión medida. (se utiliza una prueba t). Análisis de la validez de los items dicotómicos: Lo + sencillo es calcular su correlación con la puntuación total en la versión de items dicotómicos. Para cada item de alternativas resultará de interés representar gráficamente, para cada alternativa, la proporción de sujetos que ha contestado afirmativamente al item dicotómico recÃ−proco. Análisis del poder discriminativo y homogeneidad de los items de alternativas: Para los items de alternativas lo + sencillo es calcular su correlación con la puntuación total en la versión de items dicotómicos. Para cada item de alternativas resultará de interés representar gráficamente, para cada alternativa, la proporción de sujetos que ha contestado afirmativamente al item dicotómico recÃ−proco. Por ejemplo: Tenemos 5 alternativas y en una muestra de 100 sujetos. De los 25 que han escogido la alternativa 2, sólo 3 han contestado V. Significa que para la alternativa 2 sólo un 8% hay de respuestas V. Análisis de la validez de los items de alternativas: Los mismos tipos de análisis para estudiar la relación item-criterio. Se puede calcular la correlación entre cada item y cada criterio y se puede representar gráficamente la regresión del criterio sobre el item. Ahora se procede a seleccionar los items que resulten + adecuados. El constructor de la escala debe tomar 42
toda la información en consideración y optar por la solución que sea+ satisfactoria. Los items que no hayan funcionado adecuadamente deben ser estudiados antes de desecharlos, dado que pueden aportar información diferente y no solo inadecuada, respecto a los items que funcionan bien. Al final de este proceso se espera disponer de un conjunto de items seleccionados en versión dicotómica y de alternativas para proceder a escalarlos y para medir sujetos después. 4. Solución simple Para obtener el valor de la escala hay pasos: -Para cada item en versión V/F se calcula la media en la versión de alternativas de aquellos sujetos que contestaron V y de aquellos que contestaron F. -Para cada item se resta de la media de los que contestaron V la media de los que contestaron F. Para cada item ahora hay un valor de esa diferencia. -Se resta al valor basado en la diferencia, el valor menor de todos ellos. El resultado para cada item se divide por el valor mayor obtenido y se multiplica por 100. La escala resultante va de 0, valor de escala para el item menor, a 100, valor de escala para el item mayor. Para medir sujetos se aplican los items dicotómicos en una tarea de Es simple con orientación de respuesta (I.B) , dándose por puntuación del sujeto el promedio de los items que acepta (H2; I:1;II:2;III:2). 5. Variantes del método Se pueden definir muchas variantes, de diferentes modos de alcanzar el valor de escala a partir de los datos obtenidos para el método de escalamiento recÃ−proco. Aunque la solución simple es la más indicada para el trabajo práctico. 6. Medición de los sujetos El método más sencillo y prà ctico consiste en administrar los items en tarea de Es simple con orientación de respuesta (I.B) y calcular la puntuación como promedio de los valores de escala de los items aceptados (H2; I:1;II:2;III:2). Si se decide medir a los sujetos con una tarea de elección de alternativas con orientación de Rs (II.B) pueden seguirse 3 procedimientos generales para obtener las puntuaciones de los sujetos. TEMA 16: Mà TODO DE ESCALOGRAMA DE GUTTMAN CONTINGUT B CONCEPTOS BÓSICOS 1. INTRODUCCIà N Todos los métodos que hemos visto hasta ahora, pueden calificar-se de probabilistas. Es decir, están fundados en una concepción de la medición que sostiene que en función de la posición del sujeto en la dimensión considerada, habrá una probabilidad determinada, menor que 1 y mayor que 0, de que el sujeto dé determinada respuesta; siendo esa probabilidad mayor, en la medida en que el valor de escala de los 43
items esté próximo a la posición en la escala del sujeto. Esta concepción de la medición conlleva mucha imprecisión. La puntuación total que obtiene un sujeto no determina exactamente qué respuestas ha dado el sujeto al cuestionario. Por ejemplo: dos sujetos pueden obtener la misma puntuación en un cuestionario habiendo aceptado items distintos. Con un procedimiento aditivo de puntuación , un sujeto que obtenga 10 puntos puede haber aceptado los 10 primeros items y rechazado los 10 Púltimos, pero un sujeto que haya hecho lo contrario tendrÃ−a la misma puntuación. Del mismo modo, utilizando un promedio de valores escalares, dos promedios muy semejantes o aun iguales pueden obtenerse patrones de respuesta. Aunque podamos encontrar un item cuyo valor de escala represente bien la posición en la escala del sujeto, no podremos decir con certeza cómo se ha comportado el sujeto respecto de los demás items. 2. CONCEPTO DE ESCALOGRAMA O ESCALA GUTTMAN Guttman fue consciente de la situación insatisfactoria y en respuesta a eso creó un procedimiento de construcción y evaluación de escalas de carácter determinista, en el que la posición del sujeto en la dimensión a medir determina exactamente el patrón de respuestas que el sujeto da ante los items de la escala. El fundamento de este procedimiento es una concepción acumulativa de los items y de los valores de escala que representan, de modo que si un sujeto acepta o acierta un item debe haber aceptado o acertado todos los items que ocupen posiciones por debajo de éste en la escala. Los items se disponen ordenadamente en la escala, representando de menos a más atributo en la dimensión medida. Cada item representa una posición en la escala. En un escalograma perfecto, si un sujeto acepta o acierta el item 5 es que necesariamente ha aceptado o acertado los 4 primeros. Si rechaza o falla el item 6 es que necesariamente falla o rechaza los items que siguen al item 6. De este modo la interpretación de una puntuación total es inequÃ−voca. A cada puntuación en la escala le corresponde un único patrón de respuesta (y a cada patrón una única puntuación en la escala). Por ej: una puntuación 6 significa haber aceptado o acertado los items 1 al 6 (y ninguna otra combinación de items). Para Guttman , un conjunto de items constituyen una escala sólo si cumplen esta condición de escalera graduada. Un conjunto de items que cumplen esta condición se dice que forman un escalograma o una escala tipo Guttman. 3. EJEMPLOS DE ITEMS FORMULADOS PARA DAR LUGAR A UN ESCALOGRAMA Esta concepción de lo que es una escala no puede utilizarse fácilmente en cualquier tema o dimensión, ni con cualquier conjunto de items. Ejemplo 1: Estamos interesados en medir el grado de compromiso y actividad polÃ−tica de una muestra de sujetos. Los sujetos responden si o no a cada uno de los items en una tarea de Es simple con orientación de Rs (I.B): 1. Escucho o leo noticias sobre polÃ−tica 2.Tengo un vivo interés por las cuestiones polÃ−ticas 3. Soy afiliado a un partido polÃ−tico 4. Soy militante activo de un partido polÃ−tico 4. Ocupo un cargo local, regional o autonómico de un partido
44
5. Ocupo un cargo polÃ−tico profesionalmente. Adviértase como las cuestiones anteriores estan concebidas de un modo acumulativo. Un sujeto puede: -Contestar no a todas ellas -Contestar si a la primera y no a todas las demás -Contestar si hasta la segunda y no al resto -Contestar si hasta la tercera y no al resto -... -Contestar si a todas Las cuestiones están concebidas de forma que se cumple la condición de Guttman para que haya una escala: contestar si a una significa haber contestado si a todas las anteriores y recÃ−procamente. Contestar no a una significa contestar no a las siguientes. Por supuesto, si los 6 items anteriores forman o no realmente una escala en el sentido anterior es una cuestión empÃ−rica que puede comprobarse estudiando cómo contestan a la misma una muestra de sujetos. 4. TIPOS DE RESPUESTAS A efectos de valoración del item, ante cada item dicotómico un sujeto sólo puede presentar uno de los siguientes 2 tipos de respuesta: Tipo 1. Respuesta de “acierto” o “aceptación”. Dar la solución correcta es “acertar” el item. Estar de acuerdo con el enunciado de un item, contestar que si a un item es “aceptar el item”. Simbolizaremos las respuestas de aceptación o acierto con un signo “+” o con un “1”. Tipo 2. Respuesta de “no acierto” o de “no aceptación”. Un “no acierto” es dar una solución equivocada u omitir dar respuesta. Contestar “no” ante un item es una respuesta de “no aceptación”. En escalas de actitud se espera que que el sujeto haya contestado todos los items de modo que en principion no deberia haber omisiones. Simbolizaremos las respuestas de “no aceptación” o de “no acierto” con un signo “-” o “0”. 5. TOTAL O PUNTUACIà N TOTAL Los items dicotómicos se presentan al sujeto en una tarea de Es simple con orientación de respuesta. (I.B) La puntuación total de un sujeto ante un cuestionario formado por items dicotómicos es simplemente el número de respuestas de aceptación o de acierto que el sujeto ha dado. (Mà TODO H1; I:2; II:2; III:2) 6. COMBINACIà N DE RESPUESTAS Al presentar a un sujeto un conjunto de items ordenados, y dar éste una respuesta ante cada cada uno de ellos, aparece una configuración o combinación de respuestas. Combinación de respuestas: Configuración de “aceptaciones o aciertos” y “no aceptaciones o no aciertos” que produce un sujeto en respuesta a un conjunto de items ordenados diseñados para formar un escalograma. 45
Como el escalograma implica un conjunto de items ordenados, puede representarse la combinación de respuestas que da un sujeto como una sucesión de signos + y - donde el primer signo corresponde a la Rs al primer item, el segundo a la respuesta al segundo, etc. Por ejemplo: ++--Respuestas d eun sujeto a 5 items, siendo que el sujeto ha acertado o aceptado los items 1 y 2 y no ha acertado o no aceptado los items 3, 4 y 5. 7. PATRONES DE RESPUESTA Si los items forman un escalograma, entonces deben cumplir el principio de que aceptar o acertar un item implica haber acertado o aceptado todos los anteriores. Por ejemplo, con 4 items, las combinaciones son: ---+--++-+++++++ Ninguna otra combinación de respuesta con 4 items cumple el principio de Guttman. ----->Patrones de respuesta o Patrones (P): Combinaciones de respuesta que cumplen el principio de una escala de Guttman. 8. COMBINACIONES CON ERROR. Al administrar unos items que forman un escalograma a una muestra de sujetos, se puede encontrar combinaciones de respuestas que incumplen este principio. Por ejemplo, con 4 items, las combinaciones: -+-+-+--++ à stas incumplen el principio de acumulatividad. Las combinaciones de respuesta que incumplen el principio básico de una escala Guttman de que aceptar un item significa haber aceptado todos los anteriores, se dice que contienen error y se denominan: Combinaciones de respuestas de error. 9. Nà MERO DE PATRONES DE RESPUESTA Por ejemplo: Simbolizando los aciertos (o aceptaciones) por + y los no aciertos (o las no aceptaciones) por -, podemos esperar los siguientes patrones de respuesta: 46
Patron 0: ----= 0 puntos Patrón 1: +---= 1 punto Patrón 2: ++--= 2 puntos Patrón 3: +++-= 3 puntos Patrón 4: ++++= 4 puntos Sólo esas combinaciones son “patrones de respuesta”, es decir, ajustan con la concepción de que esos items forman un escalograma de Guttman. Con 4 items hay 5 patrones de respuesta que ajustan con la lógica de un escalograma. Con 3 tendrÃ−amos 4 patrones possibles. Con 5 tendrÃ−amos 6. En general para n items valorados dicotómicamente (Acierto o no acierto) hay n+1 “patrones de respuesta”. Es decir, siendo n el número de items dicotómicos, el número de patrones de escala (NP) es igual a n+1. NP= n+1 La clave del escalograma de Guttman consiste en que la puntuación total obtenida por un sujeto (de 0 a 4 en el ejemplo) revela un patrón de respuesta determinado ante los items. Conocida la puntuaciçon total de un sujeto se puede reproducir la respuesta que ha dado ante cada uno de los items. Esta propiedad, cuando puede alcanzarse es muy valiosa, dado que una puntuación total es suficiente para conocer las respuestas del sujeto 11. Nà MERO DE COMBINACIONES DE ERROR Una combinación de respuestas que no ajusta a un patrón, se denomina “combinación de error”, porque contiene al menos un “error de escala”, en el sentido de que al menos hay una respuesta del sujeto dentro de esa combinación que no es consistente con lo que cabe esperar si aquellos items forman un escalograma. 12. ERRORES DE ESCALA ¿Cómo podemos cuantificar el grado de error que hay en una combinación de respuesta? La cuestión reside en cuántas aceptaciones deberian ser no aceptaciones y al revés; o de otra forma, cunántos + deberÃ−an ser - i al revés. Para determinar si un signo deberÃ−a ser otro, tendrÃ−amos que establecer con qué patrón debe compararse una combinación de respuestas dada. ¿en funciçon de que patrón decimos que un + tendrÃ−a que ser un -? El propósito de una escala Guttman es que la puntuación total obtenida por un sujeto determine inequivocamente el patrón de respuestas que ha dado. Se trata de construir instrumentos de medida donde baste conocer el total que ha obtenido un sujeto para saber que items ha aceptado o acertado y cuales no. el total ha de determinar el patrón correspondiente. Cada combinación tiene un determinado número de signos +, aciertos o aceptaciones, desde 0 hasta n, que constituyen el total de esa combinación. Cada total tiene asignado inequivocamente un patrón de escala correcto. Cada combinación debe ser comparada respuesta a respuesta con el patrón de escala de su mismo total. Error de escala: Cada una de las desviaciones que una combinación de respuestas presenta respecto al patrón de escala de su mismo total.
47
Cada una de las discrepancias que hay entre la combinación de respuestas que da un sujeto a un escalograma y el patrón de escala que esas respuestas debÃ−an haber cumplido. Cada respuesta del sujeto que no es igual a la esperada en esa posición para el patrón de escala del total correspondiente, es un error de escala. Los errores de escala los simbolizaremos con la letra E. Todas las respuestas que no son errores de escala las denominaremos: Aciertos de escala. Son aciertos de escala las respuestas que corresponden con las del patrón del mismo total, y el número de las mismas lo simbolizaremos por la letra A. el número de errores de escala E más el número de aciertos de escala A es igual al número total de respuestas R R= A+E Si la finalidad de una escala Guttman es conocer las respuestas concretas que da el sujeto a partir de la puntuación total que obtiene, entonces es razonable admitir que una combionación de respuestas concreta dada por un sujeto deberÃ−a ajustar respuesta con el patrón de respuestas correspondiente a su puntuación. (EJEMPLOS DE CONTABILIZAR ERRORES EN LAS PÓGS 254-55-56) Este método de contabilizar los errores, calculando la puntuación total de una combinación de respuestas dada y comparando después esa combinación con el patrón del mismo total, se conoce como criterio o método de conteo de error de Goodenough o de Goodenough-Edwards. Guttman propuso otro método, el minimización de error, en el que una combinación de respuestas se compara con el patrón frente al que presenta menos discrepancias, sin considerar el total. Pero no es consistente con el principio teórico que rige una escala Guttman, la posibilidad de determinación del patrón de respuestas por el total, y además, crea diversas dificultades prácticasm que implican soluciones arbitrarias, por lo que ha sido desechado. Es muy importante darse cuenta que el significado del concepto de error de escala no tiene nada que ver con el significado de no acertar o equivocarse en el item. Un error de escala es una respuesta, sea un acierto al item o un no acierto al item, que discrepa de la respuesta que se esperaba para esa posiciçon según un patrón de escala. Un acierto de escala no tiene nada que ver con el concepto de acierto de un item. Un acierto de escala es una respuesta igual a la esperada según un patrón de escala, sea un acierto o un no acierto la respuesta esperada. Los errores de escala que aparecen en las respuestas de una muestra de sujetos son importantes, porque su cuantÃ−a se toma como indicación para deteminar si aquellos items se pueden considerar o no un escalograma de Guttman. Mà TODO ¿Cómo puede establecerse si un conjunto de items dicotómicos forman realmente un escalograma para una muestra determinada? 1. Se elabora un conjunto de items, estructurados teóricamente para cumplir con el modelo acumulativo, siguiendo el principio de que acertar o aceptar un item superior debe suponer acertar o aceptar todos los inferiores a él. Al contrario de lo que sucede con otros métodos de escalamiento, los cuestionarios destinados a formar un escalograma suelen presentar pocos items. 2. se administran los items a una muestra de sujetos en una TAREA DE ES SIMPLE CON ORIENTACIà N DE RESPUESTA (I.B). Los datos obtenidos se disponen en una tabla de “items por sujetos” que contiene en su interior la respuesta de cada sujeto (fila) a cada item (columna), las aceptaciones o aciertos suelen representarse por el signo + o por un 1, las no aceptaciones por un signo - o por un 0. se calculan los totales para sujetos (suma de filas) y para los items (suma de columnas) como número de unos o de signos +.
48
A continuación, se reordena la tabla por items, desde el item con menos aceptaciones o aciertos al item con más aceptaciones o aciertos. También se puede reordenar la tabla por sujeots, desde el sujeto con menos puntos hasta el que tiene más. Ordenar la tabla por items es necesario para poder contabilizar los errores de combinación de respuestas de cada suejto. Ordenar la tabla por sujetos ayuda a ver gráficamente el escalograma que forman los items, pero no afecta al proceso de ningún otro modo. Con la tabla ordenada, se compara la combinación de respuestas que ha dado cada sujeto con el correspondiente patrón, en función de su total. Se marca en el interior de la tabla todas las respuestas que son un error de escala. Esos errores son la base para los indicadores y criterios de escalabilidad que se calculan después. -Coeficiente de reproductibilidad: Es el indicador más conocido. Es la proporción de aciertos de escala que hay en los datos. CR= A/R Guttman propuso el CR como un indice de escalabilidad del conjunto de los datos; es decir, del conjunto de respuestas dadas por N sujetos ante los n items de un escalograma. A nuestro juicio el CR puede proponerse y calcularse para cualquier porción de datos. Po ej: calcular el CR de un item como la proporción de aciertos que hay en las N respuestas que han dado N sujetos a ese item. CRi= A/R También se puede calcular el CR de un sujeto, lo que supone calcular la proporción de acierots que hay entre las n respuestas que el sujeto ha dado a los n items de que consta el cuestionario Crs=A/R Es más, se puede calcular el CR para cualquier subconjunto de datos. Especial interés tiene el CR del total de los datos. En el numerador está el número total de “aciertos de escala” A , y en el denominador el número total de respuestas, que es igual al producto del número de items n por el número de sujetos que los contestan N. Guttman definció el CR de un modo más enrevesado: “La cantidad en que una escala se desvia del patrón de escala ideal es medida por un coeficiente de reproductibilidad (...) se obtiene contando el número de respuestas que habrian sido predichas mal para cada persona sobre la base de su puntuación en la escala, dividiendo esos errores por el número total de respuestas y restando el cociente rsultante de 1. Como: CR= 1- E/R Si el CR es la proporción de aciertos de escala en los datos cuanto mayor sea esta proporción mejor. Si en unos datos no hay ningún error de escala entonces CR=1, aunque no es común. Pero, ¿cuán alto tiene que ser el CR para que consideremos que un conjunto de items son escalables según el modelo de Guttman? Guttman sugirió el valor de 0'85 como punte de corte arbitrario. Posteriormente se recomendó que el CR sea mayor o igual a 0'9 para que los datos sean escalables. Es decir, almenos el 90% de las respuestas han de ajustar con las esperadas según los patrones de respuesta. El CR que cabe esperar para respuestas al azar decrece al aumentar el número de items en el escalograma. Guttman y otros denominan “cuasi-escalas” a aquellos conjuntos de items que, cumpliendo otros criterios de 49
escala, no alcanzan un CR mayor o igual a 0'9. -Coeficiente de escalabilidad: El número de aceptaciones o aciertos los simbolizaremos por Ii y el número de no aceptaciones o no aciertos por Iii. Ii= Nº aceptaciones que recibe el item i Iii= Nº no aceptaciones que recibe el item i Por supuesto: Ii + Iii = N Podemos calcular la proporción que Ii y Iii representan respecto del total (p y q) p= Ii/N q=IIi/N Se desprende que: p+q=1 Pueden darse 3 casos: 1. p>q 2. pq PMMA= p 2. p
PMMA/n
Se denomina Porcentaje de Mejora (PM) a la diferencia entre el Coeficiente de Reproductibilidad y la Reproductibilidad Marginal MÃ−nima: 50
PM= CR - RMM Por último, dividiendo el porcentaje de mejora (PM) por uno menos la rewproductibilidad marginal mÃ−nima (RMM) , obtenenmos el Coeficiente de Escalabilidad (CE). CE= PM/(1-RMM) Cuanto mayor sea el coeficiente de escalabilidad tanto mejor, más ajustan los datos a los patrones de escalograma. Como punte de corte arbitrario, se ha sugerido que un CE debe ser por lo menos de 0'6. (PÓGINAS 266-67: SIGLAS) TEMA 17: Mà TODO DE DESPLEGAMIENTO UNIDIMENSIONAL DE COOMBS CONCEPTO Orientación de carácter determinista para el escalamiento de estÃ−mulos. Está basada en un principio: Si un conjunto de estÃ−mulos y un conjunto de sujetos pueden ser ubicados sobre una misma dimensión, entonces el orden de preferencia con que cada sujeto escoge los estÃ−mulos refleja la posición relativa del sujeto de esos estÃ−mulos. Es decir, si el sujeto J ordena los estÃ−mulos A, B y C en el orden A,B,C en una tarea de respuesta, esto significa que el estÃ−mulo A es el mejor que representa la posición en la escala del sujeto J, el B el segundi y el C el tercero. A es el estÃ−mulo más próximo a la posición en la escala de J, B es el siguiente y C el más alejado. O la distancia entre A y J es menor que la distancia entre B y J, que, a su vez e menor que la distancia entre C y J. Si un segundo sujeto H ordena los mismos estÃ−mulos en el orden C,B,A ello significa que H está ubicado en la proximidad de C. si un tercer sujeto G ordena B,A,C ello significa que para G el estÃ−mulo más próximo es B. Cada sujeto ordena los estÃ−mulos en función de su proximidad con los mismos. Al orden de los estÃ−mulos que da un sujeto se le denomina ESCALA I. Al orden común en que los estÃ−mulos quedan representados sobre la recta, es decir, a la escala común de estÃ−mulos que subyace a la respuestas individuales de los sujetos, se le denomina ESCALA J . Si un conjunto de estÃ−mulos pueden representarse unidimensionalmente, sobre una recta, entonces tiene que haber una sola escala J para los diferentes ordenes o escalas I que den los sujetos. El método de desplegamiento unidimensional de Coombs es un procedimiento para obtener la escala J subyacente a un conjunto de escalas I, desplegando las escalas I sobre la escala J común. Además, es de naturaleza determinista, no pudiendo admitir respuestas incompatibles con la dimensión representada en la escala J. (Mirar exemples grà fics de les pà gines 330-1-2) -Número de escalas I posibles y número de escalas I compatibles Como n estÃ−mulos se pueden ordenar de n! Formas, entonces ese es el número de escalas I posibles con n estÃ−mulos NEIP= n! Sin embargo, sólo unas pocas de estas escalas I son compatibles, ajustan o pueden desplegarse, sobre una 51
escala J de n EstÃ−mulos. ----> Puede apreciarse que el NEIP crece muy rápidamente al crecer n, mientras que el NEIC permanece mucho más pequeño. -Propiedades de las escalas I consistentes con una escala J Por ejemplo: Con 2 estÃ−mulos, las escalas I compatibles pueden ser: 1. AB 2. BA En efecto, con 2 estÃ−mulos Ay B, un sujeto puede situarse o bien más cerca de A o bien más cerca de B. por esos solo es posible dar una de las dos escalas I como orden de respuesta. ¿de qué dependerá que un suejto responda con la primera o con la segunda escala I? De que esté más cerca de A ó de B. Que un sujeto está más cerca o menos de A o de B dependerá de donde se sitúe respecto al punto medio entre A y B. el punto medio rompe en dos segmentos la recta. Los puntos medios son muy importantes. De la posición de los sujetos respecto de los puntos medios dependen las respuestas I de los sujetos. Hay un punto medio entre cada 2 estÃ−mulos. Como siempre, hay un segmento más que puntos medios. NEIC= NPM + 1 Debe advertirse que dos sujetos que estén en el mismo segmento contestarán con la misma escala I aunque no estén en la misma posición. El modelo es incapaz de discernir posiciones dentro de un mismo segmento. A cada segmento le corresponde un patrón de respuesta o escala I compatible con la escala J; cada segmento determina un tipo de sujeto según su posición en el continuo. No es razonable utilizar el método n=2 porque con 2 estÃ−mulos no se puede contrastar si hay o no ajuste a una escala J. Con 3 estimulos aparecen ya las propiedades de las escalas I: -Las escalas I siempre empiezan y acaban con escalas I que representan los estÃ−mulos en el orden de la escala -Cada escala difiere de la anterior en que dos estÃ−mulos asyacentes están permutados -La primera escala es la imagen en espejo de la última Con n=3 ya es posible contruir escalas que no ajusten a la escala J -Con n=4 es posible ofrecer una información ssobre desigualdad entre dos distancias. -Como obtener la escala J a partir de las escalas I El problema de una situación de escalamiento psicológico es determinar la escala J que corresponde a un conjunto de escalas I. No tenemos una dimensión fÃ−sica a la que referirnos y sólo contamos con las escalas I que un conjunto de sujetos han producido para un conjunto de estÃ−mulos. Antes que nada, hay que disponer de un conjunto de Es que se administran a una muestra en una tarea de ordenación del grupo total 52
(Método IV.B). Y...¿Cómo obtenemos la escala J a partir de las escalas I? 1.Frecuencia con que aparecen cada tipo de escala I 2. Se buscan dos escalas I que sean imagen en espejo . Si los datos ajustan a una escala J sólo puede haber dos escalas I que sean imagen en espejo. Si hay más de una, es signo de que los datos quizás no sean unidimensionales, no ajustables a una escala J. 3.Cogemos una de las dos escalas en espejo y la tomamos como escala J. Cualquiera de las dos. Y la numeramos com la escala 1. 4. Se busca un tipo de escala J que sólo difiera de la escala J en que presenta dos estÃ−mulos contiguos en orden inverso. Si las escalas I son compatibles sólo debe habere un tipo de escala I que cumpla esta condición. Y asÃ− con todos los estÃ−mulos (ordenados). Si las escalas I ajustan, todas las respuestas de los sujetos caerán en alguno de esos tipos de escalas I y la escala J quedará confirmada. Si aparecen escalas I que no ajustan habrá que considerar que los datos no cumplen el modelo. -Modos en que los datos pueden incumplir el modelo El modelo es de naturaleza determinista, y no considera la aparición de error como una probabilidad que debe estar por debajo de cierto punto atribuible al azar. Con una concepción determinista basta un incumplimiento del modelo para considerar que éste no ajusta, pero esto lo convierte en poco práctico, dado que es razonable que aparezca cierto error cuya probabilidad parece incrementarse al crecer n. hay varias formas de incumplir el modelo: -Pueden aparecer más de dos tipos de escalas I que sean imagen en espejo -Pueden aparecer escalas I que terminen en un Es que esté enmedio de la escala J -Pueden aparecer escalas I que no puedan ser la respuesta de ningún sujeto ubicado en algún segmento de la escala J. -Puede que no haya manera de cumplir el principio de ordenación según el cual cada escala difiere de la siguiente en que presenta dos estÃ−mulos contiguos invertidos. Cualquiera de estos problemas cuestiona la existencia de una escala común J. Además. Aunque las escalas I sean consistentes, puede que no aparezcan algún o algunos tipos de escala I, lo que puede dificultar la ordenación sin cuestionar la consistencia del modeo. -Consideración del error: Con pocos Es quizás es posible encontrar algunos datos que ajusten, sin error. Cuando el número de Es crece, el número de segmentos también, y las discriminaciones que se solicitan al sujeto son demasiado precisas y complejas para esperar que no se produzca error. Incluso si nos referimos a una dimensión en la que si que sabemos que hay una escala J, loos sujetos incluso cometerán errores. Con mucha razón cabe esperar errores en dimensiones psicológicas que no presentan un referente fÃ−sico inmediato. Por eso, el método ha de ser tolerante con cierto grado de error. La cuestión es como calcular el error y cómo calcular qué grado de error es tolerable. Es decir, como transformar la naturlaeza determinista del método en probabilista. Cualquier respuesta a sta cuestión ha de venir de mano de las 53
frecuencias reales y las esperadas de las escalas I. Para que unos datos se consideren escalables según el modelo las escalas I que ajustan a la escala J han de ser las más frecuentes, pero, ¿qué proporción de las escalas I obtenidas de un muestra debe ajustar ? Goldberg y Coombs establecieron el principio de que al menos del 50% + 1 de las escalas I deben ajustar a un modelo de escala J determinado. Se han realizado estudios para determinar que proporción de escalas I que ajusten cabe esperar en función del número de estÃ−mulos. Los resultados indican que la cantidad de escalas I con error que aparecen crece al crecer n. Con n=5 encontrar un 50% de escalas I que ajuste podria ser suficiente para admitir una escala J, pero con 6 estÃ−mulos podrÃ−amos admitir que existe una escala J con tan solo un 30% de escalas I que ajustaran, dado que la probabilidad de encontrar una escala I que no ajusta es mayor. La cantidad de escalas I que no ajustan que cabe esperar con más de 6 ó 7 Es puede hacer inviable el trabajo, lo que limita el interés práctico del método.
54