ALINEAMIENTO DE PRUEBAS SIMCE Y TIMSS DE CUARTO BASICO. Documento de Trabajo N 3 Diciembre 2013

ALINEAMIENTO DE PRUEBAS SIMCE Y TIMSS DE CUARTO BASICO Documento de Trabajo N◦ 3 Diciembre 2013 Departamento de Estudios de la Calidad de la Educaci

4 downloads 44 Views 1MB Size

Recommend Stories


Cuadernos de trabajo. Diciembre, 2013
Cuadernos de trabajo 44 Desarrollo de mecanismos para facilitar el acceso de mujeres a programas promovidos por los Organismos Nacionales de Viviend

EJEMPLOS DE PREGUNTAS DE LAS PRUEBAS DE MATEMÁTICAS Y CIENCIAS DE TIMSS 2007
EJEMPLOS DE PREGUNTAS DE LAS PRUEBAS DE MATEMÁTICAS Y CIENCIAS DE TIMSS 2007 Las pruebas de matemáticas y ciencias evaluaron contenidos y competenci

Año 2013 DOCUMENTO DE TRABAJO SISTEMAS DE GESTIÓN ENERGÉTICA
Año 2013 DOCUMENTO DE TRABAJO “SISTEMAS DE GESTIÓN ENERGÉTICA” “GRUPO DE TRABAJO DE SISTEMAS DE GESTIÓN ENERGÉTICA” Asociación de Empresas de Eficie

2013, del Consejo de Diputados de 3 de diciembre
C) Normativa Foral del País Vasco  Normativa Foral de Álava Norma Foral 33/2013, de 27 de noviembre Del Impuesto sobre la Renta de las Personas F

Story Transcript

ALINEAMIENTO DE PRUEBAS SIMCE Y TIMSS DE CUARTO BASICO

Documento de Trabajo N◦ 3 Diciembre 2013

Departamento de Estudios de la Calidad de la Educaci´on Divisi´on de Estudios ´ AGENCIA DE CALIDAD DE LA EDUCACION

Alineamiento de pruebas Simce y TIMSS de cuarto b´ asico

palabra

1

Alineamiento de pruebas Simce y TIMSS de cuarto b´ asico

2

´Indice ´ Indice

2

1. Introducci´ on

2

2. Marco Te´ orico y Metodolog´ıas Utilizadas

4

2.1. An´ alisis de los ´ıtems en Marco de TCT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6

2.2. Teor´ıa de Respuesta al ´Item . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

3. An´ alisis Descriptivos 4. Resultados

9 14

4.1. An´ alisis de Calibraci´ on Conjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4.2. Tabla de equivalencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 5. Conclusiones

30

Bibliograf´ıa

31

6. Anexos

33

6.1. Detalle de An´ alisis por cuadernillo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 6.1.1. Simce - Forma C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 6.1.2. Simce - Forma D . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 6.1.3. Simce - Forma E . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 6.1.4. Simce - Forma G . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 6.1.5. TIMSS - Forma 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 6.1.6. TIMSS - Forma 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 6.1.7. TIMSS - Forma 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 6.1.8. TIMSS - Forma 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 6.1.9. TIMSS - Forma 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 6.1.10. TIMSS - Forma 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 6.1.11. TIMSS - Forma 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 6.1.12. TIMSS - Forma 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 6.1.13. TIMSS - Forma 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 6.1.14. TIMSS - Forma 10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

Alineamiento de pruebas Simce y TIMSS de cuarto b´ asico

3

6.1.15. TIMSS - Forma 11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 6.1.16. TIMSS - Forma 12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 6.1.17. TIMSS - Forma 13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 6.1.18. TIMSS - Forma 14 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 6.2. Tabla de Equivalencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

Alineamiento de pruebas Simce y TIMSS de cuarto b´ asico

1

Esta es una publicaci´ on del departamento de Estudios de la Calidad de la Educaci´on, Divisi´on de Estudios, Agencia de la Calidad de la Educaci´ on.

Claudia Matus Correa1

1 Ing.

Civil Matem´ atico. PhD Estad´ıstica University of Pittsburgh. Departamento de Estudios de la Calidad de la Educaci´ on.

Alineamiento de pruebas Simce y TIMSS de cuarto b´ asico

1.

2

Introducci´ on

La participaci´ on de Chile en estudios internacionales de logro educativo tales como TIMSS y PISA, ha permitido contextualizar el rendimiento de los estudiantes chilenos, compar´andolo con el obtenido por sus pares en otros pa´ıses. La informaci´ on recogida por dichas pruebas complementa la que proporciona la prueba nacional Simce. Si bien, tanto las pruebas internacionales como el Simce se construyen bajo similares modelos evaluativos y criterios de calidad, las poblaciones objetivo a las que son aplicadas son de distinta composici´on. Considerando que las buenas pr´ acticas para el an´ alisis y construcci´on de pruebas exigen que estas se adapten a la poblaci´ on objetivo (Hambleton, 1985), se plantean interrogantes acerca del grado de adecuaci´on particular a Chile que tienen las pruebas internacionales. Tambi´en, sobre la calidad t´ecnica de la prueba nacional Simce en comparaci´ on con las pruebas internacionales. Adicionalmente, dado que las pruebas internacionales son aplicadas solo a una muestra representativa de estudiantes2 , surge la inquietud de determinar una equivalencia entre las escalas de puntaje de la prueba Simce y las pruebas internacionales. De esta manera, los distintos establecimientos podr´ıan estimar cu´ al hubiera sido el rendimiento de sus alumnos en dichas pruebas internacionales a partir de su rendimiento promedio en la prueba Simce.

Este documento de trabajo tiene el prop´ osito de contribuir a responder las interrogantes anteriores. Por un lado, se quiere determinar el grado de pertinencia psicom´etrica particular a Chile que presenta la prueba internacional TIMSS de Matem´ atica y, simult´aneamente, comparar la calidad m´etrica de las preguntas TIMSS y Simce. Asimismo, considerando que ambas evaluaciones son pruebas curriculares –Simce mide el curr´ıculo nacional vigente y TIMSS mide un curr´ıculo internacional consensuado– y que comparten un mismo modelo de medici´ on en el marco de la Teor´ıa de Respuesta al ´Item3 , surge la posibilidad de establecer una equivalencia entre las escalas de medici´ on de ambas pruebas mediante una tabla de correspondencia de puntajes.

El 19 de octubre del a˜ no 2010, los alumnos matriculados en cuarto b´asico de todo el pa´ıs rindieron las pruebas Simce de Matem´ atica y de Lenguaje y Comunicaci´on: Comprensi´on de Lectura4 . Ese mismo a˜ no, durante la segunda quincena de noviembre y la primera semana de diciembre, una muestra representativa de estudiantes a nivel nacional, adicionalmente particip´ o en la aplicaci´on de la prueba TIMSS5 , contestando una prueba de Matem´ atica y otra de Ciencias Naturales. Se dispone entonces de las respuestas de 5.148 estudiantes de cuarto b´ asico tanto a las preguntas de la prueba Simce, como a las de la prueba TIMSS de Matem´atica. Dichas 2 En 3 Es

grados o edades que tambi´ en son medidos por el Simce. decir, son construidas bajo el supuesto que las preguntas siguen el mismo tipo de modelo en t´ erminos de la probabilidad

de contestar correctamente. 4 Tambi´ en rindieron la prueba de Ciencias Sociales. 5 Corresponde a TIMSS 2011. Al estar en el hemisferio sur, Chile debe aplicar la prueba antes.

Alineamiento de pruebas Simce y TIMSS de cuarto b´ asico

3

respuestas se analizar´ an desde dos ´ opticas, primero estudiando la calidad psicom´etrica de ambas pruebas y, posteriormente, construyendo la equivalencia entre ambas6 .

El estudio psicom´etrico de ambas pruebas se realizar´a siguiendo las recomendaciones cl´asicas para el an´ alisis de pruebas de logro estandarizadas (Hambleton y Swaminathan,1985; Olson J. et al., 2009 y OECD, 2012). De esta manera, primeramente se estudiar´ an las pruebas en el marco de la Teor´ıa Cl´asica de los Test (TCT) para luego examinarlas de manera separada y conjunta, en el marco de la Teor´ıa de Respuesta al ´Item (TRI). Dentro de los an´ alisis en el marco TCT se entregar´ a la confiabilidad y el grado de consistencia interna de cada una de las formas o cuadernillos7 de cada prueba, como asimismo las dificultades relativas y el poder discriminante de las distintas preguntas. En el marco de la TRI se presentar´an los par´ametros bajo el mismo modelo probabil´ıstico, lo que permitir´ a evaluar comparativamente el comportamiento de las preguntas de cada prueba en cuanto a sus caracter´ısticas, y de esta manera se podr´ a concluir sobre la calidad estad´ıstica de ambas como instrumentos de medici´ on para la poblaci´ on chilena.

Para establecer una equivalencia entre las escalas de medici´on de ambas pruebas, que se expresa en una tabla de equivalencia, se debe primero determinar la naturaleza y fuerza de la relaci´on estad´ıstica existente entre ellas. Dependiendo de los resultados obtenidos y siguiendo las recomendaciones de la literatura especializada al respecto (Dorans, 2004), se proceder´ a a ajustar un modelo matem´atico que permita alinear las escalas de ambas pruebas obteni´endose las equivalencias de sus puntajes. Asimismo, se ejecutar´a un procedimiento de re-muestreo a objeto de determinar las incertidumbres asociadas.

Este documento se estructura de la siguiente manera. En la siguiente secci´on se presenta el marco te´orico y las t´ecnicas estad´ısticas que se utilizar´ an tanto para el an´alisis psicom´etrico como para el alineamiento de las escalas de ambas pruebas. La tercera secci´ on presentar´a un an´alisis descriptivo de los datos utilizados y en la cuarta secci´ on se reportar´ an los resultados obtenidos. El documento finalizar´a discutiendo la implicancia de los resultados.

6 Este

documento presenta resultados obtenidos en Gaggero (2012) y Guzm´ an (2013), como asimismo en Agencia de Educaci´ on

(2013a) 7 La prueba Simce est´ a dividida en 4 cuadernillos o formas, de 35 preguntas cada uno. La prueba TIMSS tiene 14 formas o cuadernillos con un n´ umero de preguntas que var´ıa entre 22 y 29.

4

Alineamiento de pruebas Simce y TIMSS de cuarto b´ asico

2.

Marco Te´ orico y Metodolog´ıas Utilizadas

Actualmente las pruebas estandarizadas internacionales como PISA y TIMSS (OECD 2012, Olson et al., 2009) se analizan siguiendo los mismos principios generales8 :

Evaluaci´ on de comportamiento psicom´etrico de preguntas usando indicadores descriptivos de la muestra9 o poblaci´ on objetivo.

Evaluaci´ on y ajuste de modelo matem´atico con estimaci´on de par´ametros en el marco de la Teor´ıa de Respuesta al ´Item.

A continuaci´ on se presentan brevemente los conceptos e indicadores que permiten el an´alisis psicom´etrico de las preguntas en el marco de la Teor´ıa Cl´ asica de los Test y para luego presentar lo propio con los indicadores psicom´etricos de calidad en el marco de la Teor´ıa de Respuesta al ´Item. Se recuerda que en la Teor´ıa Cl´ asica de los Test el modelo subyacente relaciona de manera simple el rasgo o constructo10 que se desea medir en una persona, con su puntuaci´ on observada en una prueba, mediante:

X =V +

(1)

Donde: X: Puntuaci´ on observada de la persona. V : Nivel de rasgo o puntuaci´ on “real” de la persona. : Error de medici´ on del rasgo en la prueba o test.

El error de medici´ on se considera como una variable aleatoria de media cero y varianza finita, independiente del puntaje verdadero. Representa efectos que influyen en los resultados de la prueba, no relacionados con los conocimientos, contenidos o constructos que mide la prueba. Asimismo, se considera que si una persona rinde dos pruebas paralelas11 , los errores de medici´on asociados a ambas pruebas son independientes y por lo tanto, no correlacionados. Del modelo y supuestos anteriores se deducen las siguientes ecuaciones, donde X1 yX2 son los puntajes observados para dos pruebas que miden constructos distintos: 8 En

este caso se considera el an´ alisis de la prueba definitiva cuyas preguntas se estudiaron previamente en una aplicaci´ on piloto. obtenidos bajo TCT. 10 Por ejemplo “logro en Matem´ atica”. 11 Que tienen el mismo marco de referencia y mismas caracter´ ısticas estad´ısticas. 9 Usualmente

5

Alineamiento de pruebas Simce y TIMSS de cuarto b´ asico

Cov(X, V )

Cov(X1 , X2 )

V ar(X)

= Cov(V + , V )

(2)

= Cov(V + V )

(3)

= V ar(V )

(4)

= Cov(V1 + 1 , V2 + 2 )

(5)

= Cov(V1 + V2 )

(6)

= Cov(V + , V + )

(7)

= V ar(V )

(8)

= V ar()

(9)

Para la medici´ on educacional se denomina confiabilidad de un test a la proporci´on de la varianza real que es explicada por la varianza observada (Thompson, 2003). Corresponde al λ descrito por la siguiente ecuaci´ on: λ=

V ar(V ) V ar(X)

(10)

Existen distintas maneras de estimarla confiabilidad seg´ un las caracter´ısticas de los test:

Alfa de Cronbach: Este coeficiente estima el grado de alineamiento o consistencia que presentan los distintos ´ıtems o preguntas del test12 . Se define de la siguiente forma: Pn σ2 n α= (1 − i=12 i ) n−1 σx

(11)

Donde: n: N´ umero de ´ıtems del test. Pn 2 ıtems. i=1 σi : Suma de las varianzas de los ´ σx2 : Varianza de las puntuaciones en el test. Observamos que el alfa de Cronbach depende del n´ umero de preguntas.

Coeficiente de Kuder-Richarson: Es el equivalente al alfa de Cronbach aplicado a test cuyos ´ıtems son de car´ acter dicot´ omicos. En nuestro caso se utilizar´a el alfa de Cronbach para medir confiabilidad de las pruebas TIMSS y Simce.

12 Es

una cota inferior para confiabilidad.

Alineamiento de pruebas Simce y TIMSS de cuarto b´ asico

6

Test-Retest: Considerando que dos test son paralelos cuando miden el mismo puntaje verdadero y solo difieren por el error de medici´ on

13

, se prueba que si dos test X1 y X2 son paralelos entonces: λ = Corr(X1 , X2 )

(12)

Como un test es paralelo consigo mismo, se puede calcular la correlaci´on entre los puntajes obtenidos en dos ocasiones diferentes. Sin embargo, es necesario resguardar que el test sea aplicado a dos muestras de individuos equivalentes. Este m´etodo apunta a la confiabilidad del test en el tiempo.

Dos mitades: Considerando que un mismo test puede dar nacimiento a dos test paralelos, se puede separar los diferentes ´ıtems del test. Este criterio cobra mayor utilidad cuando la t´ecnica de separaci´on de ´ıtems es capaz de extraer dos test con las mismas caracter´ısticas estad´ısticas. Este m´etodo es indicativo de la confiabilidad interna del test.

2.1.

An´ alisis de los ´ıtems en Marco de TCT

En el marco de la TCT se calculan los siguientes estad´ısticos de las preguntas: ´ Indice de dificultad: Es el porcentaje de respuesta correcta. Claramente depende del grado de competencia en la habilidad/contenido que mide la prueba de la muestra de alumnos que la rinde. ´ Indice de discriminaci´ on: Es la correlaci´on entre el resultado en el test y el resultado en la pregunta. Seg´ un la naturaleza de las preguntas (dicot´omicas, polit´omicas, de respuesta abierta, etc.) y del resultado de la prueba, es la correlaci´ on que se usa (Pearson, Spearman, Punto biserial, Polic´orica, etc.). Para cada una de las preguntas que conforman las pruebas Simce y TIMSS se obtendr´a el ´ındice de dificultad y el ´ındice de discriminaci´ on, y para cada cuadernillo se entregar´a el alpha de Cronbach. Para efectos de reporte, y siguiendo a Ebel (1972) y Ghiselli et al. (1981), se clasificar´an14 los niveles de dificultad y discriminaci´ on seg´ un las Tablas 1 y 2.

13 Que

son independientes e id´ enticamente distribuidos la literatura, no existen en general est´ andares u ´nicos en que las preguntas de un test debieran abarcar dificultad

14 Concordando

entre los valores 0,2 y 0,7, en tanto que las discriminaciones ser superiores a 0,2.

7

Alineamiento de pruebas Simce y TIMSS de cuarto b´ asico

Tabla 1: Clasificaci´on para el par´ametro de Dificultad Par´ametro de Dificultad (D) Muy D´ıficil

D

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.