miércoles, 17 de noviembre de 2021

¿Psicometría o Edumetría?

 Por Enrique Navarro Asencio[i]

Editor Jefe de Bordón. Revista de Pedagogía

Universidad Complutense de Madrid

Una de las cuestiones que llamó mi atención en mi formación sobre construcción de instrumentos de medición educativa es la dificultad para diferenciar este campo de estudio de la psicometría. Para formarte en Medición Educativa lo habitual es consultar manuales de psicometría y aplicar los conocimientos al proceso de medida de variables educativas. Entonces ¿hablamos de psicometría cuando tratamos de medir variables del contexto educativo como, por ejemplo, el rendimiento académico?

En la definición de psicometría del Cambridge Dictionary of Statistics se hace referencia al estudio de la medida de variables psicológicas o educativas como rasgos de personalidad, conocimiento, aptitudes, habilidades o rendimiento (Everitt, 2010). En el panorama nacional, Martínez-Arias (2005) titula el primer punto de su manual de psicométrica “la medida en psicología y educación” (p.15). Otras definiciones, como la de Abad et. al (2011) o la Meneses (2013), la asocian el a la medida de fenómenos o características psicológicas y el uso de test.

El uso del término psicometría se ha extendido y se emplea para tratar cualquier medida de características latentes más allá del ámbito de la psicología o la educación. Es decir, variables que no son directamente observables, como, por ejemplo, la satisfacción con un servicio o la calidad de un vino. De forma general, se asocia con esa medición de rasgos no observables y, para conseguir la medida, recoge información de indicadores relacionados con ese rasgo, así lo indican Wu, et al. (2016) en su manual Educational Measurement for Applied Researchers.

Hubo cierto debate hace más de 30 años en torno al uso del término edumetría para referirse a la medición educativa. Carver (1972, 1974) propuso la diferenciación entre estas dos formas de medición. Argumentó que, mientras que el modelo psicométrico estudia las diferencias entre individuos en algún rasgo psicológico, el modelo edumétrico centra la atención en medir la evolución de cada individuo, su ganancia en rendimiento, conocimiento o competencias educativas. Es decir, el logro depende de los contenidos específicos (por ejemplo, se ha aprendido o no el concepto de sumar o restar en matemáticas). El autor diferencia entre los test cuyas puntuaciones se establecen de forma normativa, que serían psicométricos, y los que las determinan con referencias criteriales, que serían edumétricos. De esta forma, criticaba el uso de la Teoría Clásica de los Test en la construcción de este tipo de instrumentos, principalmente para establecer puntuaciones, seleccionar ítems o los índices de fiabilidad. Y reivindicaba así una metodología propia asociada a la construcción de puntuaciones criteriales y el establecimiento de estándares de dominio, y también para estudiar la fiabilidad a partir del análisis del acuerdo en decisiones de clasificación, por ejemplo, lograr o no un estándar determinado.

Haladyna (1975) respondió a esta crítica apuntando que, aunque las puntuaciones con carácter normativo que se consiguen desde la aproximación de la Teoría Clásica de los Test ordenan a los sujetos para compararlos entre ellos, también son un reflejo de la puntuación verdadera. Argumentó, además, que los ítems de un test psicométrico son una representación de los indicadores vinculados a la definición del rasgo. Por tanto, la diferencia solo puede estar en el propósito para el que fue construido el test y, en este sentido, señala:

If one wishes to select, place, or group students on the basis of test scores, the test use is psychometric; if one wishes to ascertain student performance with respect to the passing standard, the test use is edumetric. Few will disagree with the importance and salience of the edumetric dimension for classroom evaluation (p. 604).

El propósito del test edumétrico es medir variables relacionadas con el logro académico para analizar los cambios en el aprendizaje a partir referencias elaboradas como criterios absolutos de logro de esos contenidos. El concepto de Test Referido al Criterio, como señala Martínez-Arias, et al. (2005), lo acuñó Glaser en 1963 y, aunque emplean metodología, por ejemplo en el proceso de definición de estándares y los puntos de corte entre niveles (Hambleton et al., 2000; Jornet et al., 2009), los modelos de medida basados en la Teoría Respuesta al Ítem también pueden utilizarse en la construcción de test con los dos propósitos ya que permiten establecer niveles de logro al situar ítems y constructo en una escala común. Además, permiten diseñar pruebas con ítems de respuesta sugerida y otros de respuesta construida que deben ser valorados por un corrector o codificadores.

Esta diferenciación entre propósito del test, como ha quedado patente, puede derivar en estrategias distintas al construir el test y la escala de medida, así como en el proceso de validación. Y, por tanto, sirve como ejemplo, de la variedad de cuestiones metodológicas que se deben considerar durante el proceso de medida.

Además del propósito del test y el tipo de referencias utilizadas para baremar la escala de puntuaciones, hay otros aspectos que determinan la metodología más adecuada. Otro factor es el constructo o aspecto del comportamiento que mide el test. Lo habitual es diferenciar entre test que miden rasgos cognitivos, también los de aptitudes, inteligencia, rendimiento académico, etc., y los que miden otros aspectos relacionados con intereses, actitudes, personalidad, motivación, etc.

Y vinculado a lo anterior, el tratamiento de la respuesta los ítems que componen el test también es un elemento diferenciador. Encontramos los test de ejecución máxima (los ítems tienen respuesta correcta, que puede tener formato de acierto o error o algunos grados de corrección) como los test para medir constructos cognitivos y de rendimiento o competencias; y los de ejecución típica (las respuestas señalan el nivel de preferencia respecto a la situación o estimulo que propone el ítem), como los test de personalidad o actitudes.

Referencias bibliográficas:

Abad, F.J., Olea, J., Ponsoda, V. y García, C. (2011). Medición en ciencias sociales y de la salud. Editorial Síntestis.

Carver, R. P. (1972). Reading tests in 1970 versus 1980: Psychometric versus edumetric. The Reading Teacher, 26(3), 299-302.

Carver, R. P. (1974). Two dimensions of tests: Psychometric and edumetric. American Psychologist, 29(7), 512.

Everitt, B. S. (2010). Cambridge dictionary of statistics (3.ª ed.). Cambridge University Press.

Haladyna, T. M. (1975). On the psychometric-edumetric dimensions of tests. American Psychologist30(5), 603–604. https://doi.org/10.1037/0003-066x.30.5.603

Hambleton, R. K., Jaeger, R. M., Plake, B. S., & Mills, C. (2000). Setting performance standards on complex educational assessments. Applied Psychological Measurement24(4), 355–366. https://doi.org/10.1177/01466210022031804

Jornet, J. M. y González, J. (2009). Evaluación criterial: determinación de estándares de interpretación (EE) para pruebas de rendimiento educativo. Estudios sobre Educación, 16, 103-123.

Martínez-Arias, R. (2005). Psicometría: Teoría de los tests psicológicos y educativos. Alianza Editorial.

Meneses, J. (coord.). (2013). Psicometría. UOC.

Wu, M., Tam, H. P. y Jen, T. H. (2016). Educational Measurement for Applied Researchers. Theory into Practice. Springer.

Cómo citar esta entrada:

Navarro Asencio, E. (2021). ¿Psicometría o Edumetría? Aula Magna 2.0. [Blog]. https://cuedespyd.hypotheses.org/9553

Tomado de Aula Magna 2.0. [Blog]. https://cuedespyd.hypotheses.org/9553 con permiso de los editores

No hay comentarios: