
de pruebas. Las personas evaluadas enfocan una situación de evaluacion de diferentes formas y los administradores deben
ser sensibles a la diversidad de respuestas posibles ante una situación de prueba.
Evaluación de la calidad de las pruebas: confiabilidad y validez
Existen criterios técnicos que usan los profesionales al evaluar para estimar la solidez psicométrica de los instrumentos. La
psicometría como ciencia de la medición psicológica estudia la confiabilidad y la validez de las pruebas.
Confiabilidad: Una prueba es confiable cuando es consistente y precisa. Las pruebas psicológicas son confiables en grados
diversos. En el dominio de las mediciones comportamentales, la variabilidad es mucho mayor dada las características del
objeto epistémico y de los instrumentos de medición utilizados. Las diferencias en el desempeño de un sujeto pueden estar
causadas por diversas razones. Por ello, los puntajes de una persona no serán perfectamente consistentes de una ocasión a
la otra, y se dice que esa medición contiene cierta cantidad de error. Es decir, el puntaje obtenido es el resultado de la
suma del resultado real y un margen de error. Estos errores pueden ser aleatorios, pero también sistemáticos. Los errores
sistemáticos pueden: afectar a todas las observaciones por igual y ser un error constante, afectar a cierto tipo de
observaciones de manera muy diferente que a otras y ser un sesgo. El error aleatorio, en cambio, es difícil de predecir y
controlar porque está relacionado a factores causales.
La confiabilidad es la proporción de la varianza total atribuida a la varianza verdadera (diferencias reales). Entre mayor es la
proporción de la varianza total atribuida a la varianza verdadera, mas confiable es la prueba. Debido a que se supone que
las diferencias reales son estables, se presume que producen puntuaciones consistentes en aplicaciones repetidas de la
misma prueba al igual que en formas equivalentes de esta. Debido a que la varianza de error puede incrementar o
disminuir en cantidades variables una puntuación de alguna prueba, se vería afectada la consistencia en la puntuación y
por tanto en la confiabilidad.
Fuentes de varianza de error:
Construcción de pruebas: una fuente de varianza durante la construcción de pruebas es el muestreo de reactivos, es decir
la variación entre reactivos contenidos en una prueba, o de diversas pruebas. Refiere a la forma en que se redactan los
reactivos, el contenido usado como muestra, y el grado de puntuación obtenido también tiene que ver con la forma en que
es manejado tal contenido de la prueba. El creador de pruebas debe maximizar la proporción de la varianza verdadera y
minimizar la proporción de la varianza error.
Administración de pruebas: refieren a la atención o motivación de quien responde la prueba y sus reacciones al respecto.
También operan influencias desfavorables con relación al ambiente, como la iluminación y el ruido. Otra de las fuentes
incluye las variables del examinado, como problemas emocionales, carencia de descanso o incomodidad física. Así también
existen variables relacionadas al examinador, donde la apariencia física y el comportamiento son factores para considerar.
Calificación e interpretación de pruebas: el advenimiento de la calificación computarizada y una creciente dependencia de
reactivos objetivos calificables por computadora han eliminado la varianza de error causada por diferencias de los
evaluadores en muchas pruebas, sin embargo, las pruebas administradas de forma individual requieren una calificación
manual. Las personas que califican y los sistemas de calificación son fuentes potenciales de la varianza error. Incluso si son
calificadas por una computadora, existe la posibilidad de una falla técnica. O bien podría caer sobre el calificador si
entromete su subjetividad.
Tipos de confiabilidad:
Test-retest: es una estimación de la confiabilidad obtenida al correlacionar pares de puntuaciones de las mismas personas
en dos aplicaciones diferentes de la misma prueba. Es apropiada cuando se valora la confiabilidad de una prueba que
pretende medir algo relativamente estable a lo largo del tiempo, como un rasgo de personalidad.
El paso del tiempo puede ser una causa de la varianza de error. Entre mas tiempo pase, es mas probable que el coeficiente
de confiabilidad sea menor. Cuando el intervalo entre las pruebas es mayor a seis meses, se hace referencia a la estimación
de la confiabilidad test-retest como coeficiente de estabilidad.
Formas paralelas: son dos formas de una prueba que se construyen para ser iguales. La obtención de las estimaciones de
confiabilidad de las formas paralelas: requiere dos aplicaciones de la prueba con el mismo grupo, y las puntuaciones
obtenidas pueden ser afectadas por factores como la motivación, la fatiga o eventos que intervienen en el manejo personal
como la práctica, el aprendizaje o la terapia.
División en mitades: se obtiene correlacionando dos pares de puntuaciones obtenidas de mitades equivalentes de una sola
prueba aplicada una sola vez. Es una útil medida de confiabilidad cuando es indeseable evaluar la confiabilidad con dos
pruebas o hacer dos aplicaciones de una misma prueba (x tiempo o costo). El calculo de un coeficiente de confiabilidad de
dividir en mitades implica 3 pasos:
-dividir la prueba en mitades equivalentes
-calcular una r de Pearson entre las puntuaciones en las dos mitades de la prueba
-ajustar la confiabilidad de una mitad de la prueba usando la fórmula de spearman-brown (para estimar la confiabilidad de
una prueba que se ha alargado o acortado en cuanto a reactivos)
Consistencia interna: además de la formula spearman-brown hay otros métodos para estimar la confiabilidad de la
consistencia interna como la KR (para determinar la consistencia entre reactivos dicotómicos).