1
Capı́tulo 5: Interpretació n de las puntuaciones
5.1 Interpretación referida a normas
En la
TCT
El resultado inicial de un test es el puntaje bruto, directo u original que se obtiene por las SUMATORIA de las
respuestas correctas (en los tests de ejecución máxima) o respuestas clave (en los tests de comportamiento típico)
En la
TRI
esta puntuación original se denomina puntuación theta y se obtienen de la interacción de las respuestas del
examinado con las características de los reactivos…. A ver, se los explico... Ustedes saben que la TRI es más avanzada que la TCT
y acá la puntuación original no se obtiene simplemente SUMANDO las respuestas correctas (como en la TCT), si no que las
respuestas del examinado se compara por así decirlo también con la dificultad de los ítems, por eso no es simplemente una
SUMA, sino que se ve también POR EJEMPLO la dificultad de los ítems (al RESULTADO del examinado se relaciona con la
dificultad del test, es decir, si fue fácil o difícil dicho test.) Estas puntuaciones varían de -4 a 4
Las puntuaciones originales de un test son arbitrarias y por lo general no poseen un significado unívoco. El hecho de que las
puntuaciones originales no sean suficientes para interpretar los resultados presenta LIMITACIONES de los tests como
INSTRUMENTO DE MEDICIÓN… 2 limitaciones:
1. Carecen de 0 absoluto (es decir, no son variables PROPORCIONALES)
2. No poseen unidades de medidas constantes (es decir, no son variables INTERVALARES tampoco)
En tests q miden inteligencia o personalidad por ejemplo la estrategia q se utiliza para darle un significado a las puntuaciones
originales, es comparar éstas con las puntuaciones del grupo de referencia en la misma prueba, para realizar esta idea se
requiere de un proceso llamado estandarización (cuyo producto final se denomina BAREMO). Este proceso se desarrolla de la
siguiente manera:
a) Se selecciona una muestra representativa de la población meta (o muestra de estandarización)
b) Se administra el test a esa muestra y se registra las puntuaciones originales de los individuos
c) Transformación de las puntuaciones originales en puntuaciones derivadas (que indican la posición relativa de los puntos
directos individuales en RELACIÓN con el grupo de referencia)
Entonces, los BAREMOS:
Permiten la comparación de los resultados individuales con los de un grupo de referencia
Según la RAE: “son normas establecidas por convención para evaluar los méritos personales”
2
5.1.2 Muestra de estandarización
Para Murat (1985) quien se propone aplicar un test tiene que decidir entre:
a) Construir sus propias normas de interpretación de los puntajes (baremos)
b) Emplear baremos ya elaborados por otro investigador
Al optar por este último caso el investigador tiene que tener precaución y corroborar que los baremos estén
actualizados y que la muestra de estandarización original sea semejante a la población meta (mientras más
semejante/parecida MEJOR)
Importante a tener en cuenta:
o Las muestras de estandarización deben ser cuidadosamente definidas y claramente descritas por los constructores del
test para q el usuario pueda escoger aquellos instrumentos cuyas normas sean apropiadas para su población meta
o No debe confundirse la elaboración de un baremo con el proceso más complejo y comprensivo de adaptación de tests,
que no sólo implica poseer normas adecuadas sino replicar los estudios psicométricos esenciales del instrumento.
o Para construir baremos se debe disponer de una muestra representativa de la población que será evaluada por medio
de un test.
o La APA (1999)menciona diferentes tipos de normas (baremos) que pueden ser apropiados para el uso de un test:
Normas locales (de un determinado lugar geográfico), normas regionales y normas específicas (por ejemplo, de una
institución u ocupación)
o Cuando existen diferencias significativas en distintos grupos en relación a un tema en particular, por ejemplo, en el caso
de inventario de intereses, normalmente se presentan baremos diferenciados por cada sexo, debido a que las mujeres
y los hombres difieren significativamente en sus perfiles de intereses vocacionales
o Algunos autores recomiendan actualizar los baremos (normas) cada 5 años e inclusive antes si se presenta un cambio
significativo. La actualización periódica de los baremos es un requisito básico para la VALIDEZ de las interpretaciones de
los puntajes de test referidos a normas (APA, 1999)
5.1.3 Métodos de transformación de puntuaciones
Recordemos como vimos en el último punto c) del proceso de estandarización, hay que transformar las puntuaciones directas
(originales) en otras derivadas. Las derivadas pueden ser: a) Lineales y b) NO lineales
Transformaciones lineales:
Una transformación es lineal cuando se obtiene una nueva escala de medición que respeta las distancias entre las unidades de
medida de la escala original, es decir, un cambio en la puntuación original se corresponde directamente con el cambio de
puntuación en la escala transformada
*Las transformaciones lineales no alteran la distribución original, es decir, si esta era una distribución normal, entonces seguirá
siéndolo luego de ser transformada (acuerdensé que la distribución normal es la campana de Gauss, que es SIMÉTRICA). O si
por el contrario, la distribución presenta asimetría positiva o negativa, también se mantendrá luego de ser transformada
3
*Las transformaciones lineales más utilizadas son las puntuaciones estándar o z
Puntuación estándar (z):
Aiken (2003) señala que al transformar las puntuaciones originarias en puntajes z se obtiene una distribución que tiene la
misma forma (como vimos recientemente) pero cambia la media y la desviación estándar, acá la media de las puntuaciones de
z es igual a 0 y la desviación estándar es igual a 1. Puntaje z se calcula de la siguiente forma (TIENEN QUE SABERLO.. JAJA)
X= Equis puntaje
M= Media (promedio) de las puntuaciones del grupo de referencia
S= Desviación estándar
Este cálculo tienen que saberlo y es muy sencillo, van a tener un ejemplo como el siguiente:
Media del 1° parcial de X materia: 6,54 (este lo pueden ver como = 6,54 o M= 6,54)
Desviación estándar: s= 1,30
Entonces teniendo la Media y la S ustedes calculan el puntaje de X persona, ejemplos:
Juanito sacó un 6 en el parcial, cuál es su puntaje Z? entonces:
Z= (6 - 6,54) / 1,30 = -0,41
Pepito sacó un 10 (wow) en el parcial, entonces:
Z= (10 – 6,54) / 1,30 = 2,66
Dijimos justo abajo del título “Puntuación estándar (z)” que en el caso de las puntuaciones de Z, el promedio (la media) es igual
a 0… y fijensé que Juanito que estuvo MUY cerca del promedio y POR DEBAJO (sacó 6 y el promedio era de 6,54) .. le da una
puntuación MUY cerca del 0 y NEGATIVO por estar abajo del promedio
Y Pepito le da puntuación z positiva (2,66) y mucho más alejada del promedio (que sería puntaje z = 0) porque claro, él se sacó
10, está muy por encima del promedio (6,54)
Luego a continuación en el libro te cuenta que debido a que las puntuaciones z tienen resultados negativos y con decimales,
suele presentar dificultades y entonces se suele proceder a una segunda transformación lineal (repasen del libro, pág 144) y
luego te comenta que otro Autor (HOGAN, 2004) planteó una fórmula alternativa para no tener q realizar una segunda
transformación y que entonces sea directamente una transformación (pág 145) … No explayo esto en el resumen porque no me
parece muy relevante y está clarísimo en el libro, no creo que les hagan hacer estos cálculos porque son bastante largos y
complejos, pero si el cálculo de puntaje z que les nombré antes siiiiiii eso SIIIIIIIIII. Jaj.. sigamos.. y por las dudas obvio, como
debe ser, tienen que estudiar del libro! Esto es una ayuda nada más..!! bueno, sigamos :D
4
Los inventarios de personalidad frecuentemente utilizan M= 50 y S= 10 (APRENDAN ESTO) [son puntuaciones T]
Los tests de inteligencia generalmente utilizan M= 100 y S= 15 (APRENDAN ESTO TMB
)
También importantísimo:
En las escalas de inteligencia de Wechsler (WAIS y WISC) como ya dijimos la media= 100 y la S= 15. Tienen que entender que si
alguien hace ese puntaje de inteligencia y le da 100 entonces el sujeto tiene una inteligencia PROMEDIO (como el de la mayoría
de las personas)… también tienen que entender que si la persona tiene 115 en ese puntaje entonces tiene 1 DESVIACIÓN
ESTANDAR POR ARRIBA DEL PROMEDIO (recuerden, s=15) y si saca puntaje 130, entonces tiene 2 desviaciones estándar por
encima del promedio…… y si saca como puntaje 85 ¿??? Bien ¡! 1 desviación estándar por abajo del promedio (espero q hayan
respondido bien jaj)
Algo más.. si decimos que tal cantidad o % de personas obtienen entre 85 – 115 entonces corresponde a 1 desviación estándar
por encima y por debajo de la media) y si decimos entre 70 – 130 entonces 2 desviaciones estándar en ambas direcciones.
Transformaciones NO lineales:
A diferencia de las lineales, estas asumen una distribución a priori (distribución normal, por ejemplo) que altera la forma de la
distribución de los puntajes originales. Además, estas puntuaciones no pueden ser sumadas, promediadas o correlacionadas,
puesto que NO respetan las diferencias entre INTERVALOS de las escalas de medida original (ES DECIR, QUE NI SI QUIERA
TIENEN UN NIVEL INTERVALAR, o sea, tienen nivel nominal u ordinal)
Las más usadas son:
a) Percentiles (P)
b) Las puntuaciones estándar normalizadas (zn)
Percentiles (P):
Indican un % de personas que queda por debajo de una puntuación original determinada.
Ejemplo1: Si el 30% de los individuos obtuvo un puntaje igual o inferior a 50 en un test, entonces le corresponderá un percentil
30 (P
30
)… Acá el 50, es un puntaje original, podría ser cualquier otro.
Ejemplo2: Si el 80% de los individuos obtuvo un puntaje igual o inferior a 90 en un test, entonces le corresponderá P
80
… Acá el
90 es un puntaje original
Ejemplo3: Si vemos un P
25
, entonces quiere decir que el 25% de personas obtuvieron X puntaje o menos (el puntaje te lo van a
dar como en el ejemplo 1 o 2)
Recuerden relacionar PERCENTIL con PORCENTAJE, recuerden que PERCEN es como PORCEN(taje). Revisen su fórmula del libro
(obvio no se la van a hacer sacar, pero si interpretar como los ejemplos que les di)
Importante Un percentil es un punto en la escala de medición ORIGINARIA que DIVIDE el total de observaciones en DOS
partes. Entonces, en el ejemplo1 el percentil 30 (P
30
) dejaría por debajo el 30% de los casos de la muestra de estandarización y
por encima quedaría el 70% restante. En el ejemplo2, el P
80
dejaría por debajo al 80% de los casos y por encima al 20% restante
Importante Con los percentiles se cuenta desde abajo, de modo que un percentil más bajo corresponde una posición más
baja del individuo en el test. APRENDAN LO SIGUIENTE SI O SI El percentil 50 (P
50
) corresponde a la MEDIANA (no se
confundan con media q es el promedio). El P
25
se corresponde con el primer cuartil (Q
1
). El P
75
se corresponde con el tercer
5
cuartil (Q
3
)….. Q1 y Q3 suelen utilizarse como puntos de corte para indicar la magnitud relativamente elevada y baja de un
atributo determinado, obvio Q1 bajo y Q3 alto
Puntuación estándar normalizada (zn):
Para facilitar la comparación de diferentes puntuaciones transformadas (puntaje z con percentiles, por ejemplo), se suele
recurrir a transformaciones no lineales que modifican la forma de distribución de las puntuaciones originales, convirtiéndolos
en una distribución normal.
Es muy importante la distribución normal, porque permite estimar las probabilidades de ocurrencia (recuerden q es la campana
de gauss y el promedio coincide con la parte más alta de la campana y alejándonos del promedio con los extremos de la
campana, recuerden es mucho más probable por ej. encontrar personas que midan 1,70 de altura que encontrar personas que
se alejen del promedio (como ser, 2 metros)…. Por eso es importante la distribución normal, nos permite estimar las
probabilidades de ocurrencia (siempre va a ser más probable encontrar algo más cercano al promedio que lejos de él, mientras
más se aleje del promedio más difícil será su ocurrencia)
El procedimiento empleado en este tipo de transformaciones no lineales se denomina normalización y las puntuaciones
obtenidas reciben el nombre de puntuación estándar normalizada. Un ejemplo de este tipo son las puntuaciones “T” (en honor
a Terman) donde M=50 y S=10, y las puntuaciones estaninas con M=5 y S=2 (las unidades de estas puntuaciones van de 1 a 9).
Una dificultad de las estaninas es que el uso de un solo dígito puede sugerir diferencias significativas entre dos individuos
cuando estas diferencias no son reales
(aprendan todo ese párrafo XD)
*También tiene un procedimiento pero no me parece muy importante (ni siquiera tienen q hacerlo ustedes, son puros cálculos)
*Revisenló del libro por las dudas
De hecho, confirmando el primer asterisco, dice el libro:
“En la actualizad, todos los cálculos requeridos para construir baremos se realizan por medio de programas estadísticas
computarizados”
5.2 Otros métodos de interpretación de puntuaciones
Puntuaciones Ipsativas:
Estos puntajes se obtienen en tests que utilizan un formato de ítems de elección forzada donde el examinado debe seleccionar
una opción de respuestas entre varias alternativas. Los ítems se califican de manera tal que la elección de una de las opciones
produce un incremento de la puntuación de una escala o dimensión medida y al mismo tiempo una disminución en el puntaje
de otra de las escalas o dimensiones del test. Por consiguiente, este tipo de puntuaciones muestra la fuerza “relativa” de las
puntuaciones en lugar de la fuerza “absoluta” de las mismas. Se suele utilizar para medir intereses vocacionales (APRENDAN
ESTOOOO, RECUERDEN!).
6
Suelen ser ítems en donde por ejemplo tenés q mostrar agrado, desagrado o indiferencia hacia algo, como por ejemplo “me
gusta hacer cálculos matemáticos” y entre las opciones: Desagrado, Agrado, Indiferencia (ESTE ES EL FORMATO B)
Y otro ejemplo que suele ser el más característico de puntuación ipsativa (ya q tiene elección forzada) es donde por ejemplo
tenés q elegir una entre cada cual de las siguientes dos opciones:
FORMATO A (el más usado en Ipsativas)
a. Resolver ecuaciones matemáticas
a. Tocar un instrumento musical
b. Aprender estilos de pintura artística
b. Hacer cálculos numéricos
Tenés q elegir una a y una b y no es posible elegir o rechazar ambas entonces se ve lo que dijimos antes : “Los ítems se
califican de manera tal que la elección de una de las opciones produce un incremento de la puntuación de una escala o
dimensión medida y al mismo tiempo una disminución en el puntaje de otra de las escalas o dimensiones del test.”
Test de puntuaciones Ipsativas: Registro de Preferencias Kuder
Limitaciones:
Obstaculiza la aplicación de algunos estadísticos usuales en psicometría debido a la falta de independencia de sus ítems
Estos ítems de elección forzada despiertan resistencia en muchos individuos.
Interpretación referida a criterio:
Como habíamos dicho al principio del capítulo que las puntuaciones originales de un test carecen de un significado unívoco,
normalmente se interpretan comparándolas con un grupo de referencia (ya vimos, se usaban baremos para esto, puntaje z).
Entonces, una forma alternativa de interpretación de las puntuaciones consiste en COMPARARLAS con un criterio de logro u
objetivo a alcanzar, previamente especificado.
Ejemplo1:
Si consideramos que un criterio de desempeño es responder al menos 14 preguntas correctas de las 20 de una prueba de
conocimiento en literatura, 14 sería el estándar con el cual comparar los aciertos obtenidos por un individuo en ese test de
rendimiento
Ejemplo2:
En otro ejemplo, alguien puede hacer muy bien todas las pruebas de conducir, pero aunque su puntaje le de 100% de aciertos,
no es buen candidato para recibir el carnet de conducir si pasa los semáforos en rojo.
Estos tests presuponen que existe un área específica o dominio de conocimiento o habilidad que puede ser claramente definido
y delimitado. Una prueba referida a criterio es aquella que deliberadamente se construye para conducir a medidas
directamente interpretables en términos de pautas específicas de desempeño, las cuales se determinan definiendo una clase o
dominio de tareas que el individuo debe realizar.
Los tests referidos a criterio se desarrollaron a comienzos del siglo XX. Sin embargo fue abandonado durante el período
comprendido entre las dos guerras mundiales (1914-1945). Recién en los años 70 se comenzó a aplicar sistemáticamente este
tipo de pruebas, en particular en la evaluación educativa
Los tests referidos a NORMAS sugieren más bien CUÁNTO han aprendido los individuos pero no esclarecen adecuadamente qué
han aprendido. En cambio, las pruebas con referencia a CRITERIO informan la posición absoluta de un sujeto en relación con el
dominio conductual definido explícitamente
TP TECNICAS.pdf
browser_emoji Estamos procesando este archivo...
browser_emoji Lamentablemente la previsualización de este archivo no está disponible. De todas maneras puedes descargarlo y ver si te es útil.
Descargar
. . . . .