Resumen Tecnicas | Tecnicas Psicométricas | Psicología UNC |

Volver a Tecnicas Psicométricas

Capı́tulo 5: Interpretació n de las puntuaciones

5.1 Interpretación referida a normas

En la

TCT

 El resultado inicial de un test es el puntaje bruto, directo u original que se obtiene por las SUMATORIA de las

respuestas correctas (en los tests de ejecución máxima) o respuestas clave (en los tests de comportamiento típico)

En la

TRI

 esta puntuación original se denomina puntuación theta y se obtienen de la interacción de las respuestas del

examinado con las características de los reactivos…. A ver, se los explico... Ustedes saben que la TRI es más avanzada que la TCT

y acá la puntuación original no se obtiene simplemente SUMANDO las respuestas correctas (como en la TCT), si no que las

respuestas del examinado se compara por así decirlo también con la dificultad de los ítems, por eso no es simplemente una

SUMA, sino que se ve también POR EJEMPLO la dificultad de los ítems (al RESULTADO del examinado se relaciona con la

dificultad del test, es decir, si fue fácil o difícil dicho test.) Estas puntuaciones varían de -4 a 4

Las puntuaciones originales de un test son arbitrarias y por lo general no poseen un significado unívoco. El hecho de que las

puntuaciones originales no sean suficientes para interpretar los resultados presenta LIMITACIONES de los tests como

INSTRUMENTO DE MEDICIÓN… 2 limitaciones:

1. Carecen de 0 absoluto (es decir, no son variables PROPORCIONALES)

2. No poseen unidades de medidas constantes (es decir, no son variables INTERVALARES tampoco)

En tests q miden inteligencia o personalidad por ejemplo la estrategia q se utiliza para darle un significado a las puntuaciones

originales, es comparar éstas con las puntuaciones del grupo de referencia en la misma prueba, para realizar esta idea se

requiere de un proceso llamado estandarización (cuyo producto final se denomina BAREMO). Este proceso se desarrolla de la

siguiente manera:

a) Se selecciona una muestra representativa de la población meta (o muestra de estandarización)

b) Se administra el test a esa muestra y se registra las puntuaciones originales de los individuos

c) Transformación de las puntuaciones originales en puntuaciones derivadas (que indican la posición relativa de los puntos

directos individuales en RELACIÓN con el grupo de referencia)

Entonces, los BAREMOS:

• Permiten la comparación de los resultados individuales con los de un grupo de referencia

• Según la RAE: “son normas establecidas por convención para evaluar los méritos personales”

5.1.2 Muestra de estandarización

Para Murat (1985) quien se propone aplicar un test tiene que decidir entre:

a) Construir sus propias normas de interpretación de los puntajes (baremos)

b) Emplear baremos ya elaborados por otro investigador

Al optar por este último caso el investigador tiene que tener precaución y corroborar que los baremos estén

actualizados y que la muestra de estandarización original sea semejante a la población meta (mientras más

semejante/parecida MEJOR)

Importante a tener en cuenta:

o Las muestras de estandarización deben ser cuidadosamente definidas y claramente descritas por los constructores del

test para q el usuario pueda escoger aquellos instrumentos cuyas normas sean apropiadas para su población meta

o No debe confundirse la elaboración de un baremo con el proceso más complejo y comprensivo de adaptación de tests,

que no sólo implica poseer normas adecuadas sino replicar los estudios psicométricos esenciales del instrumento.

o Para construir baremos se debe disponer de una muestra representativa de la población que será evaluada por medio

de un test.

o La APA (1999)menciona diferentes tipos de normas (baremos) que pueden ser apropiados para el uso de un test:

Normas locales (de un determinado lugar geográfico), normas regionales y normas específicas (por ejemplo, de una

institución u ocupación)

o Cuando existen diferencias significativas en distintos grupos en relación a un tema en particular, por ejemplo, en el caso

de inventario de intereses, normalmente se presentan baremos diferenciados por cada sexo, debido a que las mujeres

y los hombres difieren significativamente en sus perfiles de intereses vocacionales

o Algunos autores recomiendan actualizar los baremos (normas) cada 5 años e inclusive antes si se presenta un cambio

significativo. La actualización periódica de los baremos es un requisito básico para la VALIDEZ de las interpretaciones de

los puntajes de test referidos a normas (APA, 1999)

5.1.3 Métodos de transformación de puntuaciones

Recordemos como vimos en el último punto c) del proceso de estandarización, hay que transformar las puntuaciones directas

(originales) en otras derivadas. Las derivadas pueden ser: a) Lineales y b) NO lineales

Transformaciones lineales:

Una transformación es lineal cuando se obtiene una nueva escala de medición que respeta las distancias entre las unidades de

medida de la escala original, es decir, un cambio en la puntuación original se corresponde directamente con el cambio de

puntuación en la escala transformada

*Las transformaciones lineales no alteran la distribución original, es decir, si esta era una distribución normal, entonces seguirá

siéndolo luego de ser transformada (acuerdensé que la distribución normal es la campana de Gauss, que es SIMÉTRICA). O si

por el contrario, la distribución presenta asimetría positiva o negativa, también se mantendrá luego de ser transformada

*Las transformaciones lineales más utilizadas son las puntuaciones estándar o z

Puntuación estándar (z):

Aiken (2003) señala que al transformar las puntuaciones originarias en puntajes z se obtiene una distribución que tiene la

misma forma (como vimos recientemente) pero cambia la media y la desviación estándar, acá la media de las puntuaciones de

z es igual a 0 y la desviación estándar es igual a 1. Puntaje z se calcula de la siguiente forma (TIENEN QUE SABERLO.. JAJA)

X= Equis puntaje

M= Media (promedio) de las puntuaciones del grupo de referencia

S= Desviación estándar

Este cálculo tienen que saberlo y es muy sencillo, van a tener un ejemplo como el siguiente:

Media del 1° parcial de X materia: 6,54 (este lo pueden ver como = 6,54 o M= 6,54)

Desviación estándar: s= 1,30

Entonces teniendo la Media y la S ustedes calculan el puntaje de X persona, ejemplos:

Juanito sacó un 6 en el parcial, cuál es su puntaje Z? entonces:

Z= (6 - 6,54) / 1,30 = -0,41

Pepito sacó un 10 (wow) en el parcial, entonces:

Z= (10 – 6,54) / 1,30 = 2,66

Dijimos justo abajo del título “Puntuación estándar (z)” que en el caso de las puntuaciones de Z, el promedio (la media) es igual

a 0… y fijensé que Juanito que estuvo MUY cerca del promedio y POR DEBAJO (sacó 6 y el promedio era de 6,54) .. le da una

puntuación MUY cerca del 0 y NEGATIVO por estar abajo del promedio

Y Pepito le da puntuación z positiva (2,66) y mucho más alejada del promedio (que sería puntaje z = 0) porque claro, él se sacó

10, está muy por encima del promedio (6,54)

Luego a continuación en el libro te cuenta que debido a que las puntuaciones z tienen resultados negativos y con decimales,

suele presentar dificultades y entonces se suele proceder a una segunda transformación lineal (repasen del libro, pág 144) y

luego te comenta que otro Autor (HOGAN, 2004) planteó una fórmula alternativa para no tener q realizar una segunda

transformación y que entonces sea directamente una transformación (pág 145) … No explayo esto en el resumen porque no me

parece muy relevante y está clarísimo en el libro, no creo que les hagan hacer estos cálculos porque son bastante largos y

complejos, pero si el cálculo de puntaje z que les nombré antes siiiiiii eso SIIIIIIIIII. Jaj.. sigamos.. y por las dudas obvio, como

debe ser, tienen que estudiar del libro! Esto es una ayuda nada más..!! bueno, sigamos :D

Los inventarios de personalidad frecuentemente utilizan M= 50 y S= 10 (APRENDAN ESTO) [son puntuaciones T]

Los tests de inteligencia generalmente utilizan M= 100 y S= 15 (APRENDAN ESTO TMB ☺

☺☺

☺)

También importantísimo:

En las escalas de inteligencia de Wechsler (WAIS y WISC) como ya dijimos la media= 100 y la S= 15. Tienen que entender que si

alguien hace ese puntaje de inteligencia y le da 100 entonces el sujeto tiene una inteligencia PROMEDIO (como el de la mayoría

de las personas)… también tienen que entender que si la persona tiene 115 en ese puntaje entonces tiene 1 DESVIACIÓN

ESTANDAR POR ARRIBA DEL PROMEDIO (recuerden, s=15) y si saca puntaje 130, entonces tiene 2 desviaciones estándar por

encima del promedio…… y si saca como puntaje 85 ¿??? Bien ¡! 1 desviación estándar por abajo del promedio (espero q hayan

respondido bien jaj)

Algo más.. si decimos que tal cantidad o % de personas obtienen entre 85 – 115 entonces corresponde a 1 desviación estándar

por encima y por debajo de la media) y si decimos entre 70 – 130 entonces 2 desviaciones estándar en ambas direcciones.

Transformaciones NO lineales:

A diferencia de las lineales, estas asumen una distribución a priori (distribución normal, por ejemplo) que altera la forma de la

distribución de los puntajes originales. Además, estas puntuaciones no pueden ser sumadas, promediadas o correlacionadas,

puesto que NO respetan las diferencias entre INTERVALOS de las escalas de medida original (ES DECIR, QUE NI SI QUIERA

TIENEN UN NIVEL INTERVALAR, o sea, tienen nivel nominal u ordinal)

Las más usadas son:

a) Percentiles (P)

b) Las puntuaciones estándar normalizadas (zn)

Percentiles (P):

Indican un % de personas que queda por debajo de una puntuación original determinada.

Ejemplo1: Si el 30% de los individuos obtuvo un puntaje igual o inferior a 50 en un test, entonces le corresponderá un percentil

30 (P

)… Acá el 50, es un puntaje original, podría ser cualquier otro.

Ejemplo2: Si el 80% de los individuos obtuvo un puntaje igual o inferior a 90 en un test, entonces le corresponderá P

… Acá el

90 es un puntaje original

Ejemplo3: Si vemos un P

, entonces quiere decir que el 25% de personas obtuvieron X puntaje o menos (el puntaje te lo van a

dar como en el ejemplo 1 o 2)

Recuerden relacionar PERCENTIL con PORCENTAJE, recuerden que PERCEN es como PORCEN(taje). Revisen su fórmula del libro

(obvio no se la van a hacer sacar, pero si interpretar como los ejemplos que les di)

Importante Un percentil es un punto en la escala de medición ORIGINARIA que DIVIDE el total de observaciones en DOS

partes. Entonces, en el ejemplo1 el percentil 30 (P

) dejaría por debajo el 30% de los casos de la muestra de estandarización y

por encima quedaría el 70% restante. En el ejemplo2, el P

dejaría por debajo al 80% de los casos y por encima al 20% restante

Importante Con los percentiles se cuenta desde abajo, de modo que un percentil más bajo corresponde una posición más

baja del individuo en el test. APRENDAN LO SIGUIENTE SI O SI  El percentil 50 (P

) corresponde a la MEDIANA (no se

confundan con media q es el promedio). El P

se corresponde con el primer cuartil (Q

). El P

se corresponde con el tercer

cuartil (Q

)….. Q1 y Q3 suelen utilizarse como puntos de corte para indicar la magnitud relativamente elevada y baja de un

atributo determinado, obvio Q1 bajo y Q3 alto

Puntuación estándar normalizada (zn):

Para facilitar la comparación de diferentes puntuaciones transformadas (puntaje z con percentiles, por ejemplo), se suele

recurrir a transformaciones no lineales que modifican la forma de distribución de las puntuaciones originales, convirtiéndolos

en una distribución normal.

Es muy importante la distribución normal, porque permite estimar las probabilidades de ocurrencia (recuerden q es la campana

de gauss y el promedio coincide con la parte más alta de la campana y alejándonos del promedio con los extremos de la

campana, recuerden es mucho más probable por ej. encontrar personas que midan 1,70 de altura que encontrar personas que

se alejen del promedio (como ser, 2 metros)…. Por eso es importante la distribución normal, nos permite estimar las

probabilidades de ocurrencia (siempre va a ser más probable encontrar algo más cercano al promedio que lejos de él, mientras

más se aleje del promedio más difícil será su ocurrencia)

El procedimiento empleado en este tipo de transformaciones no lineales se denomina normalización y las puntuaciones

obtenidas reciben el nombre de puntuación estándar normalizada. Un ejemplo de este tipo son las puntuaciones “T” (en honor

a Terman) donde M=50 y S=10, y las puntuaciones estaninas con M=5 y S=2 (las unidades de estas puntuaciones van de 1 a 9).

Una dificultad de las estaninas es que el uso de un solo dígito puede sugerir diferencias significativas entre dos individuos

cuando estas diferencias no son reales

(aprendan todo ese párrafo XD)

*También tiene un procedimiento pero no me parece muy importante (ni siquiera tienen q hacerlo ustedes, son puros cálculos)

*Revisenló del libro por las dudas ☺

De hecho, confirmando el primer asterisco, dice el libro:

“En la actualizad, todos los cálculos requeridos para construir baremos se realizan por medio de programas estadísticas

computarizados”

5.2 Otros métodos de interpretación de puntuaciones

Puntuaciones Ipsativas:

Estos puntajes se obtienen en tests que utilizan un formato de ítems de elección forzada donde el examinado debe seleccionar

una opción de respuestas entre varias alternativas. Los ítems se califican de manera tal que la elección de una de las opciones

produce un incremento de la puntuación de una escala o dimensión medida y al mismo tiempo una disminución en el puntaje

de otra de las escalas o dimensiones del test. Por consiguiente, este tipo de puntuaciones muestra la fuerza “relativa” de las

puntuaciones en lugar de la fuerza “absoluta” de las mismas. Se suele utilizar para medir intereses vocacionales (APRENDAN

ESTOOOO, RECUERDEN!).

Suelen ser ítems en donde por ejemplo tenés q mostrar agrado, desagrado o indiferencia hacia algo, como por ejemplo “me

gusta hacer cálculos matemáticos” y entre las opciones: Desagrado, Agrado, Indiferencia (ESTE ES EL FORMATO B)

Y otro ejemplo que suele ser el más característico de puntuación ipsativa (ya q tiene elección forzada) es donde por ejemplo

tenés q elegir una entre cada cual de las siguientes dos opciones:

FORMATO A (el más usado en Ipsativas)

a. Resolver ecuaciones matemáticas

a. Tocar un instrumento musical

b. Aprender estilos de pintura artística

b. Hacer cálculos numéricos

Tenés q elegir una a y una b y no es posible elegir o rechazar ambas entonces se ve lo que dijimos antes : “Los ítems se

califican de manera tal que la elección de una de las opciones produce un incremento de la puntuación de una escala o

dimensión medida y al mismo tiempo una disminución en el puntaje de otra de las escalas o dimensiones del test.”

Test de puntuaciones Ipsativas: Registro de Preferencias Kuder

Limitaciones:

 Obstaculiza la aplicación de algunos estadísticos usuales en psicometría debido a la falta de independencia de sus ítems

 Estos ítems de elección forzada despiertan resistencia en muchos individuos.

Interpretación referida a criterio:

Como habíamos dicho al principio del capítulo que las puntuaciones originales de un test carecen de un significado unívoco,

normalmente se interpretan comparándolas con un grupo de referencia (ya vimos, se usaban baremos para esto, puntaje z).

Entonces, una forma alternativa de interpretación de las puntuaciones consiste en COMPARARLAS con un criterio de logro u

objetivo a alcanzar, previamente especificado.

Ejemplo1:

Si consideramos que un criterio de desempeño es responder al menos 14 preguntas correctas de las 20 de una prueba de

conocimiento en literatura, 14 sería el estándar con el cual comparar los aciertos obtenidos por un individuo en ese test de

rendimiento

Ejemplo2:

En otro ejemplo, alguien puede hacer muy bien todas las pruebas de conducir, pero aunque su puntaje le de 100% de aciertos,

no es buen candidato para recibir el carnet de conducir si pasa los semáforos en rojo.

Estos tests presuponen que existe un área específica o dominio de conocimiento o habilidad que puede ser claramente definido

y delimitado. Una prueba referida a criterio es aquella que deliberadamente se construye para conducir a medidas

directamente interpretables en términos de pautas específicas de desempeño, las cuales se determinan definiendo una clase o

dominio de tareas que el individuo debe realizar.

Los tests referidos a criterio se desarrollaron a comienzos del siglo XX. Sin embargo fue abandonado durante el período

comprendido entre las dos guerras mundiales (1914-1945). Recién en los años 70 se comenzó a aplicar sistemáticamente este

tipo de pruebas, en particular en la evaluación educativa

Los tests referidos a NORMAS sugieren más bien CUÁNTO han aprendido los individuos pero no esclarecen adecuadamente qué

han aprendido. En cambio, las pruebas con referencia a CRITERIO informan la posición absoluta de un sujeto en relación con el

dominio conductual definido explícitamente

TP TECNICAS.pdf

Estamos procesando este archivo...

Lamentablemente la previsualización de este archivo no está disponible. De todas maneras puedes descargarlo y ver si te es útil.

Descargar

Estamos procesando este archivo... Lamentablemente la previsualización de este archivo no está disponible. De todas maneras puedes descargarlo y ver si te es útil.

Estamos procesando este archivo...

Lamentablemente la previsualización de este archivo no está disponible. De todas maneras puedes descargarlo y ver si te es útil.