Hipótesis alternativa (H
a
): postula X e Y no son
independientes (No importa cual
sea la relación que mantengan ni
el grado de esta).
La condición de independencia es: Si X e Y son independientes si y sólo si para
cualquier pareja de valores x e y la probabilidad de que X tome el valor x e Y el
valor y, simultáneamente, es igual al producto de las probabilidades de que cada
una tome el valor correspondiente.
X e Y son independientes x;y; f(x,y) = f(x)f(y)
Por tanto, todo lo que necesitamos serán unas estimas de las funciones de
probabilidad de ambas variables por separado [f(x) y f(y)] y de la función de
probabilidad conjunta [f(x,y)].
Una condición básica para que podamos llevar a cabo una prueba chi-cuadrado
es que las frecuencias de las distintas clases deberán ser suficientemente altas
como para garantizar que pequeñas desviaciones aleatorias en la muestra no
tengan importancia decisiva sobre el valor del estadístico de contraste.
Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si
n es suficientemente grande, es decir, si todas las frecuencias esperadas son
mayores que 5. En la práctica se tolera un máximo del 20% de frecuencias
inferiores a 5.
Si existe concordancia perfecta entre las frecuencias observadas y las esperadas
el estadístico tomará un valor igual a 0; por el contrario, si existen grandes
discrepancias entre estas frecuencias el estadístico tomará un valor grande y, en
consecuencia, se rechazará la hipótesis nula. Así pues, la región crítica estará
situada en el extremo superior de la distribución Chi-cuadrado con k-1 grados de
libertad.
Supuestos de las pruebas de Chi – cuadrado
(Bondad de ajuste; Prueba de independencia)-
La prueba de Chi – cuadrado no requiere los supuestos usuales de normalidad de
la población, de igualdad de varianza, etc. Si debemos tener en cuenta un
supuesto:
NO DEBE EXISTIR NINGUNA RELACIÓN ESPECIAL DE NINGUNO
DE LOS VALORES OBSERVADOS CON ALGÚN OTRO VALOR OBSERVADO
.
Cómo se interpreta este supuesto: significa que no es posible utilizar las
pruebas de Chi – cuadrado, si las observaciones se basan en las mismas
personas puestas a prueba más de una vez.
LA DISTRIBUCIÓN DE CHI – CUADRADO
Para poder averiguar si el estadístico de Chi- cuadrado obtenido presenta una
discrepancia mayor a la que podría ocurrir por casualidad (azar) debemos saber
cuáles son las probabilidades de que Chi cuadrado asuma valores de distintos
intervalos obtenidos por azar, es decir, necesitamos la distribución del
estadístico de Chi- cuadrado que ocurriría por casualidad. Para ello, se utiliza una
distribución de probabilidad (modelo matemático) que recibe el nombre de
Distribución de Chi – cuadrado.
Se puede utilizar este modelo debido a que valores obtenidos empíricamente del
estadístico Chi - cuadrado se aproximan en forma estable a dicha distribución
matemática. .
La Distribución de Chi – cuadrado depende de los grados de libertad (k). En una
prueba de Chi- cuadrado, los grados de libertad son la cantidad de categorías