PRUEBA DE CHI CUADRADO
INTRODUCCIÓN
En la investigación nos encontramos con frecuencia con datos o variables de tipo
cualitativo, mediante las cuales un grupo de individuos se clasifican en dos o
más categorías mutuamente excluyentes. Las proporciones son una forma
habitual de expresar frecuencias cuando la variable objeto de estudio tiene dos
posibles respuestas, como presentar o no un evento de interés (enfermedad,
muerte, curación, etc.). Cuando lo que se pretende es comparar dos o más
grupos de sujetos con respecto a una variable categórica, los resultados se
suelen presentar a modo de tablas de doble entrada que reciben el nombre de
tablas de contingencia. Así, la situación más simple de comparación entre dos
variables cualitativas es aquella en la que ambas tienen sólo dos posibles
opciones de respuesta (es decir, variables dicotómicas).
Tabla de Contingencia para la comparación de dos variables dicotómicas
Característica A (variable A)
Característica B
(variable B)
Presente
Ausente
Total Hilera
Presente
a
b
a + b
Ausente
c
d
c + d
Total Columna
a+c
b + d
Total
n =a+b+c+d
PRUEBA DE CHI CUADRADO (
Para comprender los procedimientos de prueba de hipótesis con variables cuyos
valores son categorías preferencias religiosas, autoestima de la persona,
genero, color de ojos, atracción física, etc. - . Procedimientos que se
concentran en la cantidad de objetos o personas de las diferentes
categorías más que en la media aritmética de alguna dimensión.
Una de las tantas pruebas de hipótesis que existen, es la Prueba de Chi
cuadrado, dicha prueba permite evaluar hipótesis acerca de la relación entre dos
variables categóricas.
Símbolo:

CORRELACIONALES
Variables involucradas:
DOS
La prueba de chi cuadrado no considera relaciones causales
Nivel de Medición de las variables:
Nominal u ordinal (o de intervalos o
razón reducidos a ordinales).
Procedimiento:
Se calcula por medio de una tabla de contingencia o tabulación
cruzada, que es un cuadro de dos dimensiones y cada dimensión
contiene una variable. A su vez, cada variable se subdivide en dos o
más categorías.
En la prueba de Chi cuadrado (2) la idea básica es, que se compare la forma
en que se reparten las personas u objetos dentro del esquema observado (varias
categorías de la variable) y sobre este esquema de reparto, observar como se
ajusta a un esquema esperado (por ejemplo: un esquema de repartición
uniforme).
Por lo tanto, una prueba de Chi cuadrado se describe como la comparación de
una distribución de frecuencias observadas con una distribución de frecuencia
esperadas, (en general toda prueba de hipótesis implica, primero calcular las
discrepancias entre las frecuencias observadas y las frecuencias esperadas
[discrepancia = O E] y luego, observar sí esas discrepancias son mayores de lo
que se esperaría por casualidad o azar).
En otras palabras, para realizar este contraste se disponen los datos en una
tabla de frecuencias. Para cada valor o intervalo de valores se indica la
frecuencia absoluta observada o empírica (O
i
). A continuación, y suponiendo que
la hipótesis nula es cierta, se calculan para cada valor o intervalo de valores la
frecuencia absoluta que cabría esperar o frecuencia esperada (E
i
=n·p
i
, donde n
es el tamaño de la muestra y p
i
la probabilidad del i-ésimo valor o intervalo de
valores según la hipótesis nula)
La formula de Chi cuadrado nos permite obtener un indicador general de la
discrepancia entre las frecuencias observadas y las frecuencias esperadas,
denominándose a la cantidad obtenida estadístico de Chi-cuadrado
La hipótesis nula de la prueba Chi-cuadrado postula una distribución de
probabilidad totalmente especificada como el modelo matemático de la
población que ha generado la muestra. Es decir que:
Hipótesis nula (H
0
): postula que X e Y son independientes.
E
EO
2
2
Hipótesis alternativa (H
a
): postula X e Y no son
independientes (No importa cual
sea la relación que mantengan ni
el grado de esta).
La condición de independencia es: Si X e Y son independientes si y sólo si para
cualquier pareja de valores x e y la probabilidad de que X tome el valor x e Y el
valor y, simultáneamente, es igual al producto de las probabilidades de que cada
una tome el valor correspondiente.
X e Y son independientes  x;y; f(x,y) = f(x)f(y)
Por tanto, todo lo que necesitamos serán unas estimas de las funciones de
probabilidad de ambas variables por separado [f(x) y f(y)] y de la función de
probabilidad conjunta [f(x,y)].
Una condición básica para que podamos llevar a cabo una prueba chi-cuadrado
es que las frecuencias de las distintas clases deberán ser suficientemente altas
como para garantizar que pequeñas desviaciones aleatorias en la muestra no
tengan importancia decisiva sobre el valor del estadístico de contraste.
Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si
n es suficientemente grande, es decir, si todas las frecuencias esperadas son
mayores que 5. En la práctica se tolera un máximo del 20% de frecuencias
inferiores a 5.
Si existe concordancia perfecta entre las frecuencias observadas y las esperadas
el estadístico tomará un valor igual a 0; por el contrario, si existen grandes
discrepancias entre estas frecuencias el estadístico tomará un valor grande y, en
consecuencia, se rechazará la hipótesis nula. Así pues, la región crítica estará
situada en el extremo superior de la distribución Chi-cuadrado con k-1 grados de
libertad.
Supuestos de las pruebas de Chi cuadrado
(Bondad de ajuste; Prueba de independencia)-
La prueba de Chi cuadrado no requiere los supuestos usuales de normalidad de
la población, de igualdad de varianza, etc. Si debemos tener en cuenta un
supuesto:
NO DEBE EXISTIR NINGUNA RELACIÓN ESPECIAL DE NINGUNO
DE LOS VALORES OBSERVADOS CON ALGÚN OTRO VALOR OBSERVADO
.
Cómo se interpreta este supuesto: significa que no es posible utilizar las
pruebas de Chi cuadrado, si las observaciones se basan en las mismas
personas puestas a prueba más de una vez.
LA DISTRIBUCIÓN DE CHI CUADRADO
Para poder averiguar si el estadístico de Chi- cuadrado obtenido presenta una
discrepancia mayor a la que podría ocurrir por casualidad (azar) debemos saber
cuáles son las probabilidades de que Chi cuadrado asuma valores de distintos
intervalos obtenidos por azar, es decir, necesitamos la distribución del
estadístico de Chi- cuadrado que ocurriría por casualidad. Para ello, se utiliza una
distribución de probabilidad (modelo matemático) que recibe el nombre de
Distribución de Chi cuadrado.
Se puede utilizar este modelo debido a que valores obtenidos empíricamente del
estadístico Chi - cuadrado se aproximan en forma estable a dicha distribución
matemática. .
La Distribución de Chi cuadrado depende de los grados de libertad (k). En una
prueba de Chi- cuadrado, los grados de libertad son la cantidad de categorías
que son libres de variar en cuanto a sus frecuencias, dándose como conocido el
total de elementos que las componen.
Utilización de la distribución de Chi- cuadrado
La distribución χ² tiene muchas aplicaciones en inferencia estadística, por
ejemplo en la denominada prueba χ² utilizada como prueba de independencia y
como prueba de bondad de ajuste y en la estimación de varianzas. También está
involucrada en el problema de estimar la media de una población normalmente
distribuida y en el problema de estimar la pendiente de una recta de regresión
lineal, a través de su papel en la distribución t de Student, y participa en todos
los problemas de análisis de varianza, por su papel en la distribución F de
Snedecor, que es la distribución del cociente de dos variables aleatorias
independientes con distribución χ².
TABLA DE CHI- CUADRADO
Lo importante acerca de la distribución de Chi cuadrado, cuando establecemos
prueba de hipótesis, es el punto de corte que nos indica que un Chi- cuadrado es
lo suficientemente grande como para rechazar la hipótesis nula (H
0
).
Una tabla de Chi cuadrado proporciona los puntos de corte para los distintos
niveles de significación y para varios grados de libertad.
Ejemplos OBTENCIÓN DE CHI CUADRADO
Ejemplo 1
Supongamos que se quiere estudiar la posible asociación entre el hecho de que
una gestante fume durante el embarazo y que el niño presente bajo peso al
nacer. Por lo tanto, se trata de ver si la probabilidad de tener bajo peso es
diferente en gestantes que fumen o en gestantes que no fumen durante la
gestación. Para responder a esta pregunta se realiza un estudio de seguimiento
sobre una cohorte de 2000 gestantes, a las que se interroga sobre su hábito
tabáquico durante la gestación y se determina además el peso del recién nacido.
GESTANTE
RECIEN NACIDOS BAJO PESO
TOTAL HILERA
SI
NO
FUMADORA
43
207
250
NO FUMADORA
105
1645
1750
TOTAL COLUMNA
148
1852
2000
FORMULA DE Chi
2
E
EO
2
2

GRADOS DE LIBERTAD (k) = (cantidad de Columnas - 1)(cantidad de Hileras 1)
Calculo de las Frecuencias Esperadas
FRECUENCIA ESPERADA
FRECUENCIAS ESPERADAS
GESTANTE
RECIEN NACIDOS BAJO PESO
TOTAL HILERA
SI
NO
FUMADORA
18,5
231,5
250
NO FUMADORA
129,5
1620,5
1750
TOTAL COLUMNA
148
1852
2000
En general las frecuencias esperadas se colocan entre paréntesis
GESTANTE
RECIEN NACIDOS BAJO PESO
TOTAL HILERA
SI
NO
FUMADORA
(18,5)
43
(231,5)
207
250
NO FUMADORA
(129,5)
105
(1620,5)
1645
1750
TOTAL COLUMNA
148
1852
2000
CALCULO DE CHI
2
O
E
O-E
(O-E)
2
(O-E)
2
/E
FUMADORA - SI
43
18,5
24,5
600,25
32,44
FUMADORA - NO
207
231,5
-24,5
600,25
2,59
NO FUMADORA - SI
105
129,5
-24,5
600,25
4,63
NO FUMADORA - NO
1645
1620,5
24,5
600,25
0,37
40,03
Total
TT
F
hileracolumna
esp
5,18
2000
250148
SIFUMADORA
5,231
2000
2501852
NOFUMADORA
5,129
2000
1750148
_
SIFUMADORANO
5,1620
2000
17501852
_
NOFUMADORANO
=40,03
CALCULO DE LOS GRADOS DE LIBERTAD
= (C-1)(H-1)= (2-1)(2-1)= 1
Grados de Libertad ( = 1
Seleccionar el NIVEL DE SIGNIFICACIÓN
O
Seleccionado el NIVEL DE SIGNIFICACIÓN y determinados LOS GRADOS DE
LIBERTAD, OBSERVE en la tabla DE DISTRIBUCIÓN DE CHI
2
los puntos de corte
correspondientes
= 0,05
= 0,01
Ejemplo 2 (a realizar por el alumno)
Estudio para determinar si existe relación entre el genero y el propósito reelegir
una carrera técnica.
GENERO
ASPIRA A CARRERA TÉCNICA
SI
NO
TOTAL
HILERA
MASCULINO
40
30
70
FEMENINO
10
40
50
TOTAL COLUMNA
50
70
TOTAL
120
TEÓRICO CHI CUADRADO.pdf
browser_emoji Estamos procesando este archivo...
browser_emoji Lamentablemente la previsualización de este archivo no está disponible. De todas maneras puedes descargarlo y ver si te es útil.
Descargar
. . . . .