UNIVERSIDAD NACIONAL DE EDUCACIÓN
ENRIQUE GUZMÁN Y VALLE
Alma Máter del Magisterio Nacional
ESCUELA DE POSTGRADO
SECCIÓN DE DOCTORADO
Curso: Seminario de Estadística Aplicada
a la Investigación Educacional
Tema: Estadísticos no paramétricos Ji-Cuadrada
Dr. Florencio Flores Ccanto
¿CUÁLES SON LAS SUPOSICIONES DE LA ESTADÍSTICA
NO PARAMÉTRICA?
Para realizar análisis no paramétricos, debe partirse de las
siguientes consideraciones:
•La mayoría de estos análisis no requieren de supuestos acerca
de la forma de la distribución poblacional. Aceptan
distribuciones no normales.
•Las variables no necesariamente deben estar medidas en un
nivel por intervalo o de razón, pueden analizar datos nominales
u ordinales.
•Si se quieren aplicar análisis no paramétrica a datos por
intervalos o razón, éstos deben ser resumidos a categorías
discretas (a unas cuantas). Las variables deben ser
categorías.
¿CUÁLES SON LOS MÉTODOS O PRUEBAS
PARAMÉTRICAS MÁS UTILIZADAS?
ESTADÍSTICAS
NO
Las Pruebas no paramétricas más utilizadas son:
1. La Chi-cuadrada o Ji-Cuadrada o X2.
2. Los coeficientes de correlación e independencia
para tabulaciones cruzadas.
1. Los coeficientes de correlación por rangos
ordenados de Spearman y Kendall.
1. Prueba de U de Mann Whitney
2. Pruebas W de Wilcoxon
Distribución Ji-Cuadrada o Chi-cuadrada o X2?.
Es una prueba útil para variables categóricas y
estadística, es aplicable cuando la variable nominal
está compuesto por dos o más categorías. Tiene dos
aplicaciones:
1. La prueba de bondad de ajuste Chi-cuadrada.
2. La prueba Chi-cuadrada de asociación.
Ambas pruebas se utilizan para determinar si las
frecuencias observadas (O) en las categorías difieren
significativamente de las frecuencias esperadas (E).
Es una prueba estadística para evaluar hipótesis
acerca de la relación entre dos variables categóricas.
Símbolo:
X2
Hipótesis a probar:
Correlaciones
Variables
involucradas:
Dos variables (la prueba Chi-cuadrada no
considera relaciones causales).
Nivel de medición de
las variables
Nominal u ordinal (o intervalos o razón reducidas
a ordinales)
Procedimiento
La Chi-cuadrada se calcula por medio de una
tabla de contingencia o tabulación cruzada, que
es una tabla de dos dimensiones y cada
dimensión contiene una variable. A su vez, cada
variable se subdivide en dos o más categorías.
CARACTERÍSTICAS
1. La Distribución X2 se lee con grados de libertad G.L =
(Nº de filas - 1)(Nº de columnas - 1).
2. No tiene valores negativos. El valor mínimo es 0.
3. Todas las curvas son asimétricas
4. Cuando aumentan los grados de libertad las curvas son
menos elevadas y más extendidas a la derecha.
5. Se utiliza para variables medidas en escala nominal u
ordinal.
6. Las fórmulas son:
Total de Fila x Total de Columna
F. Esperada=
Total General
Ejemplo 1. Variable, categoría y tabla de contingencia 2x2:
Sean las variables SEXO (Masculino y Femenino) y
CANDIDATO (“A” y “B”). La tabla de contingencia o tabulación
cruzada es:
CANDIDATO
“A”
“B”
Masculino
20
30
Femenino
40
25
SEXO
Variable
Categoría
CANDIDATO
“A”
“B”
Masculino
20
30
Femenino
40
25
SEXO
Ejemplo 2. Estudio de Tabla de contingencia 3x2:
Se estudia a 1040 estudiantes de los niveles de educación
primaria y secundaria y a los cuales se aplica un instrumento
que mide el aprendizaje de la matemática, en las dimensiones
de aprendizaje conceptual, procedimental y actitudinal.
Variables:
APRENDIZAJE
categorías: Conceptual, Procedimental, Actitudinal.
NIVEL DE EDUCACIÓN
categorías: Primaria, Secundaria.
TABLA DE CONTINGENCIA
NIVEL DE EDUCACIÓN
Primaria
APRENDIZAJE
Secundaria
Conceptual
180
100
Procedimental
190
280
Actitudinal
170
120
Tabla de frecuencias observadas (O):
NIVEL DE EDUCACIÓN
APRENDIZAJE
Conceptual
Procedimental
Actitudinal
TOTAL
TOTAL
Primaria
Secundaria
180
100
280
190
280
470
170
120
290
540
500
1040
La Chi-cuadrada es una comparación entre las tablas
de frecuencias observadas y la denominada tabla de
frecuencias esperadas (la tabla que esperaríamos
encontrar si las variables fueran estadísticamente
independientes o no estuvieran relacionadas).
Tabla de frecuencias esperadas (E):
La frecuencia esperada de cada celda, casilla o recuadro, se
calcula mediante la siguiente fórmula aplicada a la tabla de
frecuencias observadas:
N = es el número total de frecuencias observadas.
E = (marginal del reglón)(marginal de columna) / N.
NIVEL DE EDUCACIÓN
Primaria
Conceptual (280)(540)/1040
APRENDIZAJE
Procedimental (470)(540)/1040
Actitudinal (290)(540)/1040
marginal de columnas
540
Secundaria
Marginal
de filas
(280)(500)/1040
280
(470)( 500)/1040
470
(290)(500)/1040
290
500
1040
Frecuencia observada:
NIVEL DE EDUCACIÓN
Primaria
APRENDI
ZAJE
TOTAL
secundaria
Conceptual
180
100
280
Procedimental
190
280
470
Actitudinal
170
120
290
540
500
1040
Donde:
O: frecuencia observada
en cada celda
E: frecuencia esperada
en cada celda
TOTAL
Frecuencia esperada:
NIVEL DE EDUCACIÓN
Primaria
APRENDIZ
AJE
TOTAL
Secundaria
Conceptual
145,4
134,6
280
Procedimental
244,0
226,0
470
Actitudinal
150,6
139,4
290
540
500
1040
TOTAL
X2 
2


O

E

E
O
E
O-E
(O-E)2
(O-E)2 / E
Conceptual/Primaria
180
145,4
34,6
1197,16
8,23
Procedimental/ Primaria
190
244,4
-54,4
2959,36
12,11
Actitudinal / Primaria
170
150,6
19,4
376,36
2,50
Conceptual / Secundaria
100
134,6
-34,6
1197,16
8,69
Procedimental /Secundaria
280
226,0
54,0
2916,00
12,80
Actitudinal / Secundaria
120
139,4
-19,4
376,36
2,70
Celda
X2 =
47,33
Para saber si el valor de X2 es o no significativo, debemos
calcular los grados de libertad.
G.L. = (Nº de filas - 1)(Nº de columnas - 1).
Para el ejemplo: Nº de filas = 3 y
G.L. = (3-1)(2-1) = 2.
Nº de columnas
= 2; entonces
Luego, acudimos a la “tabla de distribución de Chicuadrado”, eligiendo nuestro nivel de confianza ( = 0,05 ó
 = 0,01).
Si el valor obtenido de X2 es igual o superior al valor de la
“tabla”, decimos que las variables están relacionadas o no
son independientes.
Aplicación:
Para el nivel de confianza de =0,05 y g.l. = 2, el X2 de tabla
es 5,9915 (ver tabla).
X2Obtenido = 47,33
X2Crítico = 5,9915
Prueba de hipótesis:
H0:
No existe relación entre el aprendizaje y los
niveles de educación.
H1:
Existe relación entre el aprendizaje y niveles de
educación.
X2obtenido

X2crítico
entonces variables no son
independientes; es decir existe una relación entre
Aprendizaje y los niveles educativos
X2obtenido

X2crítico
entonces se rechaza la
hipótesis nula (H0), y por lo tanto se acepta la hipótesis
alterna (H1).
Paso Nº 1
Paso Nº 2
Paso Nº 3
Paso Nº 4
Establezca la Ho a ser probada; por ejemplo,
Ho: 1 = 2 = 0,5
Especifique el nivel de significancia α, por ejemplo: α = 0.5
Haga una tabla de frecuencias obtenidas
Deduzca las frecuencias esperadas a partir de Ho:
Calcule el grado de libertad: Producto de (categorías - 1)
Calcule el valor de X2 a partir de las frecuencias obtenidas y
frecuencias esperadas.
Mediante la tabla de X2 obtenga el valor teórico.
Compara dichos valores.
Establezca la conclusión con respecto a Ho:
Retenga Ho si valor de tabla > Valor calculado.
Retenga Ho si valor de tabla < Valor calculado.
Ejercicio:
Un politólogo cree que, durante los últimos años, la composición étnica
de la ciudad donde vive ha cambiado. Las cifras más actuales
(reunidas hace unos cuántos años) muestran que los habitantes de
dicha ciudad presentan la siguiente composición étnica: 53% noruegos,
32% suecos, 8% irlandeses, 5% alemanes y 2% italianos. Para verificar
esta idea, este científico social obtiene una muestra aleatoria de 750
habitantes, con los resultados que se presentan en la siguiente tabla:
Países
frecuencia
Noruegos
Suecos
399
193
Irlandeses Alemanes
63
82
a). ¿Cuál es la hipótesis nula?
b). ¿Cuál es la hipótesis alterna?
c). ¿Cuál es la conclusión?. Utilice  = 0,05.
Italianos
13
Ejercicio:
Una universidad está pensando en implantar uno de los tres sistemas de
calificaciones siguientes: (1) todas las calificaciones son aprobados-reprobado;
(2) todas las calificaciones están en el sistema 4.0 y (3) 90% de las
calificaciones están en el sistema 4.0 y 10% son a probados-reprobado. Se
realiza una encuesta para determinar si existe una relación entre el área de
interés de cada alumno y su presencia para algún sistema de calificación. Se
elige una muestra aleatoria de 200 estudiantes del área ingeniería, 200 de
ciencias, y 100 de bellas artes. Se pregunta a cada alumno cuál de los tres
calificaciones prefieren. Los resultados aparecen en la siguiente tabla:
Sistema de calificación
Aprobado-reprobado
4,0
4,0 y aprobado-reprobado
Bellas artes
26
55
19
Ciencias
24
118
58
Ingeniería
20
112
68
a). ¿Cuál es la hipótesis nula?
b). ¿Cuál es la hipótesis alterna?
c). ¿Cuál es la conclusión?. Utilice  = 0,05.
Ejercicio:
Debido a la inflación galopante, el gobierno está considerando la imposición de
un control de precios y salarios. Un economista del gobierno, interesado en
determinar si existe una relación entre el empleo y la actitud hacia este control,
reúne los siguientes datos. Los datos muestran, para cada tipo de empleo, el
número de individuos en la muestra que están a favor o contra de los controles.
Actitud hacia el control de precios y salarios
A favor
En contra
Obreros
90
60
Empresarios
100
150
Profesionales
110
90
a). ¿Cuál es la hipótesis nula?
b). ¿Cuál es la hipótesis alterna?
c). ¿Cuál es la conclusión?. Utilice  = 0,05.
ENCUESTA
Se quiere estudiar la relación que existe entre el Sexo, Grado
académico y el Ingreso familiar de los docentes de la Institución
Educativa de la UGEL Nº 6.
Por favor responda cada ítem de la presente encuesta:
Sexo:
( ) Femenino
( ) Masculino
Grado académico:
( ) Bachiller
( ) Doctor
( ) Magíster
( ) Otros
Ingreso familiar:
( ) Menos o iguales de S/. 550
( ) Mayor que S/. 550 y menor que S/. 800
( ) Mayor que S/. 800 y menor que S/.1200.
( ) Mayor que S/. 1200.
DEFINIR LA VARIABLES EN SPSS
Datos resultados de la encuesta
INGRESO DE DATOS
Cálculo de X2
Tabla de contingencia
Sexo
Femenino
Grado
Bachiller
Magister
Doctor
Otros
2
2
2
2
Masculino
3
0
1
0
Pruebas de chi-cuadrado de Pearson
Grado
Chi-cuadrado
gl
Sig.
Sexo
3,600
3
,308
Cálculo Manual de Ji-Cuadrada
Descargar

Diapositiva 1