USAP
Estadística Administrativa II
2015-2
1
Estadística no
paramétrica
Pruebas de hipótesis no solamente
pueden estar distribuidas normalmente o
ser numéricas; también pueden ser
nominales
2
Chi-cuadrada
ji-cuadrada
 2 -cuadrada
2 =
 − 

2
3
Características
a) Valores no negativos: Al elevar al cuadrado la
variación entre la frecuencia observada y la frecuencia
esperada, el resultado siempre es positivo.
b) Familia de distribuciones: Al contar variables con
múltiples tipos de valores, las gráficas resultantes son
variadas tanto en la forma como en la altura. Debido a
los múltiples valores que puede tomar, se trabaja con
k-1 grados de libertad para darle un mejor ajuste a los
resultados de la prueba de hipótesis.
c) Sesgada por la derecha: tiene sesgo positivo,
porque se puede concluir que los valores están
concentrados en los valores menores y dispersos en
los mayores.
4
Característica de chi-cuadrada
5
Ejemplo . . .
En una encuesta sobre el comportamiento del
consumidor se obtuvieron los siguientes resultados.
Resultados Encuestas
Me gusta
10
No me gusta
20
Sin comentarios
30
60
Si las respuestas se esperaban de manera
uniforme, calcular el valor de chi-cuadrada.
6
. . . Ejemplo
Se aplicaron 60 encuestas; por lo que se
esperaba que cada respuesta tuviera un total
uniforme; es decir, 20 por cada característica de
la variable.
Encuestas Pronóstico
Resultados
(f0 - fe)2
f0 - fe
fo
fe
100
Me gusta
10
20 10 - 20 = -10
0
0
No me gusta
20
20 20 - 20 =
100
10
Sin comentarios
30
20 30 - 20 =
60
60
2
 − 

5
0
5
10
7
. . . Ejemplo
Se aplicaron 60 encuestas; por lo que se
esperaba que cada respuesta tuviera un total
uniforme; es decir, 20 por cada característica de
la variable.
Encuestas Pronóstico
Resultados
fo
fe
Me gusta
10
20
No me gusta
20
20
Sin comentarios
30
20
60
60
 − 

2
5
0
5
10
 2 = 10
8
Prueba de bondad de
ajuste
En una investigación cualitativas, las variables no son
numéricas; pero, las frecuencias si lo son. Se hace el
conteo de los resultados obtenidos y se asume que
se esperaba que todas las respuestas fueran iguales.
Para determinar si los resultados son similares o no,
se recurre a la prueba de hipótesis, para comprobar
si existen diferencia o no entre lo observado y lo
esperado.
9
Prueba de bondad de ajuste
Frecuencia esperadas iguales
Una vez definida la cantidad de
encuestas a aplicar, se definen las
características de las variables y al
dividir el tamaño de la muestra entre
la cantidad esperada se asume que
será la cantidad que se espera para
cada una de ellas.
10
Ejemplo . . .
Un supermercado va a levantar una encuesta en
línea para determinar preferencia de los clientes
con relación a la venta del refresco Coca Cola. Se
tomará una muestra de 1000 internautas y las
características a evaluar son:
• Lata
• Botella pequeña
• Envase de 1.5 litros
• Envase de 2.0 litros
• Envase de 3.5 litros
11
Ejemplo . . .
• Calcular la frecuencia esperada
FRECUENCIA FRECUENCIA
NIVEL DE PREFERENCIA
OBSERVADA ESPERADA
Lata
Botella pequeña
Envase de 1.5 litros
Envase de 2.0 litros
envase de 3.5 litros
Total …
1,000
200
200
200
200
200
1,000
12
Prueba de hipótesis con
1.
2.
3.
4.
5.
2

Establecer la hipótesis nula y alternativa
Seleccionar un nivel de significancia
Seleccionar el estadístico de prueba
Formular la regla de decisión
Tomar una decisión
13
Ejemplo . . .
La gerente de marketing de un fabricante de
tarjetas deportivas planea iniciar la venta de una
serie de tarjetas deportivas con fotografías y
estadística de juego de la liga nacional. Uno delos
problemas es la selección de exjugadores. En
una exhibición de tarjetas de futbol en el Estadio
Morazán el pasado fin de semana se instaló un
puesto y ofreció tarjetas de Danilo Toselo, Carlos
Pavón, Carlo Costly, Diego Vásquez, Wilmer
Velásquez y Rambo de León. Al final del día
vendió 120 tarjetas. El número de tarjetas
vendidas de cada jugador es la siguiente:
14
. . . Ejemplo
Tarjetas
#
Jugador
Vendidas
1 Danilo Toselo
13
2 Carlos Pavón
33
3 Carlo Costly
14
4 Diego Vásquez
7
5 Wilmer Velásquez
36
6 Rambo de León
17
Si la importancia de los
jugadores es similar, debería
haberse vendido la misma
cantidad de cada uno de
ellos; sin embargo, podría
suceder que el muestreo haya
generado un sesgo; pero, que
la población sí mantenga las
mismas preferencias.
¿Se puede determinar que hay diferencia entre las tarjetas
vendidas y las esperadas, con un nivel de significancia del
15
5%?
. . . Ejemplo
1. Hipótesis nula y alternativa
 :  ≤ 
 :  > 
2. Nivel de significancia
 = 0.05
3. Estadístico de prueba
2 =
 − 

2
16
. . . Ejemplo
4. Regla de decisión
 = 0.05
1 
 = 6 − 1 = 5
 2 = 11.070
Valor crítico
17
. . . Ejemplo
 2 = 11.070
5. Toma de decisión
— Sumar las frecuencias de las tarjetas
divididas entre el total de jugadores para
obtener la frecuencia esperada para cada
uno de ellos y agregar un columna con estos
resultados.
Tarjetas
Pronóstico
#
Jugador
Vendidas
1 Danilo Toselo
13
20
2 Carlos Pavón
33
20
3 Carlo Costly
14
20
4 Diego Vásquez
7
20
5 Wilmer Velásquez
36
20
6 Rambo de León
17
20
Total tarjetas
120
120
18
 2 = 11.070
. . . Ejemplo
— Calcular el cociente entre la
variación cuadrada y la
frecuencia esperada.
2 =
Tarjetas
Vendidas Pronóstico
Jugador
#
fo
fe
f0 - fe
(f0 - fe)2
1 Danilo Toselo
13
20 13 - 20 =
-7
49
2 Carlos Pavón
33
20 33 - 20 =
13
169
3 Carlo Costly
14
20 14 - 20 =
-6
36
4 Diego Vásquez
7
20 7 - 20 =
-13
169
5 Wilmer Velásquez
36
20 36 - 20 =
16
256
6 Rambo de León
17
20 17 - 20 =
-3
9
Total tarjetas
120
120
 2 = 34.4
 − 

 − 

2
2.45
8.45
1.8
8.45
12.8
0.45
34.4
La hipótesis nula se rechaza.
Se puede concluir que sí hay diferencia entre las tarjetas
vendidas y las tarjetas que se esperaba vender.
19
2
Prueba de bondad de ajuste
Frecuencia esperadas desiguales
Una vez definida la cantidad de
encuestas a aplicar y teniendo la
ponderación de cada característica,
se calcula la frecuencia esperada,
multiplicando el total de la muestra
por cada ponderación.
20
Ejemplo . . .
Una empresa que renta buses de tamaño
mediano para excursiones, ha determinado
que el 60% es en escuelas primarias, 30%
alumnos de secundaria y el resto para
asociaciones de adultos. Se va a tomar una
muestra de 250, calcular el valor esperado por
cada tipo de cliente.
DESCRIPCIÓN
Escuelas primarias
Escuelas secundarias
Asociaciones
Total …
FRECUENCIA
OBSERVADA
FRECUENCIA
ESPERADA
150
75
25
250
250
60%
30%
10%
100%
21
Prueba de hipótesis
2
con 
22
Ejemplo . . .
Según las políticas de una aseguradora, las atenciones en los
hospitales para el ingreso de los adultos mayores en el período
de un año, tiene el siguiente comportamiento.
40% no requiere hospitalización
30% es hospitalizado una vez
20% es hospitalizado dos veces
10% es hospitalizado 3 o más veces
Una encuesta de 150 adultos mayores, miembros de la
aseguradora reveló que:
55
no requirieron hospitalización
50
fueron admitidos una vez
32
fueron admitidos dos veces
13
fueron admitidos tres o más veces
Con un nivel de significancia de 0.05, probar si es posible que los
23
resultados sean congruentes con las ponderaciones.
. . . Ejemplo
1. Hipótesis nula y alternativa
 :  ≤ 
 :  > 
2. Nivel de significancia
 = 0.05
3. Estadístico de prueba
2 =
 − 

2
24
. . . Ejemplo
4. Regla de decisión
 = 0.05
1 
 = 4 − 1 = 3
 2 = 7.815
Valor crítico
25
. . . Ejemplo
 2 = 7.815
5. Toma de decisión
a) Construcción de tabla de frecuencias
observadas y la ponderación
26
. . . Ejemplo
 2 = 7.815
5. Toma de decisión
b) Frecuencias esperadas
27
 2 = 7.815
. . . Ejemplo
5. Toma de decisión
c) Calcular chi-cuadrada
 2 = 1.372
La hipótesis nula se acepta.
No hay diferencia entre los que son hospitalizados
y los que no.
28
Tablas de
contingencia
distribución de frecuencias formada por dos variables
cualitativas, también conocidos como datos bivariados o
variables cruzadas.
29
Tabla de contingencia
Una tabla de contingencia provee información variada,
puesto que, proporciona datos en forma conjunta y en
forma individual para cada variable, todo con una misma
muestra.
30
Ejemplo . . .
En una investigación sobre los gustos de las personas en la
prueba de un nuevo jugo combinado, se hizo diferencia
entre las respuestas de los clientes del sexo femenino con
las del masculino. Se encuestaron 100 personas que
proporcionaron las siguientes respuestas:
SABOR DEL
GÉNERO
Total
JUGO
Masculino Femenino
Muy bueno
20
15
35
Bueno
15
17
32
Regular
18
8
26
Indecisto
5
2
7
Totales …
58
42
100
31
. . . Ejemplo
GÉNERO
SABOR DEL JUGO
Masculino Femenino
Muy bueno
20
15
Bueno
15
17
Regular
18
8
Indeciso
5
2
Totales …
58
42
Total
35
32
26
7
100
De los 100, a 35 de ellos les pareció muy bueno el
sabor y solamente 7 se mostraron indecisos.
Se encuestó a 58 hombres y 42 mujeres de forma
aleatoria.
15 de las mujeres opinaron que el sabor es muy
bueno.
32
Tabla de contingencia
y chi-cuadrada
En una investigación con variables cruzadas, se
analizan, mínimo, dos variables a las cuales se les
calculará el valor de chi-cuadrada tomando de base una
ponderación definida que pueden ser iguales o
diferentes.
33
Tabla de contingencia y chicuadrada
VARIABLE 1
Característica 1
Característica 2
Característica 3
Totales …
VARIABLE 2
Carácterística 1 Característica 2
fo
fe
fo
fe
100
100
200
200
Total
300
34
Ejemplo . . .
En una investigación piloto, con relación a la percepción de
los consumidores sobre el sabor de un nuevo jugo que se
quiere lanzar al mercado, se esperaba que el 60%
contestara uniformemente que lo encontraba muy bueno o
bueno, y que el resto lo encontrara regular o estuviera
indeciso. Calcular el valor de chi-cuadrada para la
distribución obtenida:
SABOR DEL JUGO
Muy bueno
Bueno
Regular
Indeciso
Totales …
GÉNERO
Masculino
Femenino
20
15
18
5
58
15
17
8
2
42
Total
Observado
35
32
26
7
100
35
. . . Ejemplo
SABOR DEL
JUGO
Muy bueno
Bueno
Regular
Indeciso
Totales …
Total
Porcentajes
35
32
26
7
100
SABOR DEL Masculino
Porcentaje
JUGO
fo
Muy bueno
20
30%
Bueno
15
30%
Regular
18
20%
Indeciso
5
20%
Totales …
58
30%
30%
20%
20%
100%
fe
17.4
17.4
11.6
11.6
58.0
A cada línea se le
multiplica el porcentaje
por el total de
frecuencias.
30% ∗ 58 = 17.4
SABOR DEL Femenino
Porcentaje
JUGO
fo
Muy bueno
15
30%
Bueno
17
30%
Regular
8
20%
Indeciso
2
20%
Totales …
42
fe
12.6
12.6
8.4
8.4
42.0
36
. . . Ejemplo
Calcular los valores previos a chi-cuadrada para
cada uno de los géneros.
Masculino
SABOR DEL JUGO
fo
Muy bueno
20
Bueno
15
Regular
18
Indeciso
5
Totales …
58
Femenino
SABOR DEL JUGO
fo
Muy bueno
15
Bueno
17
Regular
8
Indeciso
2
Totales …
42
fe
(fo - fe)2
17.4
6.76
17.4
5.76
11.6 40.96
11.6 43.56
58.0
 −  2

0.3885
0.3310
3.5310
3.7552
8.0057
fe
(fo - fe)2
12.6
5.76
12.6 19.36
8.4
0.16
8.4 40.96
42.0
 −  2

0.4571
1.5365
0.0190
4.8762
6.8889
37
. . . Ejemplo
Calcular chi-cuadrada sumando los valores totales
obtenidos por cada característica
 2 = 14.895
38
2

Análisis de tablas de
contingencia
Es probar la hipótesis utilizando chi-cuadrada como
estadístico de prueba.
39
Análisis de tablas de
contingencia
• Existen investigaciones en las cuales se desea
conocer el comportamiento con poblaciones que
trabajan en conjuntos interceptados. Esta
clasificación tiene como base la escala nominal
debido a que no hay un orden natural para las
clasificaciones.
• El estadístico ji cuadrada es útil para probar de
manera formal si hay una relación entre dos
variables con escala nominal. En otras palabras,
¿es independiente una variable de la otra?
40
Regla de decisión
 = 0. 
1 
 = ( − 1)( − 1)
41
Ejemplo . . .
Una organización no gubernamental que trabaja con
proyectos de inserción del privado de la libertad está
investigando si los que recuperan su libertad tienen un
mejor nivel de readaptación a la vida civil cuando lo hacen
en la localidad que vivieron o en otra localidad que no
conocen de antemano; es decir, Con una confiabilidad del
99%, ¿Hay una relación entre la adaptación a la vida civil en
su localidad conocida o en una desconocida según los datos
obtenidos en el 2013?
En una encuesta realizada por psicólogos a 200 personas,
120 de las cuales residían en su localidad natal y 80 en otra
localidad, se obtuvieron se los siguientes resultados:
42
. . . Ejemplo
Residencia
Adaptación a la vida civil
Total
depués de salir Sobresaliente Buena Regular Insatisfactoria
Localidad natal
27
35
33
25
120
En otra localidad
13
15
27
25
80
Total
40
50
60
50
200
Tomar como base la ponderación del total según el tipo de
residencia.
Residencia
depués de salir
Localidad natal
En otra localidad
Total
Total
Ponderación
120 120 / 200 =
80 80 / 200 =
200
%
0.6
0.4
1.0
60%
40%
100%
43
. . . Ejemplo
1. Hipótesis nula y alternativa
 :  ≤ 
 :  > 
2. Nivel de significancia
 = 0.01
3. Estadístico de prueba
2 =
 − 

2
44
. . . Ejemplo
4. Regla de decisión
 = 0.01
1 
 = (2 − 1)(4 − 1) = 3
 2 = 11.345
Valor crítico
45
. . . Ejemplo
 2 = 11.345
5. Toma de decisión
a) Construcción de tabla de frecuencias
observadas y frecuencia esperada para
cada columna
46
. . . Ejemplo
5. Toma de decisión
a) Construcción de tabla de frecuencias
observadas y frecuencia esperada para
cada columna
47
. . . Ejemplo
 2 = 11.345
5. Toma de decisión
b) Calcular las variaciones cuadradas de cada
columna y sumar los resultados.
48
. . . Ejemplo
5. Toma de decisión
b) Calcular las variaciones cuadradas de cada
columna y sumar los resultados.
49
. . . Ejemplo
 2 = 11.345
5. Toma de decisión
c) Sumar la sumatoria de cada columna para
obtener el valor de chi-cuadrada
 2 = 5.7292
La hipótesis nula se acepta.
No hay evidencia de una diferencia entre
la adaptación después de salir de prisión.50
Ejemplos
completos
Prueba de bondad de ajuste – iguales
51
Práctica 1 . . .
El director de ventas de Automar vende lanchas
pequeñas y tiene la responsabilidad de controlar el
nivel de existencias de 4 modelos de lanchas que
se venden en tienda.
En el pasado ha ordenado adquirir lanchas bajo la
premisa de que se venden por igual. Sin embargo,
últimamente ha tenido un descontrol y en algunas
oportunidades se ha quedado sin producto para
vender y en otras han permanecido mucho tiempo
sin poderlas vender.
El director de ventas quiere probar si su hipótesis
52
es vigente y que se venden por igual.
Práctica 1…
En el mes de marzo, las ventas de lanchas según
el modelo comprado se reportó de la siguiente
manera:
MODELO
Sirena Veloz
Infinitum
Pirata
Neptuno
VENTAS
15
11
10
12
48
Se desea probar que las ventas son uniformes para
los cuatro modelos con un nivel de significancia de
5%.
53
. . . Práctica 1
Paso 1: Hipótesis nula y alternativa
 :       4 
 :        4 
 :  ≤ 
 :  > 
Paso 2: Nivel de significancia
 = 0.05
Paso 3: Estadístico de prueba
2

−



2
 =

54
. . . Práctica 1
Paso 4: Regla de decisión
 = 0.05
1 
=4
 = 3
 2 = 7.815
55
 2 = 7.815
. . . Práctica 1
Paso 5: Tomar decisión
Las ventas esperadas y las ventas reales
MODELO
Sirena Veloz
Infinitum
Pirata
Neptuno
VENTAS
15
ESPERADO
12
11
10
12
12
12
12
48
48
56
 2 = 7.815
. . . Práctica 1
Paso 5: Tomar decisión
Las ventas reales son las observadas y las de
la uniformidad las esperadas.
VENTAS ESPERADO
fo
fe
15
12
11
12
10
12
12
12
48
48
MODELO
Sirena Veloz
Infinitum
Pirata
Neptuno
2 =
 − 

2
57
 2 = 7.815
. . . Práctica 1
Paso 5: Tomar decisión
Las ventas reales son las observadas y las de la
uniformidad las esperadas.
VENTAS ESPERADO
fo
fe
15
12
11
12
10
12
12
12
48
48
MODELO
Sirena Veloz
Infinitum
Pirata
Neptuno
.
 2 = 2.33
0.75
0.08
0.33
1.17
2.33
La hipótesis nula se acepta, no hay
evidencia que indique que las ventas no
son uniformes para los cuatro modelos
2.33
7.815
58
Ejemplos
completos
Prueba de bondad de ajuste – desiguales
59
Práctica 2 . . .
El director de mercadeo del banco del Norte lanzó
una promoción para extender la cantidad de
préstamos que se otorgan, se espera que el 60%
sea para empresas comerciales, 10% para personas
naturales y 30% para comerciantes individuales.
Para determinar si la promoción está dando
resultado, se seleccionó una muestra aleatoria de 85
préstamos; de los cuales, 62 fueron para empresas
comerciales, 10 para personas naturales y 13 para
comerciantes individuales.
¿Se puede determinar si la promoción está dando
resultado? Con un nivel de significancia del 5%.
60
. . . Práctica 2
Resumen de los créditos otorgados y los porcentajes
de la promoción
TIPO DE CRÉDITO
CRÉDITOS
Empresas comerciales
Personas naturales
62
10
%
ESPERADO
60%
10%
Comerciante individual
13
85
30%
100%
Probar la hipótesis de que la promoción se está
resultando.
61
. . . Práctica 2
Paso 1: Hipótesis nula y alternativa
 :  ó á 
 :  ó  á 
 :  ≤ 
 :  > 
Paso 2: Nivel de significancia
 = 0.05
Paso 3: Estadístico de prueba
2

−



2
 =

62
. . . Práctica 2
Paso 4: Regla de decisión
 = 0.05
1 
=3
 = 2
 2 = 5.991
63
 2 = 5.991
. . . Práctica 2
Paso 5: Tomar decisión
Calcular las ventas esperadas.
TIPO DE CRÉDITO
Empresas comerciales
Personas naturales
Comerciante individual
2 =
CRÉDITOS
ESPERADO
%
ESPERADO
fo
fe
62
60%
51.0
10
10%
8.5
13
30%
25.5
85
100%
85.0
 − 

2
64
 2 = 5.991
. . . Práctica 2
Paso 5: Tomar decisión
Calcular las ventas esperadas.
TIPO DE CRÉDITO
Empresas comerciales
Personas naturales
Comerciante individual
CRÉDITOS ESPERADO
fo
fe
62
51.0
10
8.5
13
25.5
85
85.0
 2 = 8.76
5.991
8.76
2.37
0.26
6.13
8.76
La hipótesis nula se
rechaza, hay evidencia
que indica que la
promoción no está dando
el resultado esperado.65
Ejemplos
completos
Prueba de bondad de ajuste – iguales
Prueba de bondad de ajuste – desiguales
Tablas de contingencia
66
Práctica 3 . . .
El gerente general de una empresa que distribuye
un limpiador multiuso, desea determinar si existe
relación entre la efectividad atribuida al producto y la
zona área en que viven los consumidores. De 100
consumidores encuestados, 75 viven en la zona
urbana y 25 en la zona rural. La clasificación que se
otorgó fue de Muy bueno, Bueno y regular.
¿Existe relación entre la zona y el atributo otorgado
al producto? Usar un nivel de significancia del 10%.
67
. . . Práctica 3
Resumen de las encuestas sobre el atributo del
limpiador multiuso.
ATRIBUTO
ZONA
URBANA
20
ZONA
RURAL
11
TOTAL
Bueno
40
8
48
Regular
15
6
21
75
25
100
Muy bueno
31
Probar la hipótesis de que la promoción se está
resultando.
68
. . . Práctica 3
Paso 1: Hipótesis nula y alternativa
 :       
 :        
 :  ≤ 
 :  > 
Paso 2: Nivel de significancia
 = 0.10
Paso 3: Estadístico de prueba
2

−



2
 =

69
. . . Práctica 3
Paso 4: Regla de decisión
 = 0.10
1 
=3
 = 2
 2 = 4.605
70
 2 = 5.991
. . . Práctica 3
Paso 5: Tomar decisión
Calcular porcentaje por atributo .
ATRIBUTO
Muy bueno
Bueno
Regular
Total . . .
ZONA
URBANA
fo
20
40
15
75
ZONA TOTAL
%
RURAL
fo
11
31
31%
8
48
48%
6
21
21%
25
100
100%
71
 2 = 5.991
. . . Práctica 3
Paso 5: Tomar decisión
Calcular las ventas esperadas.
ATRIBUTO
Muy bueno
Bueno
Regular
Total . . .
ZONA
URBANA
fo
20
40
15
75
ZONA
ZONA
ZONA TOTAL %
URBANA RURAL TOTAL
RURAL
fe
fe
fo
11
31
31%
23.3
7.8
31
8
48
48%
36.0
12.0
48
6
21
21%
15.8
5.3
21
25
100 100%
75.0
25.0
100
2 =
 − 

2
72
 2 = 5.991
. . . Práctica 3
Paso 5: Tomar decisión
Calcular cociente de variación cuadrada y frecuencia esperada
ATRIBUTO
Muy bueno
Bueno
Regular
Total . . .
ZONA
URBANA
fo
20
40
15
75
ZONA
URBANA
fe
23.3
36.0
15.8
75.0
−
0.45
0.44
0.04
0.93
73
 2 = 5.991
. . . Práctica 3
Paso 5: Tomar decisión
Calcular cociente de variación cuadrada y frecuencia esperada
ZONA
RURAL
fe
−
ATRIBUTO
ZONA
RURAL
fo
Muy bueno
Bueno
Regular
Total . . .
11
8
6
25
7.8
12.0
5.3
25.0
1.36
1.33
0.11
2.80
 2 = 0.93 + 2.80 = 3.73
La hipótesis nula se acepta
74
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística Aplicada a los
Negocios y la Economía. México: McGrawHill
David M. Levine, Timothy C. Krehbiel, Mark L. Berenson. 2006. Estadística para 75
Administración. (4° edición). Naucalpan de Juárez, México.: Pearson Prentice Hall