Estadística Administrativa II
2014-3
Análisis de Varianza
Distribución F
› Prueba de dos muestras con varianzas iguales
› Comparación de varias medias poblacionales en forma
simultánea
› Análisis de Varianza (ANOVA)
› Distribución normal
› Datos en escala de intervalos
   
á:
   
Distribución F
Características
› Distribución continua
› Distribución no negativa
› Sesgo positivo
› Asintótica
La hipótesis se prueba a través de las varianzas
Comparación de dos
varianzas poblacionales
Estadístico de prueba para comparar
dos varianzas
Análisis para 2 colas
=
0 : 12 = 22
 : 12 ≠ 22
2
1
2
2
Ejemplo 1 . . .
Lammers Co. ofrece servicio de limusina de Toledo, Ohio al
aeropuerto metropolitano de Detroit; el recorrido se hace por
2 rutas; la carretera 25 y la autopista I-75. Se desea estudiar
el tiempo que tardaría en conducir al aeropuerto por cada
una de las rutas. Usando el nivel de significancia de 0.10.
¿Hay alguna diferencia entre las variaciones de los tiempos
de manejo por las dos rutas.
El tiempo medio por la carretera 25 es de 58.29 minutos y por
la autopista I-75 es de 59 minutos. Los tiempos de variación
de la muestra entre cada recorrido es una desviación
estándar de 8.9947’ para la carretera 25 y 4.3753 para la
autopista I-75.
. . . Ejemplo 1
La distancia por la autopista I-75 es más larga que por la
carretera 24. Es importante que el servicio sea tanto puntual
como consistente, por lo que se realizará una prueba
estadística para determinar si existe una diferencia en las
variaciones entre ambas rutas. Para lo cual se tomó una
muestra de 7 recorridos por la carretera 25 y 8 por la
autopista I-75.
›
2
0 : 25
=
2
−75
2
2
 : 25
≠ −75
›  = 0.10
=
2
1
2
2
. . . Ejemplo 1
› Regla de decisión
2 colas
 = 0.10
1 = 7
2 = 8
1 = 6
2 = 7
         ó
 = 3.87
.
Población 1 = C-25
. . Ejemplo 1
Población 2 = I-75
› Toma de decisión con los datos de la muestra
1 = 8.9947
2 = 4.3753
1 = 7
2 = 8
12
8.9947
= 2=
4.3753

2
2
= 4.23
La hipótesis nula no se acepta.
Se concluye que existe una diferencia entre las variaciones
de los tiempos recorridos por las dos rutas.
Comparación de dos
varianzas poblacionales
Estadístico de prueba para comparar
dos varianzas
Análisis para 1 cola
=
0 : 12 > 22
 : 12 ≤ 22
2
1
2
2
Ejemplo . . .
Steele Electric Products, ensambla componentes electricos
para teléfonos celulares. Durante los últimos 10 días Mark
Nagy ha promediado 9 productos rechazados, con una
desviación estándar de 2 rechazos por día. Debbie Richmond
promedio 8.5 productos rechazados, con una desviación
estándar de 1.5 rechazos durante el mismo periodo. Con un
nivel de significancia de 0.05, ¿podría concluir que hay mas
variación en el numero de productos rechazados por día en la
muestra de Mark?
 = 10  
ó 1
ó 2
1 = 2
2 = 1.5
1 = 9
2 = 8.5
. . . Ejemplo
› 0 : 12 < 22
 : 12 ≥ 22
›  = 0.05
› =
12
22
› Regla de decisión
1 
1 = 10 ≡ 1 = 9
2 = 10 ≡ 2 = 9
 = 0.05
 = 3.18
. . . Ejemplo
› Con los datos de la muestra tomar la decisión
12
2 2
= 2=
= 1.78
2
1.5
2
1.78 < 3.18
La hipótesis nula no se rechaza
La variación es la misma para ambos empleados
Análisis de varianza
(ANOVA)
Múltiples medias poblacionales
0 : 12 > 22
 : 12 ≤ 22
=
2
1
2
2
ANOVA
ANOVA se desarrolló para aplicaciones en agricultura, y aún
se emplean muchos de los términos relacionados con ese
contexto. En particular, con el termino tratamiento se
identifican las poblaciones diferentes que se examinan.
Por ejemplo, el tratamiento se refiere a cómo una extensión
de terreno se trató con un tipo particular de fertilizante.
Características de ANOVA
› Poblaciones distribuidas normalmente
› Desviación estándar iguales
› Poblaciones independientes
› Posibilidad de error tipo I si se utiliza la comparación de
medias poblacionales
Cálculos ANOVA
1. Media Global
Calcular la media de todas las muestras extraídas
( )

2. Variación total
Resta de cada dato y la media global
( −  ), elevar al cuadrado y sumar los resultados
3. Variación de tratamiento
Resta de cada media de la muestra y la media
global, una por cada dato, elevar al cuadrado y
sumar los resultados
 − 
  − 
4. Variación aleatoria
Resta de cada dato a su respectiva media, elevar al
cuadrado y sumar los resultados
2
 − 
2
2
Cálculos ANOVA
5. Varianza 1
12
ó  
=
 − 1
6. Varianza 2
22
ó 
=
ñ   − 
7. Distribución F
2   
= 2=
 

Ejemplo 1 . . .
Joan Kulman es la gerente de un centro financiero y desea
comparar la productividad de los empleados en su atención al
cliente, Toma de base 3 empleados y revisa el número de
clientes que atendieron durante 4 días. Los resultados de las
muestras son:
LOBO
55
54
59
56
BLANCO
66
76
67
71
COREA
47
51
46
48
Media global
55 + 54 + 59 + 56 + 66 + 76 + 67 + 71 + 47 + 51 + 46 + 48
 =
= 58
12
. . . Ejemplo 1
LOBO
55
54
59
56
56
Variación Total
 − 
2
= 55 − 58
2
+ 54 − 58
2
+ 59 − 58
BLANCO
66
76
67
71
70
2
COREA
47
51
46
48
48
+ 56 − 58
+ 66 − 58
2
+ 76 − 58
2
+ 67 − 58
2
+ 71 − 58
+ 47 − 58
= 1082
2
+ 51 − 58
2
+ 46 − 58
2
+ 48 − 58
2
2
Variación Tratamiento
  − 
2
= 4 56 − 58
2
+ 4 70 − 58
= 992
2
+ 4 48 − 58
2
2
. . . Ejemplo 1
LOBO
55
54
59
56
56
Variación Aleatoria
 − 
2
= 55 − 56
2
+ 54 − 56
2
+ 59 − 56
BLANCO
66
76
67
71
70
2
COREA
47
51
46
48
48
+ 56 − 56
+ 66 − 70
2
+ 76 − 70
2
+ 67 − 70
2
+ 71 − 70
+ 47 − 48
= 90
2
+ 51 − 48
2
+ 46 − 48
2
+ 48 − 48
2
2
Varianzas
2
992
992
=
=
= 496
3−1
2
496
=
= 49.6
10
2
90
90
=
=
= 10
12 − 3
9
2
Prueba de hipótesis
ANOVA
Ejemplo . . .
Metroya es una empresa de investigación de mercados
que analizó el comportamiento de los pasajeros de 4
aerolíneas. Diseñó una encuesta valorada en 100 puntos
para medir la satisfacción de los clientes. Con un nivel de
significancia de 0.01 procesar las 4 muestras obtenidas.
Eastern
94
90
85
80
TWA
75
68
77
83
88
TACA
70
73
76
78
80
68
65
AA
68
70
72
65
74
65
Determinar si hay alguna
diferencia en el nivel de
satisfacción medio entre
las 4 aerolíneas
. . . Ejemplo
› 0 : 1 = 2 = 3 = 4
 :      
›  = 0.01
› Estadístico  =
12
22
Eastern
94
90
85
80
TWA
75
68
77
83
88
› Regla de decisión
2 colas
 = 0.01
Grados de libertad del numerador:
muestras – 1 = 4 – 1 = 3
Grados de libertad del denominador:
Total global – tratamientos = 22 – 4 = 18
TACA
70
73
76
78
80
68
65
AA
68
70
72
65
74
65
 = 3
 = 18
. . . Ejemplo
› Regla de decisión
2 colas
 = 0.01
 = 5.09
 = 3
 = 18
› Toma de decisión
Media global
1664
 =
= 75.64
22
Media de tratamientos
Eastern
94
90
85
80
Eastern
87.3
TWA
75
68
77
83
88
TACA
70
73
76
78
80
68
65
Suma global =
TWA
78.2
TACA
72.9
AA
68
70
72
65
74
65
1664
AA
69.0
. . . Ejemplo
Variación Total
 = 1485.09
NOTA
Eastern
94
90
85
80
TWA
75
68
77
83
88
TACA
70
73
76
78
80
68
65
AA
68
70
72
65
74
65
Variación total :
 − 
2
337.09
206.21
87.61
19.01
0.41
58.37
1.85
54.17
152.77
31.81
6.97
0.13
5.57
19.01
58.37
113.21
58.37
31.81
13.25
113.21
2.69
113.21
1,485.09
Variación Tratamiento
 = 75.64
Eastern
87.3
TWA
78.2
Descripción
Media Tratamiento
Media global
Tamaño muestra
  − 
2
TACA
72.9
AA
69.0
Eastern
87.3
75.64
4
TWA
78.2
75.64
5
TACA
72.9
75.64
7
AA
69.0
75.64
6
539
33
54
265
 = 890.68
. . . Ejemplo
NOTA
Variación Aleatoria
Eastern
 = 75.64
TWA
Eastern
87.3
TWA
78.2
TACA
72.9
AA
69.0
TACA
 = 594.4
AA

94
87.3
90
87.3
85
87.3
80
87.3
75
78.2
68
78.2
77
78.2
83
78.2
88
78.2
70
72.9
73
72.9
76
72.9
78
72.9
80
72.9
68
72.9
65
72.9
68
69.0
70
69.0
72
69.0
65
69.0
74
69.0
65
69.0
Variación aleatoria
 − 
2
45.6
7.6
5.1
52.6
10.2
104.0
1.4
23.0
96.0
8.2
0.0
9.9
26.4
51.0
23.6
61.7
1.0
1.0
9.0
16.0
25.0
16.0
594.4
. . . Ejemplo
Varianza 1
2

890.68 890.68
=
=
=
= 296.9
 − 1
4−1
3
Varianza 2
2

594.4
594
=
=
=
= 33.0
ñ  −  22 − 4
18
Distribución F
296.9
=
= 8.99
33
 ℎó    .
      4  
 
Tratamiento e inferencia
sobre pares de medias
poblacionales
Distribución t
Tratamiento e inferencia sobre pares de
medias poblacionales
› Análisis después de que una hipótesis ha sido rechazada
o no aceptada.
› Se tiene sospecha que solo algunas de las muestras
afectan el resultado
› Análisis sobre dos muestras a la vez
› Utilización de intervalos
› Error muestral calculado en base de la distribución
t
Intervalo de confianza sobre pares de medias
 = 1 − 2 ± 
2
1
1
+
1 2
1 ≡      
2 ≡      
 ≡ í   
2 ≡    ó 
1 ≡ ñ     
2 ≡ ñ     
 =   − 
Ejemplo . . .
Metroya rechazó la hipótesis de que las 4 muestras son
iguales. Se va a hacer una revisión de la muestras de
Eastern y AA para determinar si los clientes de estas
empresas inciden en los resultados obtenidos. Calcular el
intervalo de confianza utilizando un nivel de confianza del
95%
1 = 87.3
2 = 69.0
 = 22
 = 4
 = 22 − 4 = 18
1 = 4
2 = 6
 = 2.101
 = 0.05
2 
. . . Ejemplo
1 = 87.3
2 = 69.0
1 = 4
2 = 6
 = 2.101
2 = 33.02
1 − 2 ± 
2
1
1
+
=
1 2
1 1
87.3 − 69.0 ± 2.101
+ =
4 6
18.3 ± 2.101(3.709)
95%
18.3 − 7.793 = 10.46
=
18.3 + 7.793 = 26.04
Ambas están al mismo lado de la curva. Con un 95% de
confianza las medias varían significativamente.
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística
Aplicada a los Negocios y la Economía. México: McGrawHill
33
Descargar

Análisis para 2 colas