Estadística Administrativa II
2014-3
Regresión lineal y correlación
Análisis de Regresión
Estudio de la relación entre variables
Grupo de técnicas para medir la
asociación entre dos variables.
Análisis de Regresión
› Ecuación de regresión lineal: Ecuación que expresa la
relación lineal entre dos variables.
› Es la formalización de la relación entre dos variables
› Utilizada para estimar el valor de la variable dependiente Y
con base en un valor seleccionado de la variable
independiente X
› Técnica para desarrollar la ecuación de la regresión lineal
› Principio de los mínimos cuadrados, determina una
ecuación de regresión al minimizar la suma de los
cuadrados de las distancias verticales entre los valores
reales de Y y los valores pronosticados de Y.
Ecuación de Regresión
¿Cuál es la recta que mejor representa la dispersión de los
datos de dos muestras en la que una variable es
independiente (X) y la otra es dependiente (Y)?
Ecuación de regresión lineal
› Forma general de la ecuación
 =  + 
› Pendiente de la regresión

=

› Intersección con el eje Y
 =  − 
Ejemplo . . .
La empresa Sara determinó que
existe una fuerte relación entre las
llamadas realizadas por 10
empleados durante el mes de Abril
y las ventas de unidades de aire
acondicionado facturadas, debido
a que su coeficiente de correlación
resultó ser 0.759.
AGENTE
Tomás García
José Girón
Brian Velásquez
Gregorio Figueroa
Susana Vides
Carlos Ramírez
Ricardo Noriega
Miguel Godoy
Marcos Reyes
Sonia Guzmán
LLAMADAS
X
20
40
20
30
10
10
20
20
20
30
UNIDADES
VENDIDAS
Y
30
60
40
60
30
40
40
50
30
70
Con los datos obtenidos,
determinar la ecuación de la
regresión y estimar cuántas
Media Aritmética
22
45
unidades de aire acondicionado se
tendrían que vender cuando un
+ Gráfica de regresión lineal
vendedor hace 20 llamadas.
. . . Ejemplo
 = 0.759
 = 10
 = 22
 = 45
 = 9.19
 = 14.34

14.34
 =  = 0.759

9.19
 = 1.1843
 =  −  = 45 − 1.1843 22
 = 18.945
 = .  + . 
 = 20 ≡  = 18.945 + 1.1843 20 = 42.63
Si un agente vendedor hace 20 llamadas, se podría esperar
que vendiera 43 unidades de aire acondicionado en el mes
. . . Ejemplo
 = .  + . 
AGENTE
Tomás García
José Girón
Brian Velásquez
Gregorio Figueroa
Susana Vides
Carlos Ramírez
Ricardo Noriega
Miguel Godoy
Marcos Reyes
Sonia Guzmán
LLAMADAS
(X)
20
40
20
30
10
10
20
20
20
30

42.63
66.32
42.63
54.47
30.79
30.79
42.63
42.63
42.63
54.47
Elegir que se harán 10 y 40 llamadas, se hace el cálculo en la
ecuación y se traza la recta con estos 2 puntos.
Error estándar de
estimación
No todos los puntos de una muestra se ubican
sobre la línea de regresión
Error estándar de regresión
› Si todos los puntos estuvieran en la recta, no habría error
al estimar el valor de la variable Y.
› Si todos los puntos estuvieran sobre la recta, significaría
que se tiene 100% de precisión.
› Al no haber diferencia entre los valores observados y los
anticipados, no hay error en este estimado.
› Es necesaria una medida para describir cuan preciso es
el pronostico de Y con base en X, o a la inversa, que tan
inexacta puede ser la estimación.
Error estándar de estimación
› Medida de dispersión de los valores observados respecto
de la recta de regresión.
∙ =
−
−2
2
› Si ∙ es pequeño, los datos están relativamente
cercanos a la recta de regresión. La ecuación de
regresión predice Y con poco error.
› Si ∙ es grande, los datos están muy dispersos
respecto a la recta de regresión, la ecuación de regresión
no proporciona una estimación precisa de Y.
Ejemplo . . .
La gerente de venta de Sara
determinó que la ecuación de
regresión por mínimos
cuadrados era  = 18.9476
+ 1.1842, donde  se refiere al
número anticipado de unidades
de aire acondicionado vendidas
y X al número de llamadas de
ventas. Determinar el error
estándar de estimación como
una medida de qué tan bien se
ajustan los valores a la recta de
regresión.
UNIDADES
VENDIDAS
AGENTE
Y
30
Tomás García
60
José Girón
40
Brian Velásquez
60
Gregorio Figueroa
30
Susana Vides
40
Carlos Ramírez
40
Ricardo Noriega
50
Miguel Godoy
30
Marcos Reyes
70
Sonia Guzmán

42.63
66.32
42.63
54.47
30.79
30.79
42.63
42.63
42.63
54.47
. . . Ejemplo
UNIDADES
AGENTE
VENDIDAS
Y
Tomás García
30
José Girón
60
Brian Velásquez
40
Gregorio Figueroa
60
Susana Vides
30
Carlos Ramírez
40
Ricardo Noriega
40
Miguel Godoy
50
Marcos Reyes
30
Sonia Guzmán
70

42.63
66.32
42.63
54.47
30.79
30.79
42.63
42.63
42.63
54.47
 −
2
159.54
39.90
6.92
30.54
0.62
84.86
6.92
54.30
159.54
241.06
784.21
−
−2
∙ =
=
784.21
10 − 2
= 98.02625
= 9.9
2
Intervalo de confianza
Error estándar y coeficiente de determinación son 2 estadísticos que
proporcionan una evaluación general de la capacidad de una
ecuación para predecir una variable dependiente.
 ±  ∗ ∙
1
− 2
+

− 2
Resultado para toda la muestra
Intervalo de confianza
› Intervalo de confianza para la Media de Y, dada X
1
− 2
 ± (∙ )
+

− 2
 ∶    ú   
 ∶  
 ∶  é  
 ∶ ñ  
∙ :  á  ó
 ∶      − 2   
Ejemplo . . .
La gerente de venta de Sara
determinó que la ecuación de
regresión por mínimos
cuadrados es  = 18.9476
+ 1.1842.
AGENTE
Tomás García
José Girón
Brian Velásquez
Gregorio Figueroa
Susana Vides
Carlos Ramírez
Ricardo Noriega
Calcular el intervalo de
Miguel Godoy
confianza del 95% para los
Marcos Reyes
agentes que hacen 25 llamadas.Sonia Guzmán
LLAMADAS
(X)
20
40
20
30
10
10
20
20
20
30
22
( − )  − 
-2
18
-2
8
-12
-12
-2
-2
-2
8
2
4
324
4
64
144
144
4
4
4
64
760
. . . Ejemplo
› Determinar el valor de  para el valor de la media de las
llamadas
 = 18.945 + 1.1843
= 18.945 + 1.1843 25
= 48.55
› Determinar el valor de t al 95%
 = 0.05 2 
 = 10 − 2 = 8
48.55 ± (2.306) 9.9
1
25 − 22
+
10
760
2
. . . Ejemplo
Intervalo de confianza
48.55 ± 2.306 9.9
1
25 − 22
+
10
760
2
=
48.55 ± 22.8294 0.1118 =
48.55 − 7.63 = 40.92
48.55 ± 7.63 =
48.55 + 7.63 = 56.18
Si se hacen 25 llamadas, se podría esperar que se
concretaran las ventas de 41 y 56 unidades de aire
acondicionado.
Intervalo de predicción
Para establecer la predicción de un dato específico de la muestra y
su comportamiento en el futuro.
 ±  ∗ ∙
1
− 2
1+ +

− 2
Resultado individual de un elemento de la muestra
Ejemplo . . .
La ecuación de regresión por
mínimos cuadrados es
AGENTE
Tomás García
José Girón
Brian Velásquez
Gregorio Figueroa
Susana Vides
Calcular el intervalo de
Carlos Ramírez
confianza del 95% para el
Ricardo Noriega
pronóstico de ventas del agenteMiguel Godoy
Marcos Reyes
Ricardo Noriega al hacer 25
Sonia Guzmán
 = 18.9476 + 1.1842.
llamadas.
LLAMADAS
(X)
20
40
20
30
10
10
20
20
20
30
22
( − )  − 
-2
18
-2
8
-12
-12
-2
-2
-2
8
2
4
324
4
64
144
144
4
4
4
64
760
. . . Ejemplo
› Determinar el valor de  para el valor de la media de las
llamadas
 = 18.945 + 1.1843
= 18.945 + 1.1843 25
= 48.55
› Determinar el valor de t al 95%
 = 0.05 2 
 = 10 − 2 = 8
48.55 ± (2.306) 9.9
1
25 − 22
1+
+
10
760
2
. . . Ejemplo
Intervalo de predicción
48.55 ± 2.306 9.9
1
25 − 22
1+
+
10
760
2
=
48.55 ± 22.8294 1.1118 =
48.55 − 24.07 = 24.48
48.55 ± 24.07 =
48.55 + 24.07 = 72.63
Si se hacen 25 llamadas, se podría esperar que se
concretaran las ventas de 41 y 56 unidades de aire
acondicionado.
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística
Aplicada a los Negocios y la Economía. México: McGrawHill
23
Descargar

Document