Estadística Administrativa II
2014-3
Análisis de Correlación
Características
› Técnica para estudiar la relación entre dos variables
› Una independiente y una dependiente
› Los resultados de la dependiente depende de los valores
que tome la independiente
› Ideal para trabajar con pronósticos
› Se utilizan valores reales y valores estimados
Análisis de Correlación
Estudio de la relación entre variables
Análisis inicial
Análisis de correlación
› Gráfico de dispersión
– Variable independiente en el eje X
– Variable dependiente en el eje Y
› Coeficiente de correlación
– Medida de la fuerza de relación lineal entre dos
variables
Características del coeficiente de Correlación
1. Muestra la dirección y fuerza de la relación lineal (recta)
entre dos variables en escala de intervalo o razón.
2. El coeficiente de correlación de la muestra se identifica
por la letra minúscula  (también llamado r-Pearson)
3. Varía desde -1 hasta 1, inclusive.
4. Un valor cercano a 0 indica que hay poca asociación
entre las variables.
5. Un valor cercano a 1 indica una asociación directa o
positiva entre las variables.
6. Un valor cercano a -1 indica una asociación inversa o
negativa entre las variables.
Coeficiente de Correlación
› Correlación positiva perfecta
› Correlación negativa perfecta
› Si la r de Pearson es 0; indica que no hay relación lineal
entre ambas variables
Coeficiente de Correlación
› El valor resultante de la correlación se identifica de
acuerdo a su nivel de fuerza. Mientras más se aleja del
cero, la correlación pasa de débil a fuerte.
Coeficiente de Correlación
=
›
›
›
›
›
›
›
− −
 − 1  
 = Cada dato de la variable independiente
 = Cada dato de la variable dependiente
= Media aritmética de la variable independiente
= Media aritmética de la variable dependiente
 = Tamaño de la muestra
 = Desviación estándar de la variable independiente
 = Desviación estándar de la variable dependiente
Ejemplo . . .
En la empresa Sara se venden unidades de aire
acondicionado; se ha observado que a mayor cantidad de
llamadas de los vendedores durante el mes, mayor
cantidad de compra de unidades de aire acondicionado.
Se tomó una muestra de las ventas realizadas por 10 de
los vendedores de planta y se quiere comparar la cantidad
de llamadas realizadas durante el mes de Abril y las ventas
facturadas.
Los resultados fueron los siguientes:
. . . Ejemplo
AGENTE
Tomás García
José Girón
Brian Velásquez
Gregorio Figueroa
Susana Vides
Carlos Ramírez
Ricardo Noriega
Miguel Godoy
Marcos Reyes
Sonia Guzmán
UNIDADES
VENDIDAS
20
30
40
60
20
40
30
60
10
30
10
40
20
40
20
50
20
30
30
70
LLAMADAS
Empíricamente se puede observar
los que hicieron llamadas vendieron
más aires acondicionados.
Si por cada llamada, algunos
clientes compraron unidades de aire
acondicionado, significa que la
variable independiente son las
llamadas.
A las llamadas telefónicas se le asignará la variable X y a las
unidades vendidas la variable Y.
. . . Ejemplo
UNIDADES
LLAMADAS
AGENTE
VENDIDAS
X
Y
Tomás García
20
30
José Girón
40
60
Brian Velásquez
20
40
Gregorio Figueroa
30
60
Susana Vides
10
30
Carlos Ramírez
10
40
Ricardo Noriega
20
40
Miguel Godoy
20
50
Marcos Reyes
20
30
Sonia Guzmán
30
70
Media Aritmética
 = 22
 = 46
 = 10
22
45
 = 22
 = 46
. . . Ejemplo
UNIDADES
LLAMADAS
AGENTE
VENDIDAS
X
Y
Tomás García
20
30
José Girón
40
60
Brian Velásquez
20
40
Gregorio Figueroa
30
60
Susana Vides
10
30
Carlos Ramírez
10
40
Ricardo Noriega
20
40
Miguel Godoy
20
50
Marcos Reyes
20
30
Sonia Guzmán
30
70
Media Aritmética
22
 =
−
−1
 =
−
−1
−
-2
18
-2
8
-12
-12
-2
-2
-2
8
 −
-15
15
-5
15
-15
-5
-5
5
-15
25
45 Total de Sumas
−
 −
30
270
10
120
180
60
10
-10
30
200
4
324
4
64
144
144
4
4
4
64
225
225
25
225
225
25
25
25
225
625
900
760
1850
−  −
=
760
= 84.44 = 9.19
10 − 1
=
1850
= 205.56 = 14.34
10 − 1
. . . Ejemplo
=
− −
900
=
= 0.759
 − 1  
10 − 1 9.19 14.34
0.759 indica una correlación positiva fuerte. Se observa una
relación directa entre las llamadas realizadas y las ventas de
unidades de aire acondicionado vendidos.
Correlación y Causa
› Si existe relación fuerte entre una variable X y una
variable Y, no se puede suponer que la variable X causó
un efecto en la variable Y; a esto se le llama relación
espuria.
En el ejemplo anterior; no se puede suponer que las llamadas a los
clientes fue lo que incrementó las ventas y tampoco asumir que si se
hubieran realizado más llamadas se hubiera producido más ventas.
Solamente se concluyó que existe una relación fuerte entre ambas
variables.
Coeficiente de
Determinación
Proporción de la variación total en la variable
dependiente Y que se explica, o contabiliza, por la
variación en la variable
dependiente X
Coeficiente de Determinación
› Si existe una relación fuerte entre dos variables, el
cambio en la variable independiente, genera una reacción
en la dependiente.
› Un aumento en la variable X produce un aumento en la
variable Y.
› Una disminución en la variable X produce una
disminución en la variable Y.
› Proporción para interpretar el Coeficiente de Correlación
o r-Pearson
Coeficiente de determinación
› Proporción de la variación total en la variable
dependiente Y que se explica, o contabiliza, por la
variación en la variable dependiente X.
› Cálculo: Elevar al cuadrado el coeficiente de correlación

Ejemplo . . .
La empresa Sara determinó que existe una fuerte relación
entre las llamadas realizadas por 10 empleados durante el
mes de Abril y las ventas de unidades de aire
acondicionado facturadas, debido a que su coeficiente de
correlación resultó ser 0.759.
Cuál es la proporción de las ventas que tienen relación con
las llamadas
 = 0.759  = 0.576
R:// La relación de las ventas con la llamadas es el 58%.
Prueba de la importancia del
coeficiente de correlación
Siempre se espera que la correlación lineal
entre dos variables sea igual a 0.
Prueba de la importancia del coeficiente de
correlación
› Para determinar si la correlación fuerte entre dos
variables produce incremento o disminución se recurre a
la prueba de Hipótesis.
› 0 :  = 0
(correlación de la población igual a 0)
›  :  ≠ 0
(correlación de la población diferente a 0)
› Estadístico de prueba:
distribución t
› Prueba t para el coeficiente de correlación:
 −2
=
1−
Ejemplo . . .
La empresa Sara determinó que existe una fuerte relación
entre las llamadas realizadas por 10 empleados durante el
mes de Abril y las ventas de unidades de aire
acondicionado facturadas, debido a que su coeficiente de
correlación resultó ser 0.759.
Sin embargo se supone que el coeficiente de correlación
debería ser 0. Es hora de probar esa hipótesis con un 95%
de confiabilidad.
Los datos obtenidos solo son una muestra de 10 de los
empleados
. . . Ejemplo
› 0 :  = 0
 :  ≠ 0
›  = 0.05
› Estadístico de prueba:  =
› Regla de decisión
2 
 = 0.05
 = 8
 = 2.306
 −
1− 2
. . . Ejemplo
› Toma de decisión
=
 −2
1−
=
0.759 10 − 2
1 − 0.759
0.759 8
2.1468
=
=
= 3.297
0.651
0.4239
› La hipótesis nula no se acepta.
› hay una correlación entre el numero de llamadas de
ventas hechas y el numero de unidades de aire
acondicionado vendidas en la población de vendedores
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística
Aplicada a los Negocios y la Economía. México: McGrawHill
24