REGRECION LINEAL
SIMPLE, MULTIPLE Y
CORRELACION
REGRECION LINEAL
SIMPLE
INTRODUCCIÓN:
La regresión y los análisis de correlación nos
muestran como determinar tanto la naturaleza
como la fuerza de una relación entre dos
variables
 En el análisis de regresión desarrollaremos una
ecuación de estimación, esto es, una formula
matemática que relaciona las variables conocidas
con la variable desconocida. Entonces podemos
aplicar el análisis de correlación para determinar
el grado de en el que están relacionadas las
variables. El análisis de correlación, entonces,
nos dice qué tan bien están relacionadas las
variables. El análisis de correlación, entonces,
nos dice que tan bien la ecuación de estimación
realmente describe la relación.

ANÁLISIS ESTADÍSTICO:
En el estudio de la relación funcional entre dos
variables poblacionales, una variable X, llamada
independiente, explicativa o de predicción y una
variable Y, llamada dependiente o variable
respuesta, presenta la siguiente notación:
Y=a+bX+ε
 Donde:

a es el valor de la ordenada donde la línea de
regresión se intercepta con el eje Y.
 b es el coeficiente de regresión poblacional (pendiente
de la línea recta)
 ε es el error

SUPOSICIONES DE LA REGRESIÓN LINEAL
Los valores de la variable independiente X son
fijos, medidos sin error.
 La variable Y es aleatoria
 Para cada valor de X, existe una distribución
normal de valores de Y (subpoblaciones Y)
 Las variancias de las subpoblaciones Y son todas
iguales.
 Todas las medias de las subpoblaciones de Y
están sobre la recta.
 Los valores de Y están normalmente distribuidos
y son estadísticamente independientes.

ESTIMACIÓN

DE LA
ECUACIÓN
Consiste en determinar los valores de "a" y "b " a partir de
la muestra, es decir, encontrar los valores de a y b con los
datos observados de la muestra. El método de estimación es
el de Mínimos Cuadrados, mediante el cual se obtiene:



Luego, la ecuación de regresión muestral estimada es:
Que se interpreta como:
 a es el estimador de α
 Es el valor estimado de la variable Y cuando la
variable X = 0
 b es el estimador de β , es el coeficiente de
regresión
Está expresado en las mismas unidades de Y por cada unidad
de X. Indica el número de unidades en que varía Y cuando se
produce un cambio, en una unidad, en X (pendiente de la recta
de regresión).Un valor negativo de b sería interpretado como
la magnitud del decremento en Y por cada unidad de aumento
en X.
PROBLEMA EJEMPLO:


Los datos de la siguiente tabla representan las estaturas
(X, cm) y los pesos (Y, kg) de una muestra de 12 hombres
adultos. Para cada estatura fijada previamente se observó
el peso de una persona seleccionada de entre el grupo con
dicha estatura, resultando:
X
152
155
152
155
157
152
157
165
162
178
183
178
Y
50
61.5
54.5
57.5
63.5
59
61
72
66
72
84
82
Con estos datos vamos a plantear una ecuación de
regresión simple que nos permita pronosticar los pesos
conociendo las tallas. Utilizaremos a = 0.05, y
contrastaremos nuestra hipótesis con la prueba F.
DESARROLLO DEL PROBLEMA:

Representación matemática y gráfica de los datos:
HIPÓTESIS:


HO: No hay relación entre la variable peso y la variable estatura.
HA: Hay relación entre la variable peso y la variable estatura.
Fuente de
Variación
Grados de
Libertad
Suma de
Cuadrados
Cuadrados
Medios
Estadístico
F
Debido a la
Regresión
1
1061.1
1061.1
73.08
Error
10
145.2
14.5
Total
11
1206.3

Se obtiene un valor F = 73.08 > 4.96, con lo cual se rechaza la hipótesis nula y
aceptamos que la variable estatura está relacionada con la variable peso con
un 95% de confianza.
De acuerdo al desarrollo matemático hemos obtenido los siguientes cálculos:

Lo que nos permite obtener los coeficientes a y b.



b = 1223 / 1409.667 = 0.8676
a = 65.25 – (0.8676) (162.167) = -75.446
INTERPRETACIÓN:

La ecuación de regresión estimada es: Ŷ = -75.446+0.8676X





Coeficiente de correlación: R= 0.9379
Coeficiente de determinación: R²=0.8796
El valor de b = 0.8676 indica el incremento del peso en
kilogramos, en promedio, por cada centímetro de aumento
en la estatura de los hombres adultos.
El valor de a, no tiene interpretación práctica en el
ejemplo, se interpretaría como el valor obtenido, en
promedio, para el peso Y, cuando la estatura es 0.
Utilizando la ecuación de regresión para estimar o
predecir valores de la variable Y: Para una talla de 180 se
obtiene un peso de 80.7 kg.
¿Cuánto se espera que pese (en promedio) una persona
que mide 1.60 m?
 Sustituyendo el valor de interés en la ecuación:
Ŷ = -75.446+0.8676X
 Se obtiene: Ŷ = -75.446+0.8676(160) = 63.37 kg
CONCLUSIÓN:
La ecuación de Regresión Lineal estimada para
las variables estatura y peso muestran, de
acuerdo a la prueba F, relación.
 Esta relación se ha estimado en un R = 93.7, que
indica una fuerte relación positiva.
 Además si consideramos el coeficiente de
determinación R² = 87.9 podemos indicar que el
87.9% de las variaciones que ocurren en el peso
se explicarían por las variaciones en la variable
estatura.

REGRECION LINEAL
MULTIPLE
Este tipo se presenta cuando dos o más variables
independientes influyen sobre una variable
dependiente. Ejemplo: Y = f(x, w, z).
 Por ejemplo: Podría ser una regresión de tipo
múltiple:



Una Empresa de desarrollo de software establece
relacionar sus Ventas en función del numero de
pedidos de los tipos de software que desarrolla
(Sistemas, Educativos y Automatizaciones
Empresariales), para atender 10 proyectos en el
presente año.
En la Tabla representa Y (Ventas miles de S/.) e
X (Nº pedidos de sistemas), W (Nº de pedidos de
Aplicaciones Educativas) y Z (Nº de pedidos de
Automatizaciones empresariales).

Y
440 455 470 510 506 480 460 500 490 450
X
50
38
44
W
105 140 110 130 125 115 100 103 118
98
Z
75
74
40
68
35
70
45
64
51
67
55
72
53
70
48
73
69
Objetivo: Se presentara primero el análisis de
regresión múltiple al desarrollar y explicar el uso
de la ecuación de regresión múltiple, así como el
error estándar múltiple de estimación. Después
se medirá la fuerza de la relación entre las
variables independientes, utilizando los
coeficientes múltiples de determinación.
ANÁLISIS DE



REGRESIÓN MÚLTIPLE:
Dispone de una ecuación con dos variables independientes
adicionales:
Se puede ampliar para cualquier número "m" de variables
independientes:
Para poder resolver y obtener y en una ecuación de
regresión múltiple el cálculo se presenta muy tediosa
porque se tiene atender 3 ecuaciones que se generan por el
método de mínimo de cuadrados:
ERROR
ESTÁNDAR DE LA
MÚLTIPLE:

REGRESIÓN
Es una medida de dispersión la estimación se hace más
precisa conforme el grado de dispersión alrededor del
plano de regresión se hace mas pequeño. Para medirla
se utiliza la formula:
Y : Valores observados en la muestra
 Ŷ: Valores estimados a partir a partir de la ecuación
de regresión
 n : Número de datos
 m : Número de variables independientes

APLICACIÓN:
Mediante el siguiente problema podremos
ilustrar la aplicación de Regresión Multiple:
 En la Facultad de Ingeniería de Sistemas y
Computo de la Universidad "Inca Garcilaso de la
Vega" se quiere entender los factores de
aprendizaje de los alumnos que cursan la
asignatura de PHP, para lo cual se escoge al azar
una muestra de 15 alumnos y ellos registran
notas promedios en las asignaturas de
Algoritmos, Base de Datos y Programación como
se muestran en el siguiente cuadro.

Alumno
PHP
Algoritmos
Base de Programación
Datos
1
13
15
15
13
2
13
14
13
12
3
13
16
13
14
4
15
20
14
16
5
16
18
18
17
6
15
16
17
15
7
12
13
15
11
8
13
16
14
15
9
13
15
14
13
10
13
14
13
10
11
11
12
12
10
12
14
16
11
14
13
15
17
16
15
14
15
19
14
16
15
15
13
15
10


Lo que buscamos es construir un modelo para
determinar la dependencia que exista de
aprendizaje reflejada en las notas de la
asignatura de PHP, conociendo las notas de las
asignaturas Algoritmos, Base de Datos y
Programación.
Se presentara la siguiente ecuación a resolver:


Utilizando las formulas de las ecuaciones normales a
los datos obtendremos los coeficientes de regresión o
utilizando Regresión de Análisis de datos, en la Hoja
de Calculo de Excel podemos calcular también los
coeficientes de regresión:
Por lo tanto podemos construir la ecuación de
regresión que buscamos:
CONCLUSIONES:

El 69.70% del aprendizaje del Curso de PHP
puede ser explicado mediante las notas obtenidas
por las asignaturas de Algoritmos, Base de Datos
y Programación.
CORRELACION
ANÁLISIS DE



CORRELACIÓN SIMPLE:
Sirve para medir la bondad del ajuste de una
recta de regresión a un conjunto de
observaciones, en el caso de tener una variable
dependiente y una independiente.
Dicha medida nos la da el coeficiente de
determinación R2 , que verifica 0 ≤ R2 ≤ 1.
Cuanto más cercano a uno sea su valor mejor
será el ajuste, y tanto peor cuanto más cercano a
cero.
Se calcula como el cuadrado del coeficiente de
correlación lineal de Pearson


El coeficiente de correlación lineal de
Pearson (se denota r ó ρ) es una medida de
asociación lineal entre dos variables aleatorias
X e Y:
r = ρ=Cov(X,Y)
SxSy
Se verifica que –1 ≤ r ≤ 1 y podemos decir que:

" Si r = -1, existe una relación lineal negativa
perfecta entre X e Y.

" Si r = 1, existe una relación lineal positiva perfecta
entre X e Y.

" Si r = 0, no existe ninguna relación lineal entre X e
Y (X e Y son independientes).
ANALISIS DE




CORRELACIÓN MÚLTIPLE:
Sirve para medir la adecuación del modelo hallado
(bondad del ajuste de la recta de regresión al conjunto
de observaciones), en el caso de tener una variable
dependiente y varias independientes.
Dicha medida nos la da el coeficiente de
determinación R2 , que verifica 0 ≤ R2 ≤ 1.
Cuanto más cercano a uno sea su valor, mayor es el
grado de asociación lineal que existe entre la variable
dependiente y las independientes o predictoras.
Nos mide la proporción de la variación total de las
observaciones que se explican mediante la ecuación
(recta) de regresión
REFERENCIAS:
http://www.uhu.es/89050/ficherosdatos/guia10.P
DF
 Ezequiel Uriel, “Análisis de datos: Series
temporales y análisis multivariante”. Editorial
AC. Juan Etxeberría, “Regresión Múltiple”.
Cuadernos de Estadística. Editorial La Muralla.
 http://www.monografias.com/trabajos30/regresion
-multiple/regresion-multiple.shtml

GRACIAS!!!
Descargar

REGRECION LINEAL SIMPLE, MULTIPLE Y CORRELACION