Regresión Lineal Simple
Capitulo 17
Los temas
•
•
•
•
•
•
Regresión Lineal
Comparando ecuaciones lineales
Bondad de ajuste (Chi square)
Tabla de contingencia
The sign test (la prueba de signos)
The run test (la prueba de corrida)
Regresión vs. correlación
• la relación entre dos variables
– la magnitud de una variable (dependiente) se
asume que es determinada por una segunda
variable (independiente)
– el termino “dependiente” no implica “causa y
efecto”
La inteligencia
La edad de los chupacabras
La inteligencia
Y i    X i
La edad de los chupacabras
La inteligencia
Y i    X i   i
La edad de los chupacabras
La inteligencia
La edad de los humanos
La inteligencia
Y i    X i   i
La edad de los chupacabras
“Best fit” Line, Ajuste Optimo
Y
La inteligencia
(X4,Y4)
(X2,Y2)
(X3,Y3)
(X1,Y1)
La edad de los humanos
“Best fit” Line, Ajuste Optimo
Y
La inteligencia
(X3,Y3)
Y2  Y
(X2,Y2)
(X1,Y1)
La edad de los humanos
“Best fit” Line, Ajuste Optimo
Y
La inteligencia
(X3,Y3)
Y2  Y
Y 2  Yˆ
(X2,Y2)
(X1,Y1)
La edad de los humanos
Minimizar la diferencia entre
n

i 1
2
ˆ
( Y2  Y )
Y
Y
Negativa
Positiva
X
X
Y
Zero
X
El largo de las alas de los gorrión pardal
de diferente edad
•
•
•
•
•
•
•
•
X (Edad)
3.0
4.0
5.0
6.0
8.0
9.0
10.0
Y Largo del ala (cm)
1.4
1.5
2.2
2.4
3.1
3.2
3.2
El largo de las alas de los gorrón pardal
de diferente edad
•
•
•
•
•
•
•
•
X (Edad)
11.0
12.0
14.0
15.0
16.0
17.0
Y Largo del ala (cm)
3.9
4.1
4.7
4.5
5.2
5.0
Calcular la linea
x
2

 (X
2
i
 xy   X Y
i
b
 xy
x
2

 X) 
i

X
2
i

(  X i )(  Y i )
n
( X i )
n
2
n 
Y
X
Y 
X 
X
x
2
2



b 
a  Y  bX
XY
i
i
 xy 

n  13
 X  130 .0
X  10 .0

2
X  1562 .0
x
2
 1562 .00 
b
a  Y  bX 
(130 .0)
13
2
 262 .0
 Y  44 .4
Y  3 .415
 XY
 xy
 514 .80
 514 .80 
(130 .0 )( 44 .4 )
13
 70 .80
b
 xy
x
2

70.80
262.00
 0.270
a  Y  bX  3.415  (0.270 cm / day )(10.0 days )
 0.715 cm
Yˆ  0.715  0.270 X
Assumptions
• 1. Para cada “x” hay una poblacion con
distribución normal de “y”
• 2. homogeneidad de varianza
• 3. la relación es lineal
• 4. datos al azar e independientes
• 5. los x’s se obtiene sin error.
La prueba
• Source
• Total
• Linear reg.
• Residual
• F=
regMS
resMS
SS

y
2
(  xy )
x
2
2
(total SS -reg SS)
DF
n-1
1
n-2
MS
regSS
regDF
resSS
resDF
La prueba
•
•
•
•
•
•
•
Source
Total
Linear reg.
Residual
SS
DF
MS
19.656923 12
19.132214 1 19.132214
0.524709 11
0.047701
F = 401.1
F0.05(1),1,11= 4.84
2
r 
19 .132214
19 .656923
 0.97
Ejercicio
• Determinar si el area fotosintetica de una orquidea
esta relacionado con la cantidad de flores
producidas.
• Lepanthes rupestris, una orquídea endemic de
Puerto Rico
• Trabajo de investigación de Eveneida Rodríguez
Area fotosintética (cm2)
# de flores producidas
2.644
2.709
2.759
22
0
28
2.598
2.718
2.262
24
10
4
2.520
2.826
2.559
2.395
16
38
16
4
2.160
2.830
3.097
0
29
46
Regres sion Summa ry
#fl vs . Lea f a rea
Coun t
13
Num . Mis sing
0
R
.80 6
R Squa re d
.65 0
Ad jus te d R Squ are d
.61 8
RMS Res idua l
9.0 46
ANOVA Ta ble
#fl vs . Lea f a rea
DF
Sum o f Sq ua re s
Mean Squ are
F-Va lue
P-Valu e
1
16 68 .190
16 68 .190
20 .38 6
.00 09
Resid ua l
11
90 0.1 18
To tal
12
25 68 .308
Regres sio n
81 .82 9
Regres sion Coe fficients
#fl vs . Lea f a rea
Coefficien t
Inte rcep t
Le af area
-104 .899
46 .97 3
Std. Erro r
27 .38 6
10 .40 3
Std. Coe ff.
t-Valu e
P-Valu e
-104 .899
-3.83 0
.00 28
4.5 15
.00 09
.80 6
Regres sion Plot
50
45
40
35
#fl
30
25
20
15
10
5
0
-5
2.1
2.2
2.3
2.4
2.5
2.6
2.7
Le af area
Y = -1 04.8 99 + 46.9 73 * X; R^2 = .65
2.8
2.9
3
3.1
3.2
Descargar

Regresión Lineal Simple