BIOMETRÍA II
10-O
Normalidad, Variabilidad y
estimación del Modelo de
Regresión
Bases
• El modelo de regresión plantea una forma
(matemática) en la cual se relacionan la
variable explicativa y la variable respuesta.
• Tiene fines predictivos (Predecir el valor de la
variable respuesta para un posible valor de la
variable explicativa)
• Sin embargo, al ser un ejercicio estadístico
tiene una serie de elementos variables.
Supuestos y Conceptos
• Para que el modelo de regresión sea valido
este se sustenta en varios SUPUESTOS
• Los supuestos permiten dar bases teóricas al
modelo y sólo si estos se cumplen las
predicciones hechas por el modelo serán
acertadas.
• También en base a estos supuestos se pueden
hacer muchas consideraciones que pueden
hacer muy útil a la regresión.
Supuestos
• El modelo de regresión tiene varios supuestos
1. Al menos la variable respuesta tiene una
distribución normal con media μ y varianza δ2
2. Existe una subpoblación de valores de la variable
respuesta (Y) para cada valor de la variable
explicativa X y éstas tienen una distribución
Normal
3. Las varianzas de estas subpoblaciones son
iguales entre si
Supuestos
4.- Las observaciones son independientes. Como
resultado de esto los residuales (valores sobre el
eje de las y de la distancia del valor observado al
predicho por el modelo) tienen una distribución
Normal con Media 0 y varianza δ2
40
35
30
25
RESIDUALES
20
^
(Y – Y)
15
10
5
0
10
12
14
16
18
20
22
Aplicaciones
• A partir de estos SUPUESTOS se pueden hacer
varios Procedimientos que permiten conocer
más fondo la relación que existe entre X y Y y
por lo tanto generar una mayor información
sobre esta.
Análisis de Varianza de la Regresión
• El ANOVA de la regresión es un resultado
Directo del supuesto de normalidad.
• Igual que en el ANOVA “tradicional” en este se
divide la varianza total en dos elementos que
la componen, en este caso
– Aquello que explica el modelo de regresión y
– Lo que no es explicado por este.
Tabla de ANOVA para la Regresión
Fuente de
Variación
G.L.
SUMAS DE
CUADRADOS
CUADRADOS
MEDIOS
Estadístico de
Prueba (F)
REGRESIÓN o
MODELO
P-1
Σ ( y^i – Y-)2
SCR/GL R
CMR/CME
RESIDUAL o
ERROR
GLT-GLR
Σ(y^i - yi)2
SCE/GLE
TOTAL
N-1
Este se saca por diferencia
Σ( yi – Y-)2
Cálculos del ANOVA
Dias
Medición
10
11
12
13
14
15
16
17
18
19
20
Suma
Promedio
5
18
10
21
27
17
30
20
34
27
35
Y estimada Desviación Desv Reg.
Desv Resd
10.41
295.21
138.599
29.26
12.76
17.49
88.705
27.42
15.12
148.40
49.898
26.19
17.47
1.40
22.178
12.44
19.83
23.21
5.545
51.45
22.18
26.85
0.000
26.85
24.54
61.12
5.542
29.86
26.89
4.76
22.172
47.48
29.25
139.67
49.889
22.61
31.60
23.21
88.693
21.16
33.95
164.31
138.584
1.09
905.64
609.804
295.81
244
22.1818182
Fuente de V G.L.
Regresion
Error
Total
SC
1
9
10
CM
609.804
295.833
905.64
F
609.8037286 18.5518192
32.87029278
P
0.0019698
Hipótesis
• Al Igual que en el ANOVA tradicional en el
ANOVA de la Regresión se prueba una Hiótesis
nula.
– Ho: β1 es constante y no varia con X
– Ha: β1 es diferente de 0 y por tanto la regresión
es correcta
Otra forma de Ponerlo
• Ho: β1 = 0
• Ho: β1 ≠ 0
• por tanto, si se acepta H0, la variable regresora
no influye y no hay relación lineal entre ambas
variables.
• En caso contrario (si se rechaza H0), si existe
una dependencia lineal de la variable
respuesta respecto a la regresora.
Finalmente
• AL igual que se hace una prueba para el valor
de B1 se puede hacer una prueba similar para
B0 pero esta no tiene importancia en términos
de la validez del modelo, sin embargo, algunos
programas la proporcionan.
Descargar

Normalidad, Variabilidad y estimación del Modelo