BIOMETRIA II
10-O
Estimación por intervalo en la
regresión:
Bandas de Confianza
Estimación por Intervalo
• Si recordamos de nuestros
primeros cursos tenemos dos
formas de estimar:
–La estimación Puntual
–La estimación por Intervalo
Estimación Puntual
• Es cuando sólo damos un dato como estimado
del valor que deseamos estimar.
• Este estimador se llama “Estimador Puntual”
• Ejemplos son el promedio X es un estimador
puntual del parámetro μ
• La varianza muestral s2 es un estimador
puntual de la Varianza Poblacional δ2
Estimación por intervalo
• Cuando en vez de un solo valor colocamos dos
valores, uno inferior y otro superior y
suponemos que en medio de esos dos esta el
valor que deseamos estimar, entonces
hacemos una estimación por intervalo.
Estimación por intervalo
Posibles Valores
Intervalo Corto
Intervalo largo
Compromisos
• Cuando hacemos una estimaciónPuntual solo
tenemos una oportunidad de atinar al valor
que deseamos estimar
• Si hacemos un intervalo corto tenemos pocos
valores (mas precisión) pero podemos
equivocarnos o no atinar al valor del
parámetro (poca probabilidad)
• Si hacemos un intervalo largo tenemos más
probabilidad pero menor precisión
Intervalo de confianza
• Cuando conocemos la distribución de
frecuencias que sigue la variable podemos
aplicarla ya que conocemos la probabilidad.
• Esto cambia y ahora podemos establecer lo
que conocemos como INTERVALOS de
CONFIANZA.
• Los intervalos de confianza se establecen para
un parámetro (ej. La Media) y se dan
normalmente al 95 ó 99%
Intervalo de Confianza
Estimador Puntual
Posibles Valores
Intervalo al 95% de confianza
Intervalo al 99% de confianza
Intervalos de Confianza en la
Regresión
• Como mencionamos antes el modelo de
regresión “pasa” por la supuesta media de
cada una de las subpoblaciones de y para cada
valor de X
• Por lo tanto y^ es un estimador puntual de la
media.
Estimadores de
la media
Intervalos de confianza
• Sabemos que uno de los supuestos de la
regresión es que la Y se distribuye
normalmente
• Por lo tanto podemos aplicar la misma
fórmula que usamos para el intervalo de
confianza.
I.C. = X- ± Z α½ * (e.s)
I.C. = X- ± Z α½ * (e.s)
• En donde I.C. es Intervalo de Confianza
• X- es el promedio u estimador de la μ
• Z α½ es el valor de la distribución normal
stadandar para un valor dado de alfa y como
este es de dos colas se toma sólo la mitad
– Normalmente es 1.96 cuando se usa el 95% de
confianza (α = 0.05)
• (e. s.) es el error estándar o desv. Estandar del
estimador.
Aplicación
• Así podemos plantear un
intervalo de confianza para
cada una de las medias de
las sub poblaciones.
Bandas de confianza
• Uniendo los límites superiores de los límites
de cada intervalo de confianza obtenemos el
límite superior de la banda de confianza (o
banda de confianza superior de confianza)
• Uniendo los límites inferiores de confianza
obtenemos el límite inferior de la banda de
confianza (o banda de confianza inferior de
confianza)
Banda Superior de confianza
Banda Inferior de confianza
Estimación del Error Estándar
• Cuando se tiene más de una observación en cada
punto de X es fácil calcular el e.s.
• Cuando solo se tiene un valor se hace una
estimación ponderada de los e.s. Basados en la
desviación general.
• Es por esto que la estimación es más imprecisa
hacia los valores extremos.
• Hay otros intervalos de confianza para la
estimación, que básicamente usa otra forma de
estimar el e.s. Bandas de Estimación
ANÁLISIS
BANDAS DE CONFIANZA Y DE PREDICCIÓN.
UN INTERVALO O BANDA DE CONFIANZA ES UNA MEDIDA DE LA
CERTIDUMBRE EN LA FORMA DE UNA LINEA DE REGRESIÓN. EN
GENERAL, UNA BANDA AL 95% DE CONFIANZA IMPLICA UN 95% DE
PROBABILIDAD DE QUE LA LINEA REAL DE CORRELACIÓN CAIGA
DENTRO DE ESTA BANDA.
UN INTERVALO O BANDA DE PREDICCIÓN ES UNA MEDIDA DE LA
CERTIDUMBRE EN LA DISPERSIÓN DE LOS VALORES INDIVIDUALES. EN
GENERAL, UNA BANDA AL 95% DE CONFIANZA IMPLICA QUE UN 95%
DE LOS DATOS SOBRE LOS QUE SE HA REALIZADO LA REGRESIÓN ESTÁN
CONTENIDOS DENTRO DE ESTA BANDA.
Ejemplo
Row
Predicted
Standard
Lower 95%
Upper 95%
Dias
Medici
Medici
Error
Conf. Limit
Conf. Limit
(X)
(Y)
(Yhat|X)
of Yhat
of Y Mean|X
of Y Mean|X
1
10
5
10.4091
3.2339
3.0936
17.7246
2
11
18
12.7636
2.7872
6.4585
19.0688
3
12
10
15.1182
2.3827
9.7282
20.5082
4
13
21
17.4727
2.0453
12.846
22.0995
5
14
27
19.8273
1.8129
15.7261
23.9284
6
15
17
22.1818
1.7286
18.2715
26.0921
7
16
30
24.5364
1.8129
20.4352
28.6375
8
17
20
26.8909
2.0453
22.2642
31.5176
9
18
34
29.2455
2.3827
23.8555
34.6354
10
19
27
31.6
2.7872
25.2948
37.9052
11
20
35
33.9545
3.2339
26.639
41.2701
45
Bandas de Confianza
40
35
30
25
Predicted
Lower 95%
Upper 95%
20
15
10
5
0
7.5
9.5
11.5
13.5
15.5
17.5
19.5
21.5
Bandas para la estimación
Intervalos de Confianza para la estimación
Row
Predicted
Standard
Lower 95%
Upper 95%
Dias
Medici
Medici
Error
Prediction
Prediction
(X)
(Y)
(Yhat|X)
of Yhat
Limit of Y|X
Limit of Y|X
1
10
5
10.4091
6.5822
-4.4809
25.2991
2
11
18
12.7636
6.3747
-1.6569
27.1841
3
12
10
15.1182
6.2084
1.0737
29.1627
4
13
21
17.4727
6.0869
3.7031
31.2423
5
14
27
19.8273
6.0129
6.2252
33.4293
6
15
17
22.1818
5.988
8.6361
35.7275
7
16
30
24.5364
6.0129
10.9343
38.1384
8
17
20
26.8909
6.0869
13.1213
40.6605
9
18
34
29.2455
6.2084
15.201
43.2899
10
19
27
31.6
6.3747
17.1795
46.0205
11
20
35
33.9545
6.5822
19.0645
48.8446
60
Bandas de confianza de la Estimación
50
40
30
Predicted
Lower 95%
Upper 95%
20
10
0
7.5
-10
9.5
11.5
13.5
15.5
17.5
19.5
21.5
Descargar

Estimación por intervalo en la regresión: Bandas