El promedio como variable
aleatoria: error estándar e
intervalo de confianza para la
media de la muestra
Mario Briones L.
MV, MSc
2005
Estimador puntual

El descriptor de tendencia central
que es la media aritmética o
promedio, ocupa una posición
puntual sobre la recta numérica
x
El promedio como variable
aleatoria
Si una muestra bien tomada sobre
una población dada ha generadox un
promedio
 Una segunda muestra generará
“probablemente” un promedio
nuevo, diferente del anterior
 PREGUNTA: alguno de los promedios
es incorrecto?

El promedio como variable
aleatoria
Esto significa que cada vez que se
toma una muestra de tamaño n, el
promedio obtenido puede
considerarse como una observación
perteneciente a una población con
una distribución
 Esta distribución tiene media m y
varianza s2/n

El error estándar de la
media


La dispersión de la media muestreal para
un tamaño n, fluctua alrededor de m con
una desviación estándar igual a s/n
Si la muestra es grande, la distribución de
la media muestreal será
aproximadamente normal, sin importar si
la población de origen de los datos no
tiene distribución normal.
Las probabilidades de la curva normal
aplicadas a la distribución del
promedio

Si la distribución de los promedios
sigue una curva normal, entonces
hay una probabilidad total de
ocurrencia de estos promedios, bajo
la curva normal
Las probabilidades de la curva normal
aplicadas a la distribución del
promedio
100% de probabilidades de todos
los promedios
obtenidos con
muestras
de tamaño n
-3 -2 -1
x
+1 +2 +3
Unidades de desviación
Unidades de error estándar
Si la distribución de los promedios sigue una curva
normal, entonces hay una probabilidad total de
ocurrencia de estos promedios, bajo la curva normal
100% de probabilidades de todos
los promedios
obtenidos con
muestras
de tamaño n
-3 -2 -1
x
+1 +2 +3
Unidades de desviación
Unidades de error estándar
En resumen:


El promedio de todos los posibles
promedios de infinidad de muestras de
tamaño n, cae exactamente sobre la
media poblacional m.
Esto se debe a que la probabilidad de
cada promedio de caer por encima o por
debajo de m es exactamente la misma,
aunque la distribución de la variable
original no sea normal y siempre que el
tamaño de la muestra sea grande.
Por lo tanto:


Utilizando las propiedades de la
distribución normal, se puede dar una
magnitud a la probabilidad de ocurrencia
de m a partir del promedio calculado.
Primero que nada, esto significa que
entre menos una y más una unidad de
error estándar (cualquiera sea su
magnitud) se encuentra
APROXIMADAMENTE, el 68% de esas
probabilidades (etc, etc,...).
Promedios y error estándar de peso de
terneros al nacimiento en 43 muestras de
tamaño 10 tomadas sobre un total de 530
pesos (con promedio 38.9)
45.0
43.0
41.0
39.0
37.0
35.0
Muestra
43
40
37
34
31
28
25
22
19
16
13
10
7
4
33.0
1
Peso al nacimiento (Kg)
47.0
Frecuencia
Histograma de frecuencia de los 43
promedios obtenidos con muestras de
tamaño 10
18
16
14
12
10
8
6
4
2
0
34.8
36.2
37.6
39
Clase
40.4
41.8
y
mayor...
Promedios y error estándar de peso de
terneros al nacimiento en 43 muestras de
tamaño 40 tomadas sobre un total de 530
pesos (con promedio 38.9)
42.0
41.0
40.0
39.0
38.0
37.0
Muestras
43
40
37
34
31
28
25
22
19
16
13
10
7
4
36.0
1
Peso al nacimiento (kgs)
43.0
Histograma de frecuencia de los 43
promedios obtenidos con muestras de
tamaño 40
14
Frecuencia
12
10
8
6
4
2
0
37.6
38.1
38.7
39.3
Clase
39.8
40.4
y
mayor...
68%
-3 -2 -1
x
+1 +2 +3
Probabilidades de 95 y 99%

Si queremos cubrir, a partir de
nuestro estimador de la media, un
95% de las probabilidades de incluir,
con el mismo tamaño de muestra, la
media real de la población, tenemos
que dividir en dos un área igual a
0.95. Esto da 0.475.
La probabilidad de la media poblacional es
simétrica alrededor de la media de la
muestra
m
m
m
mm
?
?
?
?
x
?
m
?
Límites de la curva normal para dejar sólo un
5% de probabilidad de error de no cubrir con
el intervalo de confianza a la media
poblacional
5%
95%
2.5%
z: -1.96
2.5%
z: + 0.1.96
Probabilidades de 95 y 99%
El valor de z que deja hacia entre
cero y z un 0.475 de las
probabilidades es 1.96. Esto
significa que ± 1.96 unidades de
error estándar a partir del
promedio, se ubica ese 95% de
probabilidades.
 El valor respectivo para 99% de
confianza es de 2.58.

muestras
41
37
33
29
25
21
17
13
9
5
44.0
43.0
42.0
41.0
40.0
39.0
38.0
37.0
36.0
35.0
1
Peso de nacimiento (kgs)
Promedios e intervalos de confiaza de 95%
para la media de la población, con muestras
de tamaño 40
Estimación de intervalo: el
error estándar de la media

Para conocer cuanta es la distancia hacia
arriba o hacia debajo de la media,
expresada en las unidades de medición
de la variable, sólo es necesario
multiplicar el error estándar (que está
expresado en unidades de la variable) por
el valor de z que define la probabilidad
(ZP). La siguiente expresión se aplica
CUANDO DE CONOCE LA VARIANZA DE
LA POBLACION:
x
 zP
x
s/n
EJEMPLO: Los datos siguientes corresponden a los niveles
de Hormona Luteinizante (LH) en nanogramos por ml de
suero de 5 ovejas administradas con Naloxona a las 20
semanas de edad, durante la noche y el día
promedio
desv. est.
error est.
diurno
0.72
0.51
1.01
0.49
0.37
0.62
0.25
0.11
nocturno
0.68
0.48
0.72
0.40
0.41
promedio
0.538
desv. est.
0.15
error est.
0.07
Intervalo de confianza para la concentración diurna de LH.
1.96(s/n) 1.96(s/n)
0.62
conc. LH (ng/ml)
Intervalo de confianza para la concentración diurna de LH.
1.96 x 0.11
1.96 x 0.11
0.62
conc. LH (ng/ml)
Intervalo de confianza de 95% para la media de la
concentración de LH en la población de referencia,
asumiendo que se conoce la varianza de la población:
0.62  0.22
0.22
0.22
0.40
0.62
0.84
conc. LH (ng/ml)
Descargar

El promedio como variable aleatoria: error estándar de la media.