Estimadores puntuales y por intervalo de
confianza para media y varianza
poblacionales
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Introducción al tema
• El único método científico para validar
conclusiones sobre un grupo de individuos a
partir de la información que nos proporciona
un subconjunto más o menos amplio de los
mismos es el Método Estadístico.
• En el experimento típico, el objetivo básico es
estimar algunas características que describan
la población de interés. Es decir:
Estimar los parámetros que caracterizan a
la función de probabilidad de la variable
aleatoria en estudio
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Mapa conceptual
ESTADÍSTICA
Conceptos
Básicos
Estadística
Descriptiva
Población
Muestra
Parámetro
Estimador
PROBABILIDAD
Conceptos Básicos
Distribuciones
de Probabilidad
Continuas, Normal,
ji-cuadrado, t de
Student
Discretas,
Binomial, otras
Distribuciones en
el Muestreo
Desigualdad de Tchebysheff, Ley
de los grandes Números,
Teorema Central del Limite.
INFERENCIA
Estimación
Puntual
Por intervalos
Prueba de Hipótesis
para una y dos
poblaciones
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Introducción al tema
Veamos el caso de un especialista en producción animal:
Después de alimentar un lote de terneros con una
ración alimenticia particular, necesita expresar
numéricamente el aumento medio de peso de sus
animales.
En este caso, suponemos que se dispone de los
conocimiento suficientes como para decir:
La variable aleatoria x de nuestro problema, tiene una
función de probabilidad conocida: f(X; 1; 2; ... ; p) y
depende de:
Parámetros 1 hasta p que son desconocidos.
Podría ocurrir que el aumento de peso de los terneros
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
siguieran una distribución normal con media  y varianza
Introducción al tema
En este caso el experimentador persigue como
objetivo, estimar a  y 2.
Lo hará a partir de la manipulación de un conjunto
de observaciones que ha de seleccionar de la
población y que constituirán una muestra aleatoria
de la misma.
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Introducción al tema
Razonamiento a seguir:
•
•
Pensar como se define la población y la muestra
Qué tipo de procedimiento utilizar para seleccionar una
muestra aleatoria.
• Qué debería calcular para estimar los parámetros de
interés. (estadístico)
• Qué función de disitribución presentan los estimadores
elegidos.
• Cómo validar las estimaciones a partir de la muestra.
Es decir Inferir de la Muestra a la población
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Inferencia Estadística
La inferencia estadística es la forma de tomar decisiones
basadas en probabilidades y presenta dos aspectos:
1. Estimación de parámetros: - Puntual
- Por intervalos
2. Prueba de Hipótesis con respecto a una función elegida
como modelo.
En esta clase discutiremos estos puntos
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Estimación Puntual
• Una estimación puntual del valor de un
parámetro poblacional desconocido (como
puede ser la media , µ, o la desviación
estándar , σ), es un número que se utiliza
para aproximar el verdadero valor de dicho
parámetro poblacional.
• Una estimación puntual es el valor de la
estadística de la muestra correspondiente.
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Estimadores puntuales de los parámetros de una
población normal
Sea una muestra aleatoria simple, X1, X2, ...... ,
Xn de una población con distribución N(, 2).
• Estimador de la media
n
ˆ  x 

i 1
xi
n
La distribución muestral de la media es :

x   ( ,
)
n
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Estimadores puntuales de los parámetros de una
población normal
S
n

estima a la desviación típica de la media
n
y se denomina error estándar de la media
muestral, por esta razón se dice que el error
estándar de la media mide la variabilidad de la
media en el muestreo.
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Estimadores puntuales de los parámetros de una
población normal
• Estimador de la Varianza es la Varianza
muestral
n
ˆ  S 
2
2

i 1
( xi  x )
2
( n  1)
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Estimadores puntuales de los parámetros de una
población normal
Sea X1, X2, ... , Xn , una muestra aleatoria
simple de una población X 
N(, 2),
entonces la variable aleatoria
n
 (x
 x)
i
i 1

2
sigue una ji-cuadrado con n-1 grados de libertad.
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Estimadores puntuales de los parámetros de
una población normal
Del resultado anterior se deduce que la variable
( n  1) S

2
2
sigue una distribución ji-cuadrado con n-1 grados de
libertad.
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Estimadores (continuación)
Realizada la estimación de un parámetro cabe
preguntarse:
• ¿ Es exacta la estimación?
• ¿Es probable que la estimación sea alta o baja?
• ¿Con otra muestra se obtendría el mismo resultado,
o bastante diferente?
• La calidad de un procedimiento de estimación
¿mejora bastante si la estadística de la muestra es
menos variable e insesgada a la vez?
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Estimadores y propiedades deseables de los
estimadores
• La distancia entre el estimador y el parámetro a
estimar puede medirse mediante los que se
denomina el error cuadrático medio, que se
define como el valor esperado del cuadrado de la
diferencia entre el estimador y el verdadero
parámetro.
2
ECM (ˆ )  E (ˆ   )
El ECM es importante ya que puede escribirse como
2
ˆ
ˆ
ˆ
ECM ( )  VAR ( )  [  E ( )]
una es la varianza del estimador y otra el cuadrado del
sesgo.
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Estimadores y propiedades deseables de los
estimadores
• Ausencia de sesgo
Se dice que un estimador es insesgado (o centrado) si
la esperanza del estimador coincide con el parámetro a
estimar
E (ˆ )  
En caso contrario se dice que es sesgado.
• Consistencia
Se dice que un estimador es consistente si se aproxima
cada vez más al verdadero valor del parámetro a
medida
 ,  0
Pr[(que
ˆ se aumenta
)   ]  el0 tamañonmuestral.
La distribución del estimador se concentra más
alrededor del verdadero parámetro cuando el tamaño
muestral aumenta.
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Estimadores y propiedades deseables de los
estimadores
• Eficiencia
Es claro que un estimador será tanto mejor cuanto
menor sea su varianza, ya que se concentra más
alrededor del verdadero valor del parámetro. Se dice
que un estimador insesgado es eficiente si tiene
varianza mínima.
• Suficiencia
Un estimador es suficiente si utiliza una cantidad de la
información contenida en la muestra de manera que
ningún otro estimador podría extraer información
adicional de la muestra sobre el parámetro de la
población que se está estimando.
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Estimadores y propiedades deseables de los
estimadores
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Métodos de estimación
Hay varios métodos de estimación, el de máxima
verosimilitud es el que proporciona estimadores
consistentes pero no siempre insesgados. Los
estimadores mencionados en los puntos anteriores
2
(x, S )
eran estimadores máximo verosimiles. El mismo
resultado se puede obtener por el método de los
momentos.
El método de mínimos cuadrados se verá cuando se
trate regresión.
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Estimación por intervalos
Dada una muestra aleatoria X1, X2, ... , Xn , de una
población con función de densidad f(x;) Un
intervalo de confianza, de extremos Linferior y Lsuperior,
para el parámetro  de la población es un par
ordenado de funciones reales de las n medidas de
la muestra
I  = [Linferior (X1,...,Xn);Lsuperior (X1,..., Xn)]
Construidas de forma que la probabilidad de que los
extremos contengan al verdadero valor del
parámetro es un valor prefijado (1 - ). Al número (1
- ) se le denomina “nivel de confianza”.
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Estimación por intervalos
• El nivel de confianza suele ser 0,95 (95%) ó 0,99 (99%).
La interpretación práctica es sencilla, por ejemplo si el
nivel de confianza es del 95%, significa que en el 95%
de las veces que repitiéramos el experimento, el
intervalo de confianza calculado contendría al verdadero
valor del parámetro y en el 5% restante el intervalo no
contendría el verdadero valor.
• Una vez que el intervalo de confianza ha sido calculado
para una muestra concreta, el intervalo obtenido
contiene o no contiene al verdadero valor del parámetro,
con probabilidad 1, por esa razón, cuando ya tenemos
un valor concreto hablamos de confianza y no de
probabilidad. Confiamos en que el intervalo que hemos
calculado sea del 95% que contiene el verdadero valor.
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Nivel de confianza gráficamente
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Intervalo de confianza para la media
poblacional,  conocido
Supongamos que disponemos de una población en la que
tenemos una v.a. con distribución N(,) con  conocida (de
estudios previos, por ejemplo).
Obtenemos una muestra de tamaño n y deseamos estimar la
media  de la población. El estimador puntual de la misma es
la media muestral cuya distribución muestral es conocida
x   ( ,

)
n
la cantidad
Z 
x

tendrá distribución
normal estándar
n
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Intervalo de confianza para la media poblacional,
 conocido
Sobre la distribución N(0 , 1) podremos seleccionar dos
puntos simétricos -z/2 y z /2 , tales que
P(-z /2  Z  z /2 ) = 1-
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Intervalo de confianza para la media
poblacional,  conocido
Sustituyendo Z por su valor en este caso particular




x
P   z / 2 
 z / 2   1  





n
Despejando nos queda el intervalo de confianza,

 

P  x  z / 2
   x  z / 2
  1
n
n

Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Intervalo de confianza para la media
poblacional,  conocido
Ejemplo,
• Obtener un I. C. del 95% para el promedio de un
lote de 500 novillos, de los cuales se pesa una
x
muestra de 25 animales, obteniéndose
un =390
kg. Se sabe que 2 es de 400 kg2.
20
20 

   390  1 . 96
 390  1 . 96

25
25 

382 ,16 


397 ,84
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Intervalo de confianza para la media
poblacional,  desconocido
Recordemos que si la varianza poblacional es
desconocida y la variable es normal o se puede
aproximar a la distribución normal por el Teorema
central del límite, entonces se usaría la t de
Student con n –1 grados de libertad y el desvío
estándar muestral.
El intervalo de confianza que resulta,
s
s 

P  x  t (  / 2 ; n 1 )
   x  t (  / 2 ; n 1 )
  1
n
n

Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Intervalo de confianza para la media
poblacional,  desconocido
Ejemplo,
En un establecimiento dedicado a la elaboración de
alimentos balanceados para aves, se afirma que su
producto aumenta el peso promedio de las aves en 30
gs diarios. En una muestra de 9 aves tomadas al azar,
se obtuvo un aumento promedio de 35 grs. con
desviación de 3,04 grs. Estimar el intervalo de confianza
del 95% para el verdadero aumento promedio
3 . 04
3 . 04 

   35  2 . 306
 35  2 . 306

9
9 

32 . 66
   37 . 34 
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Determinación del tamaño de muestra n para un grado
de precisión dado
z 1-  /2

es la mitad del ancho del intervalo de confianza
(producto del coeficiente y el error estándar) y se denomina
error máximo de estimación E.
n
Dado un valor de error y un cierto nivel de confianza, puedo
estimar cuál sería el tamaño de la muestra
z 1- /2 
2
E
2
2
n
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Intervalo de confianza para la varianza poblacional
Sea X una variable aleatoria con distribución normal con
 y  desconocidos y sea X1, X2, ..., Xn una muestra
aleatoria de tamaño n.
El intervalo de confianza se construye a partir de la
2
variable
 
2
( n  1) S

2
Que tiene una distribución ji-cuadrado con n-1 grados de
libertad y dos valores tales que delimiten el 100(1 - )%


Pr  ( n 1 ); / 2   ( n 1 )   ( n 1 ); 1 / 2  1  
2
2
2
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Intervalo de confianza para la varianza poblacional
Reemplazando la variable 2 en el intervalo
2
 2

( n  1) S
2
Pr   ( n 1 ); / 2 
  ( n 1 ); 1 / 2   1  
2



Despejando el intervalo de confianza queda,
2

 ( n  1) S
Pr  2


  ( n 1 ); 1 / 2
( n  1) S 


  1
2
 ( n 1 ); / 2 
2
2
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Intervalo de confianza para la varianza poblacional
Ejemplo,
Se sembró cierta variedad de trigo en parcela de cierta
localidad, se extrajo una muestra al azar de 20 parcelas
y se midió el rendimiento. Se obtuvo un rendimiento de
58 kilogramos por parcela y una desviación típica de 8
kg por parcela. Estimar la varianza poblacional con un
nivel de confianza del 95%, sabiendo que el rendimiento
se distribuye normalmente
(19 ) 64 
 (19 ) 64
2
 


 32 . 9
36 .96  
8 . 91 
2
 136 . 47 
Material preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Descargar

Presentación de PowerPoint - conf