MUESTREO ALEATORIO SIMPLE
SIN REEMPLAZO (“mas”)
• Este esquema de muestreo es el más usado
cuando se tiene un marco de muestreo que
especifique la manera de identificar cada unidad
en la población.
• Además no se tiene conocimiento a priori sobre
los posibles valores de Yi ni otras mediciones
asociadas a Yi.
• En este caso cada unidad se extrae con igual
probabilidad, por etapas, y sin reemplazo, hasta
tener las n unidades de la muestra.
MUESTREO ALEATORIO SIMPLE SIN
REEMPLAZO (“mas”)
• En la primera extracción, la probabilidad de que
n
se seleccione una de las n unidades es
.
N
• En la segunda extracción la probabilidad de
que se seleccione una de las restantes n-1
unidades es: n  1 y así sucesivamente.
N 1
• En la selección k, la probabilidad de una unidad
l es n  k  1 .
N  k 1
MUESTREO ALEATORIO SIMPLE SIN
REEMPLAZO (“mas”)
N
• Para estimar
Y 
Y
i 1
i
/N
se obtiene el
ˆ
promedio de la muestra: y  Y 
n

y i / n (5.1)
i 1
• Este es un estimador insesgado ( E  y   Y , el
promedio de los posibles valores y
al tomar
muchas muestras es Y ).
MUESTREO ALEATORIO SIMPLE SIN
REEMPLAZO (“mas”)
• La varianza de y es:
V (y)  E  y Y
donde
S 
2
y
1

2
2
y
n S

 1 

N  n

N
(Y

N 1
i
Y )
2
i 1
S
2
y
• Nótese que si N es infinito, V ( y ) 
,
n
es el resultado que se obtiene
para poblaciones infinitas.
MUESTREO ALEATORIO SIMPLE SIN
REEMPLAZO (“mas”)
•
n
es la fracción de muestreo o proporción
N de la población que se muestrea, y
• 1  n es el factor de corrección por finitud
N (fcf).
• Se puede demostrar que con este proceso de
selección, la probabilidad de que cualquier
n
unidad ui esté en la muestra es
i 
N
y la de que ambas una ui y una uj
estén en la muestra es   n ( n  1)
ij
N ( N  1)
MUESTREO ALEATORIO SIMPLE SIN
REEMPLAZO (“mas”)
N
• Para estimar el total
Y
i
 NY  Y
i
tenemos:
• Además si
[
ˆ
ˆ
Y  NY  Ny
ˆ ~ N [  ,V ( ˆ )] , entonces:
P ˆ  1.96 V ( ˆ )    ˆ  1.96 V ( ˆ )
]  0.95
MUESTREO ALEATORIO SIMPLE SIN
REEMPLAZO (“mas”)
• Si no conocemos V (ˆ ) tenemos que estimarla:
[
P ˆ  1.96 Vˆ ( ˆ )    ˆ  1.96 Vˆ ( ˆ )
]  0.95
• En el caso particular del “mas” tenemos:
 
  Y , ˆ  y y V ˆ  V
2
y
n S

 y   1  
N  n

MUESTREO ALEATORIO SIMPLE SIN
REEMPLAZO (“mas”)
• En el caso particular del “mas” tenemos:
2
y
S
n


  Y , ˆ  y y V ˆ  V  y    1 

N  n

 


2
2 

S
S
 n  y
 n  y 

P y  1.96  1- 
 Y  y  1.96  1- 
 0.95

 N n
 N n 






P  y  Y     0.95


 = error absoluto.
MUESTREO ALEATORIO SIMPLE SIN
REEMPLAZO (“mas”)
• Despejando n de   1 .9 6 V ( y ) se tiene:
n
1


2
1.96  S y
2
2

1
N
1.96 

2
2
S
2
y
MUESTREO ALEATORIO SIMPLE SIN
REEMPLAZO (“mas”)
• Recordemos que:
N
E  yi  E ( yi )   E  yi  Y
2
S 
2
y
N
N 1
 , S 
2
y
2
y
 Y
N
i

2

Y
 1

2
2
y

 Y
i
Y
i
N

2
5.1 Tamaño de la Muestra (“mas”)
• El valor de S2y ó 2y se estima con una prueba
piloto o bien se “adivina” usando tablas (ver Tabla
1), y el conocimiento previo sobre la población.
• Si se considera que y no se ajusta a la distribución
normal, se usa el criterio de fijar la magnitud de la
varianza o del coeficiente de variación de y .
Se determina n para que produzca un coeficiente
de variación dado (CV0) usando estimaciones
“gruesas” de y y de S2y .
Tamaño de la Muestra (“mas”)
• Así
C V0 
V ( y ) 
E(y)
1
2
2
 
S
n  y 
1 


N  n 
 

Y
Despejando n, se obtiene:
2
Sy
n
2
S
y
2
2
(C V0 ) Y 
N
1
2
5.1 Tamaño de la Muestra (“mas”)
• Si n es "grande” se espera que el teorema Central
del Límite dé una buena aproximación de la
distribución de y .
Tamaño de la Muestra (“mas”)
• Así:
y ~N  Y ,V  y  
P  y  z V ( y )  Y  y  z V ( y )   1  


2
2
si 1    .95
2
2

n S
n S
P  y  1.96 (1  )
 Y  y  1.96 (1  )
N n
N n


  0.95

Tamaño de la Muestra (“mas”)
• Entonces
y Y
V ( y ) 
se distribuye
1
2
aproximadamente como
una
normal
estandarizada (media cero y varianza uno),
donde
2
n  Sy

V  y   1 

N  n

Tamaño de la Muestra (“mas”)
• Si se desea un tamaño de muestra tal que el
error de estimación sea inferior a  con una
probabilidad de 1-, esto es:
P
[ | y  Y |  ]  1  
V ( yˆ )
  z
,
2
diviendo entre V
 y  
1
2
 y Y

P

1
1
 [V ( y )] 2 [V ( y )] 2

  1

Tamaño de la Muestra (“mas”)
• De las tablas de la normal estándar, Z~N(0,1),
se obtiene un valor z/2 tal que
P
[Z
 z / 2
]  1
(z/2 es el valor de Z obtenido en las tablas que
deja un área de /2 a la derecha de él).
Tamaño de la Muestra (“mas”)
y Y
• Como
V
y Y
V
 y  
 y  
~ N (0,1) , hacemos que
1
2
sea un valor arbitrario de Z y que:
1
2
z / 2 

V
 y  


1
2
2
Sy 
n 
1 

n 
N 
(a)
Tamaño de la Muestra (“mas”)
• De aquí (a) se despeja n:
n
2
1


2
2
z / 2 S
2
y


1
N
si = 0.05 entonces:
2
n
(1.96) S

2
2
z / 2 S y
2
y
2
Tamaño de la Muestra (“mas”)
2
• Se puede usar
n'
z / 2 S

2
2
y
como una primera
aproximación y luego corregir usando n 
n'
1
n'
N
• Si no se puede suponer normalidad de la
distribución del estimador, se recurre a la
desigualdad de Tchebycheff.
Tamaño de la Muestra (“mas”)
• Desigualdad de Tchebycheff
Sea U una variable aleatoria con cualquier
distribución y E (U )   U , V (U )   U2
 P  U   U    U  
1

2
 P  U   U    U   1 
1

2
Tamaño de la Muestra (“mas”)
 P U    U   U  U    U   1 
1

2
1
 P y   V (y)  Y  y   V (y)  1 2



  2 1
1

2
  3 1
 .75
  4.4 1 
1

2
 .95
1

2
 .889
Tamaño de la Muestra (“mas”)
1
  4.4 V ( y )  n 

.
2
2
(4.4) S
2

(5.4a)
1
N
• En las expresiones anteriores, si tanto  como
S se expresan en por ciento de la media,
 '

100 , C V 
y
transforma a:
S
100
la expresión (5.4) se
y
2
1
n
  '
2

2
Z  / 2 (C V )
2

1
N
z / 2 ( C V )
  '
2
2
.
Tamaño de la Muestra (“mas”)
• Si no se supone normalidad para la distribución
de y y con confianza del 95%, por la
desigualdad de Tchebycheff, entonces (5.4a)
se transforma a:
n
1
( ´)
2

2
(4.4) ( C V )
2

1
N
(4.4)( C V )
( ´)
2
2
Estimación de Proporciones
• Y(ui) es una medida o indicador de la presencia
o ausencia de una característica en la unidad ui
con valor 1 si la característica está presente y 0
si no es así. En este caso
Y  P = proporción de unidades en la población
que tienen la característica


Y 




 Yi

i
 P .
N



N
Estimación de Proporciones
• p  y que es la proporción de unidades en
la muestra con la característica.
• El valor de S2y en términos de P resulta:
N
S 
2
Y

 Y
i
Y
i
N 1
N
N 1

2
 N P 1  P 
P 1  P  , 
2
1
N 1
 P (1  P )
Estimación de Proporciones
con estimador
2
2
Sˆ y  s y 
n
y
i
 y
i
n 1
2

n Pˆ
n 1
(1  Pˆ ).
Con este nuevo valor la expresión (5.3) resulta:
N
1  P 
1 P
N

1
(5.5)
n

2
1

P
2


P  C V0 
C
V
P

 0


 N 1
Para usar esta expresión, se estima a priori o
con una prueba piloto el valor de P y se fija el
CVo que se desea.
Estimación de Proporciones
• Si utilizamos la desigualdad de Tchebycheff
tenemos:
N
2
(4.4)
P (1  P )
1
N 1
n

2
2

1


N
N
2
(4.4)
P (1  P )
N 1
(4.4)
n
4

2
2

5

2
Estimación de Proporciones
• Nótese que si P está cercano a cero, el valor
de n aumenta.
Esto indica que para estimar la proporción de
unidades con una característica rara se
requieren muchas unidades en la muestra.
Estimación de Proporciones
Esto es lo contrario de lo que sucede si se
usa la aproximación a la normal, en cuyo
caso se usa la expresión (5.4) con
S 
2
Y
NP
N 1
1  P 
2

n
1

2
z S
2

2
2
y

1
N
z S
2

2
2
y
.
Estimación de Proporciones
• Si se quiere conocer P, las Yi son 0 ó 1.
S 
2
y
N
N 1
P (1  P )  P (1  P )
z  / 2 P (1  P )
2

n

2
Estimación de Proporciones
• Si   .05  z   1.96  2 , además como
2
la varianza de Pˆ es máxima cuando P = 0.5,
se usa P(1-P)=(.5)(.5)=0.25 como margen de
seguridad
2

n
2 (.25)

2

1

2
Estimación de Proporciones
• Entonces se debe dar que nP>5 y n(1-P)>5 para
que se tenga buena cercanía a la normalidad.
• Al variar  se tienen los siguientes tamaños de
muestra:
n

.001
.01
.02
.025
.3
.035
.4
1,000,000
10,000
2,500
1,600
1,111
816
625
Estimación de Proporciones
Además, si Pˆ ~ N ( P , V ( Pˆ )) entonces se debe
reportar el resultado de la estimación de P
con un intervalo de confianza aproximado
dado por:
P  p  1.96 Vˆ ( p )  P  p  1.96 Vˆ ( p )   .95,


ˆ
ˆ
n
N
p
(1

p
)


ˆ
V ( pˆ )   1 

N   N  1 n

Descargar

5. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO (“mas”)