MUESTREO BÁSICO
Ing. Juan Trejo Bedón
MUESTREO ALEATORIO SIMPLE
(M.A.S.)
MUESTREO ALEATORIO
SIMPLE (M.A.S.)
• Método de selección de la muestra en un paso
• El marco muestral debe ser una lista completa
• Cada unidad tiene la misma probabilidad de
selección
• Esta probabilidad es p = n/N
– donde n es el tamaño de la muestra
– y N es el tamaño de la población
• Cada muestra (de n) tiene la misma
probabilidad de selección
Muestreo Aleatorio Simple
• Población
N = 54 viviendas
• Muestra
n = 18
• Fracción muestral
p = n / N = 18 / 54 = 1/3
• Cada vivienda tiene probabilidad de selección 1/3
• Se seleccionan 18 números aleatorios entre 1 y 54
• Se seleccionan las viviendas correspondientes
Muestreo Aleatorio Simple
San José
Av 28 de Julio
San Luis
San Pablo
San Carlos
San Ricardo
San Roberto
San Benito
Santo domingo
San Pedro
Av. circunvalación
Muestreo Aleatorio Simple
San José
Av. 28 de Julio
San Luis
San Pablo
San Carlos
San Ricardo
San Roberto
San Benito
Santo Domingo
San Pedro
Av Circunvalación
Muestreo Aleatorio Simple
San José
Av. 28 de Julio
San Luis
San Pablo
San Carlos
San Ricardo
San Roberto
San Benito
Santo Domingo
San Pedro
Av Circunvalación
Muestreo Aleatorio Simple
Ventajas del MAS
• Sencillez conceptual
• Necesita como marco muestral sólo una lista de
todos los elementos de la población
• Es fácil calcular las estimaciones de valores
poblacionales
• Es fácil calcular las estimaciones de precisión
(varianza muestral)
Muestreo Aleatorio Simple
Desventajas del MAS
• Tedioso eligir todos los números aleatorios si n
es grande
• No utiliza información auxiliar sobre la población
• Necesita una lista completa de los elementos de
la población
• Puede tener baja precisión comparado con otros
métodos
Muestreo Aleatorio Simple
El MAS se puede realizar:
• Con reposición (MASCR)
• Sin reposición (MASSR)
Muestreo Aleatorio Simple
MASCR
• Seleccionar una unidad
• “Reemplazarla” en la población
• Seleccionar otra, de la población completa
• Continuar hasta obtener una muestra de
tamaño n
• Se puede seleccionar la misma unidad más
que una vez
Muestreo Aleatorio Simple
MASSR:
•
•
•
•
•
•
•
Seleccionar una unidad
“Sacarla” de la población
Seleccionar otra unidad de las que quedan y sacarla
Continuar hasta obtener n unidades distintas
Cada unidad puede estar incluida una sola vez
Es más eficiente que el MASCR
Se usa en la práctica
Ejemplo del MAS
Encuesta de las empresas sobre
Gastos en insumos
•Población de seis empresas (N = 6)
•Propósito: estimar gastos para compras
de insumos
•Presupuesto permite sólo una muestra
de dos empresas (n = 2)
Ejemplo del MAS
Población completa
Empresa
1
2
3
4
5
6
Total
Gastos
$ 26,000
470,000
63,800
145,000
230,000
12,500
947,300
Muestras
posibles
Gastos
observados
(1,2)
496,000
(1,3)
89,800
(1,4)
171,000
(1,5)
256,000
(1,6)
38,500
(2,3)
533,800
(2,4)
613,000
(2,5)
700,000
(2,6)
482,500
(3,4)
208,800
(3,5)
293,800
(3,6)
76,300
(4,5)
375,000
(4,6)
157,500
(5,6)
252,500
15 muestras posibles
Estimación
del total
1,488,000
269,400
513,000
768,000
115,500
1,601,400
1,845,000
2,100,000
1,447,500
626,400
881,400
228,900
1,125,000
472,500
727,500
promedio 947,300/6 : insesgado
ESTIMACION DEL TAMAÑO DE MUESTRA - “MAS”
VARIABLES CUANTITATIVAS
Elementos para calcular un tamaño de muestra
1. Información anterior de promedios y varianzas de variables
relacionadas con la investigación (Censos, encuestas, pilotos).
2. Elegir un nivel de confianza
( 90%, 95%, 99%) . Generalmente para
estudios macroregionales, regionales,
locales se elige 95%.
Es decir: Z = K = 1.96 (abscisa de la
distribución Normal)
3. Decidir sobre el margen de error (e ) que estamos dispuestos a
tolerar (Error máximo permisible = Error Absoluto aceptado).
( e = d .  Donde : d = Error Relativo Aceptado).
4. Tamaño de la Población ( N )
Fórmula para estimar el
tamaño de la muestra (M.A.S.)
n 
no
1
no
2
, donde : n o 
N
e = Margen de error. Es el error absoluto del
Promedio Poblacional ( e = d .  )
d = Es el error relativo aceptado (precisión)
Z S
e
2
2
MUESTREO ALEATORIO PARA PROPORCIONES
VARIABLES CUALITATIVAS O DE ATRIBUTOS
POBLACIÓN
(N)
=


 


N X
X

X
 P 
 P roporción poblacional
N
Número de elementos en la población, que tienen alguna
característica o atributo, o que caen dentro de alguna clase.
n
Proporción muestral:
Estimador del Total de
Clase Poblacional
pˆ 
 xi
i 1
n

Xˆ
n
Xˆ  N pˆ
ESTIMADOR DE
LA PROPORCION
POBLACIONAL
n
VARIANZA DE LA PROPORCION Y DEL TOTAL DE CLASE
MUESTRALES - “MAS”
En el muestreo aleatorio sin reposición las varianzas de la
Proporción muestral y del Estimador del Total de Clase
están dadas respectivamente por:
VARIANZA DE LA
PROPORCION
MUESTRAL
VARIANZA DEL
ESTIMADOR DEL
TOTAL DE CLASE
donde:
PQ  N  n 
V ( pˆ ) 

 
n  N 1 
V
n
N
 
Xˆ
pˆ qˆ  N  n 
ˆ
V  pˆ  


n  N 1 
N PQ  N  n 
ˆ ˆ


  V X
n
 N 1 
2
  N
2
pˆ qˆ  N  n 


n  N 1 
 f es la tasa muestral o fracción de muestreo
ESTIMACION DEL TAMAÑO DE MUESTRA - “MAS”
(VARIABLES CUALITATIVAS O DE ATRIBUTOS)

P  pˆ  P  Z

Tenemos que:
PQ  N  n

n  N 1

  1
 
Tal que, el error de estimación no debe ser mayor que un valor
dado “e”


Z
pˆ
( ERROR MAXIMO PERMISIBLE O ERROR ABSOLUTO ACEPTADO):

e

Z 
2
2
pˆ

e
2

 PQ  N  n 
Z 

 
 n  N  1 
2
e
2
no
n 
1
 no
 1  , donde : n 
o
N
2
Z PQ
e
2
e = d.P
d = error relativo
aceptado (precisión)
ERROR RELATIVO ACEPTADO
COEFICIENTE
DE VARIACIÓN
PRECISION
NIVEL DE CONFIANZA: (1   )
MODELO
DE
Error Máximo
Z = 1.645
Z = 1.96
Z = 2.38
Permisible (%)
MATRIZ
PARA
d
95%
98%
ESTIMAR
EL 90%
10%
74
TAMAÑO
DE
MUESTRA
7%
152
5%
296
1%
890
ERROR RELATIVO ACEPTADO
COEFICIENTE
DE VARIACIÓN
PRECISION
NIVEL DE CONFIANZA: (1   )
MODELO
DE
Error Máximo
Z = 1.645
Z = 1.96
Z = 2.38
Permisible (%)
MATRIZ
PARA
d
95%
98%
ESTIMAR
EL 90%
10%
74
105
TAMAÑO
DE 53
MUESTRA
7%
107
152
214
5%
210
296
418
2%
325
890
1370
MUESTREO SISTEMATICO
¿QUÉ ES UN MUESTREO
SISTEMATICO?
• Es otro muestreo que también le asigna
igual probabilidad de inclusión uniforme
para todos, como el simple al azar.
• Nuevamente esta probabilidad es n/N.
• Es conveniente por su simplicidad ya que
se necesita sólo un número aleatorio.
• Fácil de seleccionar en campo o durante el
operativo
• Se logra en general una muestra más
“representativa” de la población.
¿QUÉ ES UN MUESTREO
SISTEMATICO? (cont.)
• No es necesario conocer el tamaño de la
población N si se conoce la fracción de
muestreo.
• Origina muestras bien dispersas desde
el punto de vista geográfico.
• Se emplea generalmente en las últimas
etapas en diseños en varias etapas o
más complejos.
¿Cómo se selecciona una muestra
sistemática?
• Paso 1: Fijar el tamaño de la muestra, n.
• Paso 2: Determinar un paso o intervalo,I=N/n.
• Seleccionar un número al azar entre 1 y I; sea ese
número igual a k.
• Seleccionar las unidades k, k+I, k+2I, k+3I, k+4I,......
Hasta llegar a completar las n necesarias.
1
2
3
N
¿Cómo se selecciona una muestra
sistemática?(cont.)
Muestreo Sistemático Circular, útil
cuando n no es múltiplo de N.
1 1
2
1
1
0
9
3
4
8
7
5
6
Arranque
aleatorio
MUESTREO SISTEMATICO: Ejem. 1
Población de tamaño N = 30, muestras
posibles sistemáticas de tamaño n = 6.
Intervalo selección k = N / n = 30/6 = 5
Muestras posibles de tamaño n = 6 :
1ra muestra: 1 6 11 16 21 26
2da muestra: 2 7 12 17 22 27
3ra muestra: 3 8 13 18 23 28
4ta muestra: 4 9 14 19 24 29
5ta muestra: 5 10 15 20 25 30
Ejem. 2: Seleccionar muestra de n = 20
empresas de lista de N = 500 empresas
• Esto significa que 1 de cada 25 empresas de la
población se seleccionará
• Utilizando # al azar seleccionamos un número entre 1
y 25.
• Suponga que el # seleccionado es 7.
• Entonces la 1ra empresa. selecc. es el # 7.
• Las otras 19 empresas de la muestra se obtienen
sumando al 7 el intervalo de selección 25.
• Es decir: 07, 32, 57 , ..........
Ejem.2 : La muestra de n = 20 empresas
seleccionadas de N = 500 empresas es:
07 32
57
82
107
132
157 182
207
232
257
282 307
332
357
382
407 432
457
482
 Una ventaja del método sistemático es que la
muestra se distribuye por igual en los diversas
empresas.
 Una M.A.S. tomada de la población no posee esta
propiedad.
Muestreo Estratificado
Aleatorio (M.E.A.)
Muestreo estratificado
• Proceso de división de la población en grupos
homogeneos llamados estratos, para luego
seleccionar muestras independientes en cada
estrato
• Variables de estratificación
geográficas o no-geográficas
pueden
ser
• Estratificación se limita a los elementos de
información disponibles en el marco muestral
RAZONES PARA LA ESTRATIFICACION
1. Protegernos contra la posibilidad de obtener
una mala muestra.
2. La estratificación se utiliza para disminuir las
varianzas de los estimadores
( disminuir la
varianza para obtener estimaciones más precisas)
3. Se pueden formar estratos para aplicar diferentes
métodos y procedimientos de muestreo dentro de
cada estrato. (Selección de la muestra y
procedimientos de recojo de información).
4. Los estratos pueden establecerse para dar
resultados a nivel de “DOMINIOS DE ESTUDIO”
(Nivel de inferencia)
MUESTREO ALEATORIO ESTRATIFICADO ( MAE )
POBLACION
ESTRATOS
ESTRATO 1
(Empresas
grandes)
N1
n1
(Empresas
medianas)
N2
n2
ESTRATO 3
(Empresas
pequeñas)
N3
n3
ESTRATO 2
L
T al que ,
N  N1  N 2  N 3
 N 
N
h 1
L
n  n1  n 2  n 3
 n
n
h 1
h
h
Muestreo estratificado
Ejemplo 1 de M.E.A.
Estratificacion de
usuarios de la empresa
EDELNOR (parte de Lima)
ESTRATIFICACION DE LA POBLACION
DE 267,694 CLIENTES (EDELNOR)
Nº
de
estrato
ESTRATOS
(Sub-estaciones
transformación)
Nº de clientes
% de clientes
(Tamaño del
estrato)
N1 = 57,241
(Poderación del
estrato)
h =1
Canto Grande
W1 = 21.4
h =2
Jicamarca
N2 = 37,932
W2 = 14.2
h=3
Mirones
N3 = 41,157
W3 = 15.4
h=4
Santa Rosa
N4 = 66,440
W4 = 24.8
h=5
Tacna
N5 = 64,924
W5 = 24. 2
TOTAL
N = 267,694
100.0
MUESTRA DE 500 CLIENTES DE LA POBLACION DE
267,694 CLIENTES (EDELNOR)
Nº
de
estrato
ESTRATOS
(Sub-estaciones
transformación)
% de clientes
Nº de clientes
(Poderación del
estrato)
h =1
Canto Grande
W1 = 21.4
(Tamaño del
estrato)
n1 = 107
h =2
Jicamarca
W2 = 14.2
n2 = 71
h=3
Mirones
W3 = 15.4
n3 = 77
h=4
Santa Rosa
W4 = 24.8
n4 = 123
h=5
Tacna
W5 = 24.2
n5 = 122
100.0
n = 500
TOTAL
RESULTADOS MUESTRALES DE 500 CLIENTES:
promedio muestral mensual y desviación estándar de consumo por
estratos
N°
ESTRATOS
Clientes
nh
Media
xh
Desviación
estándar
sh
1
Canto Grande
107
1,200
10,000
2
Jicamarca
71
800
6000
3
Mirones
77
3,000
30,000
4
Santa Rosa
123
2,350
25000
5
Tacna
122
2,100
20,000
TOTAL
500
2,000
22,000
AFIJACION DE LA MUESTRA
Se da el nombre de afijación al reparto,
asignación o distribución de la muestra (n)
entre los diferentes estratos. Tal que:
n1  n 2  n3  .....  n L  n
1. AFIJACION PROPORCIONAL
 Nh 
nh  n 
  n Wh
 N 

nh
n

Nh
N
o
nh
Nh

n
N
o
fh  f
2. AFIJACION DE NEYMAN ( O DE MINIMA VARIANZA)
La afijación de Neyman o afijación de mínima
varianza, consiste en determinar los valores de nh
de forma que para un tamaño de muestra (n) fijo,
la varianza V ( X st ) sea mínima.


nh  n 



2
h


N hSh

L

N
S
 h h
h 1

donde : S : cuasivarianza poblacional del est rato h
3.
AFIJACION DE OPTIMA
La afijación de óptima, consiste en minimizar la varianza
para un coste fijo.L Es decir, minimizar V ( X st ) con
la
condición de que:  C h n h  C
h 1


nh  n 



N h Sh
Ch
L

h 1
N h Sh
Ch






donde :
C : costo total
C h : costo por unidad en el
estrato h ( costo unitario )
2
S h : cuasivarianza poblacional
del estr ato h
NOTA: Cuando Ch = constante  h, la Afijación Optima
coincide con la Afijación de Neyman
Muestreo por conglomerados
Muestreo por
conglomerados
• Es un proceso de muestreo en dos
pasos
– Agrupar
la
población
en
conglomerados
que
se
pueden
identificar en mapas y en el terreno
– Seleccionar
una
muestra
de
conglomerados y entrevistar todos los
elementos de aquellos
Muestreo por
conglomerados
• Conglomerados
pueden
ser
agrupaciones
naturales
o
artificiales
• Posiblemente
disponibles
de
fuentes como el Censo (manzanas,
etc.)
• Los que diseñan la encuesta tal vez
tengan que conformarlos
Muestreo por
conglomerados
• Se entiende la población como
jerarquía de unidades
–personas viven en viviendas
–viviendas constituyen manzanas
–muchas manzanas hacen una
ciudad
Encuesta de estudiantes
 = Escuelas
 = Estudiantes
Muestra por conglomerados
 =
Escuelas
 = Estudiantes
 = Seleccionados
Muestreo por
conglomerados
• Ventajas
– Se pueden utilizar aun cuando no haya lista de
unidades de la población
– Para entrevistas personales, el tiempo y costo
de viajes se reduce muchísimo, sobre todo para
poblaciones rurales
– Se necesita sólo una lista de conglomerados
– O la posibilidad de construirla
Muestreo por
conglomerados
• Desventajas
– Tendencia de unidades vecinas de ser semejantes
reduce la precisión
– Dado n fijo, sería menos eficiente
– Pero si se consideran los costos en el terreno, la
posibilidad de aumentar n implica menor pérdida
de precisión en la práctica
MUESTREO POR
CONGLOMERADOS
• En el muestreo por conglomerados, los elementos
individuales de la población sólo pueden participar en
muestra si pertenecen a un conglomerado (UPM)
incluido en la muestra.
• La UPM no es igual a la unidad de observación (USM),
y hay que tomar en cuenta los dos tamaños de
unidades experimentales al calcular los errores
muestrales de las muestras por conglomerados.
¿ PORQUE USAR MUESTREO
POR CONGLOMERADOS ?
• La construcción de una lista de unidades de
observación para el marco de muestreo puede ser
difícil, cara e imposible.
• La
población
podría
estar
muy
dispersa
geográficamente o aparecer en cúmulos naturales,
como las escuelas, hospitales, manzanas, familias.
• El muestreo por conglomerados se utiliza en la
práctica debido a que es más barato y conveniente
obtener muestras por conglomerados que al azar
entre la población.
MUESTREO POR
CONGLOMERADOS
• La población está particionada
en N conjuntos que
llamaremos “Conglomerados”
• No se cuenta con una lista de unidades de la población, pero
se tiene una lista de los conglomerados.
• La forma de obtener una muestra consiste en escoger n
conglomerados, y en cada uno de ellos se observan todas las
unidades de población que estaban en cada conglomerado
selecionado.
• Este procedimiento de obtener la muestra se denomina
muestreo por conglomerados.
MUESTREO POR
CONGLOMERADOS : Ejemplo
Número de niños por manzana
Las 3510 manzanas de una ciudad se
localizan en 90 poblados (urbanizaciones,
AAHH y conjuntos habitacionales).
El número de manzanas en las diferentes
urbanizaciones, AA.HH., C.H. no es el
mismo .
Se selecciona una muestra aleatoria simple de
15 poblados y se determina el # de niños por
manzana.
MUESTREO POR
CONGLOMERADOS : Ejemplo3
• Promedio de Niños por manzana = 12.24
• La estimación de la varianza del promedio de
niños es de = 0.5854
• El Error Muestral absoluto de la estimación de
la varianza del promedio de niños por manzana es la
Raíz cuadrada de = 0.5854. Es decir :
Error muestral = 0.7651 niños por manzana
Error muestral relativo = .7651/12.24 =
6.25 %
Descargar

Muestreo Aleatorio Simple