Construcción y Utilización de
los Marcos de Muestreo por Areas
para Censos y Encuestas Agropecuarias
presentado por
Theresa “Terry” Holland
Servicio Nacional de Estadística Agropecuaria (NASS)
Departamento de Agricultura de los Estados Unidos
Taller Regional sobre
Muestreo para Encuestas Agropecuarias
21 de Junio de 2011
Montevideo, Uruguay
Definiciones
Marco muestral:
• una herramienta (recurso) mediante
la cual se pueden extraer muestras
de una población objeto
• un listado de todas las unidades muestrales
y un conjunto de reglas para identificar las
unidades en la población
Definiciones
población objeto
todos los elementos (gente, explotaciones, animales,
empresas, etc.) sobre los cuales se necesita información
unidades muestrales
unidades claramente definidas que permitan el acceso
a la población objeto
unidades poblacionales
cada uno de los elementos de la población objeto
Marcos Muestrales
Marcos por listado:
productores
empresas agropecuarias
campos o huertas
Marcos por área:
segmentos de terreno
El Marco por Listado del NASS
De qué se trata?
datos para identificar, ubicar y tomar contacto
con los productores y las empresas agropecuarias
nombre
dirección
número de teléfono
provincia, departamento y distrito
número del Seguro Social
número de Identificación del empleador
datos sobre la explotación o empresa
superficie total
superficie de cada cultivo
capacidad de almacenamiento de granos
existencias ganaderas máximas
máximo número de mano
.. de obra contratada
.
El Marco por Listado del NASS
Cómo se construye?
Fuentes para obtener nuevos nombres y datos
organizaciones de agricultores
listados de programas agrícolas
registros impositivos provinciales y locales
registros provinciales y locales de licencias
listados de otras agencias federales, provinciales y locales
artículos de diarios y revistas
Fuentes para actualizar nombres y datos
encuestas permanentes del NASS
Censo de Agricultura
El Marco por Listado del NASS
Cómo se usa?
➊ clasifique
identificar a los productores y/o empresas
agropecuarias que puedan tener información
de interés
➋ estratifique
agrupar unidades similares según el tamaño o
cantidad de las variables que se van a medir
➌ muestra
seleccionar unidades en cada grupo
➍ encuesta
obtener datos sobre las unidades elegidas
➎ resumen
expandir los datos usando las probabilidades
de selección
El Marco por Listado del NASS
Illinois – Encuestas Trimestrales sobre Cultivos/Existencias:
estrato
tamaño
de muestra
intervalo
muestral
porcentaje
en la muestra
límites de la clase
población
62
capacidad 1 - 9,999
6387
100
63.9
2
65
cultivado 200 - 599
7221
210
34.4
3
66
capacidad 10,000 - 49,999
11231
400
28.1
4
72
cultivado 600 - 2,499
7627
500
15.3
7
73
sorgo 1+
2495
200
12.5
8
78
capacidad 50,000 - 499,999
5912
550
10.7
9
79
cultivado 2,500 - 5,499
474
100
4.7
21
95
cultivado 5,500+
29
29
1.0
100
97
capacidad 500,000+
23
23
1.0
100
41399
2112
total
1997
El Marco por Listado del NASS
Illinois – Encuestas Trimestrales sobre Porcinos:
estrato
límites de clase
población
tamaño
de muestra
intervalo
muestral
porcentaje
en la muestra
80
cabezas 1 - 99
1711
70
24.4
4
82
cabezas 100 - 499
1138
220
5.2
19
84
cabezas 500 - 999
366
225
1.6
61
86
cabezas 1,000 - 1,999
289
255
1.1
88
88
cabezas 2,000 - 2,999
132
125
1.1
95
90
cabezas 3,000 - 4,999
116
116
1.0
100
92
cabezas 5,000 - 14,999
116
116
1.0
100
98
cabezas 15,000+
28
28
1.0
100
3896
1155
total
2005
El Marco por Listado del NASS
Fortalezas:
✓ puede usar métodos de recolección de datos
de bajo costo (correo, teléfono)
✓ puede estudiar productos específicos o atípicos
✓ puede reducir la variabilidad debida al
muestreo
✓ es eficiente en cuanto a los costos
El Marco por Listado del NASS
Debilidades:
✗ no cubre a toda la población
✗ se desactualiza rápidamente
✗ aumenta los errores de no muestreo debidos a
los métodos de obtención de los datos
✗ requiere mantenimiento permanente
construir
actualizar
eliminar las duplicaciones
eliminar los registros fuera de contexto
El Marco por Listado del NASS
Cobertura:
Número de Explotaciones
70%
por Valor de las Ventas (Junio 2008)
$100,000+
$10,000-99,999
$1,000-9,999
93%
82%
58%
por Tipo de Explotacion (Junio 2008)
Cultivos
Ganado
Otros
89%
71%
64%
por Producto
Maíz (Junio 2009)
Soja (Junio 2009)
Trigo de invierno (Junio 2009)
Porcinos (Diciembre 1, 2008)
Ganado (Enero 1, 2009)
93%
92%
92%
98%
89%
Superficie con Explotaciones 91%
El Marco por Listado del NASS
Técnicas de Muestreo:
• Muestreo Simple al Azar (SRS)
• Muestreo Sistemático
• Muestreo Estratificado
• Probabilidad Proporcional al Tamaño (PPS)
• Probabilidad Multivariada Proporcional al Tamaño (MPPS)
• Número al Azar Permanente (PRN)
El Marco por Areas del NASS
De qué se trata?
la superficie de los Estados Unidos
dividida en segmentos
utilizando límites físicos
asociar explotaciones, cultivos, animales, etc.
con la superficie dentro de los segmentos
El Marco por Areas del NASS
Cómo se construye?
utilizando…
imágenes satelitarias
mapas digitales
software SIG
fotografías aéreas
➊ se divide la superficie apta en estratos según el uso de la
tierra y la aptitud para la producción agrícola
➋ se subdivide a los estratos por uso de la tierra en bloques
➌ se selecciona una muestra de bloques en cada estrato
➍ se subdivide a los bloques de estrato seleccionados en
segmentos
El Marco por Areas del NASS
Categorías Generales de Uso de la Tierra
superficie arable general
75% o más cultivada
superficie arable general
50-74% cultivada
superficie arable general
15-49% cultivada
agro-urbana
menos del 15% cultivada,
residencial mezclada con agricultura
cría y pastoreo
menos del 15% cultivada
residencial y comercial
sin cultivo
no-agropecuaria
agua
El Marco por Areas del NASS
Imágenes satelitarias:
El Marco por Areas del NASS
Características de los mapas digitales:
El Marco por Areas del NASS
Bloques en los estratos - unidades primarias de muestreo (PSUs):
El Marco por Areas del NASS
Estratificación por uso de la tierra para Illinois:
El Marco por Areas del NASS
PSU seleccionada y segmento:
El Marco por Areas del NASS
Estratos por Uso de la Tierra y los Segmentos Elegidos:
>50% cultivada
15-50% cultivada
<15% cultivada
agro urbana
comercial
no agropecuaria
agua
El Marco por Areas del NASS
Cómo se usa?
➊ muestra
seleccionar una muestra de segmentos generalmente se mantienen los segmentos en
la muestra durante 5 años, se rota el 20% de la
muestra cada año
➋ encuesta
dar cuenta de toda la superficie y los animales
dentro de los límites del segmento, obtener
información sobre todas las explotaciones con
superficie dentro de los segmentos
➌ resumen
expandir los datos usando las probabilidades de
selección (basadas en la superficie de la tierra)
El Marco por Areas del NASS
Illinois – Diseño de la Muestra por Area (2006)
estrato
límitess
superficie
total
mi2
tamaño
del
segmento
número total
de
segmentos
número de
segmentos
en la
muestra
factor de
expansión
30923
1.00
30936
250
124
11
>75% cultivada
12
51-75% cultivada
8513
1.00
8512
70
122
20
25-50% cultivada
10834
1.00
10836
50
217
31
agro-urbana: >100 hogares/mi2
2681
0.25
10718
10
1072
32
comercial: >100 hogares/mi2
676
0.10
6768
4
1692
40
<25% cultivada
1984
1.00
1981
15
132
50
no-agropecuaria
216
pps
53
2
27
69804
401
total
55827
2007
El Marco por Areas del NASS
Herramientas para la recolección de los datos:
Mapa de Rutas
Foto Aérea
El Marco por Areas del NASS
Obtención de los Datos:
El Marco por Areas del NASS
Estimadores muestrales por “Segmento”:
y hjkm  w hjkm x hjkm
y 

h
e hjk 
j
Nh
nh
e hjk

k
y hjkm
m
h
= estrato por uso de la tierra
j
= bloque de estrato dentro del estrato h
k
= segmento dentro del bloque de estrato j
m
= explotación agrícola dentro del segmento k
ehjk =factor de expansión del segmento seleccionado k
whjkm = ponderación de la explotación agrícola m
xhjkm = dato de la encuesta de la explotación m
Nh
= número de segmentos posibles en el estrato h
nh
= número de segmentos seleccionados en el estrato h
El Marco por Areas del NASS
Estimadores muestrales por “Segmento”:
Cerrado
whjkm = 1
xhjkm = valor de una variable sólo dentro del segmento
Abierto
whjkm = 1 si el productor reside dentro del segmento; 0 en otro caso
xhjkm = valor de una variable para la totalidad de la explotación
Ponderado
whjkm = proporción de la superficie total de la explotación dentro
del segmento
xhjkm = valor de una variable para la totalidad de la explotación
El Marco por Areas del NASS
Fortalezas:
✓ cobertura total
✓ menores errores de no-muestreo
✓ estima bien aquellos productos
que se producen regularmente
✓ versatilidad
✓ longevidad
El Marco por Areas del NASS
Debilidades:
✗ caro (la construcción del marco y la recolección de los datos)
✗ difícil para estimar productos especiales o
raros
✗ sensibles a los datos fuera de rango outliers
✗ puede ser ineficiente
✗ requiere límites físicos reconocibles
El Marco Múltiple del NASS
De qué se trata ?
una forma de aprovechar las fortalezas
tanto del marco por listado como del de áreas
área - completo
listado - eficiente
población➚
El Marco Múltiple del NASS
Cómo se usa?
➊ muestra
seleccionar muestras por listado & por área
➋ encuesta
recolectar los datos de las unidades seleccionadas
en ambos marcos - determinar si las explotaciones
de la muestra por áreas están en el listado (OL)
➌ resumen
expandir los datos de la muestra por listado & los
de las explotaciones de la muestra por áreas que
no figuran en el listado (NOL) usando las
probabilidades de selección
expansión MM = expansión listado + expansión NOL
El Marco Múltiple del NASS
Area
Listado
Windy Ridge Farm
John Brown
1234 Farm Rd
Anywhere, US 00000
Richard Jones
789 Ranch Rd
Anystate, US 99999
Bill Smith
NOL
Joe Green
NOL
Bob Smith
OL
Windy Ridge Farm
OL
Bob Smith
56 Orchard Rd
Anywhere, US 00000
Dave White
123 Farm Rd
Anywhere, US 00000
El Marco Múltiple del NASS
Fortalezas:
✓ conjuntamente los marcos cubren la población
objeto
✓ se puede controlar la variabilidad debida al
muestreo
✓ se pueden controlar los costos con listados
amplios, pequeñas muestras por áreas
✓ permite estudiar productos especiales o raros
El Marco Múltiple del NASS
Debilidades:
✗ NOL (los que no figuran en el listado) puede ser muy
pequeño
✗ identificar la superposición puede ser
dificultoso
✗ si la identificación de la superposición es
incorrecta se puede producir sesgo en las
estimaciones
✗ se deben mantener los marcos por listado y por
áreas en forma independiente
Otros Tipos de Marcos por Areas
segmentos basados en la latitud & longitud
unidad de muestreo = segmento de tierra cuyos límites son la latitud & longitud
asocia los campos, tierra, animales, etc. con la superficie que está dentro del segmento
segmentos basados en puntos aleatorios
unidad de muestreo = segmento delimitado alrededor de un punto aleatorio de acuerdo con reglas específicas
asocia los campos, la tierra, animales, etc. con la tierra que está dentro de o tocando el segmento
puntos aleatorios
unidad de muestreo = un punto aleatorio
asocia los campos, la tierra, animales, etc. con el productor que trabaja la tierra en ese punto
El Marco por Areas de Nigeria - Piloto en Kaduna
Imágenes satelitarias:
El Marco por Areas de Nigeria - Piloto en Kaduna
Bloques en los estratos:
El Marco por Areas de Nigeria - Piloto en Kaduna
Estratos por Uso de la Tierra & los Puntos Seleccionados:
El Marco por Areas de Nigeria - Piloto en Kaduna
Cómo se usa?
➊ muestra
seleccionar una muestra de puntos aleatorios
➋ encuesta
1. ubicar el punto en el terreno
2. localizar al productor que trabaja la tierra en
dicho punto
3. si el que trabaja la tierra es el productor,
obtener información sobre la totalidad del
establecimiento agropecuario
➌ resumen
expandir los datos utilizando las probabilidades
de selección de los puntos específicos basadas
en la superficie total del estrato, el número de
puntos seleccionados en el estrato y la superficie
total trabajada por el respectivo productor
El Marco por Areas de Nigeria - Piloto en Kaduna
Kaduna - Diseño Muestral por Areas
estrato
factores de expansión esperados:
límites
superficie total
km2
número de
puntos
seleccionados
sup
media
explotac
= 2 ha
sup
media
explotac
= 5 ha
sup
media
explotac
= 100 ha
11
sup agríc, >50% cultivada
21693.90
350
3099
1240
62
20
sup agríc 15-50% cultivada
10019.37
150
3340
1336
67
31
agro-urbana
334.84
20
837
335
17
40
sup agric, <15% cultivada
11710.74
80
7319
2928
146
50
superf no agríc
360.52
0
62
agua ≥ 1 km2
101.27
0
44220.65
600
total
El Marco por Areas de Nigeria - Piloto en Kaduna
Herramientas para la obtención de los datos:
Mapas satelitales
GPS
El Marco por Areas de Nigeria - Piloto en Kaduna
Obtención de los datos :
El Marco por Areas de Nigeria - Piloto en Kaduna
Estimador muestral por “Punto”:
y ij  e ij p ij x ij
y 

i
e ij 
y ij
j
i
= estrato por uso de la tierra
j
= punto seleccionado dentro del estrato
Li = superficie total del estrato i
ni = número total de puntos seleccionados en el estrato i
eij = factor de expansión del punto seleccionado j dentro
del estrato i
pij = indicador poblacional del punto j en el estrato i
Li
xij = dato de la encuesta para el punto j en el estrato i
n i l ij
lij = superficie total en la explotación situada en el punto j
del estrato i
Descargar

NASS Sampling Frames