Métodos y Distribuciones de Muestreo
En este capítulo comenzamos eI
estudio del muestreo.
El muestreo es una herramienta
estadística utilizada para inferir algo
respecto de una población mediante Ia
selección de una muestra de esa
población.
Repasemos…
La estadística descriptiva incluye los
métodos para organizar, resumir y
presentar datos de manera informativa.
La estadística inferencial incluye los
métodos usados para determinar algo
acerca de la población basándose en
una muestra
Selección de muestras de la población
En muchos casos, el muestreo es Ia
única manera de determinar algo
respecto de Ia población.
Algunas razones por las que eI muestreo
es necesario son:
 El costo de estudiar a todos los
integrantes de una población con
frecuencia es prohibitivo.
 La idoneidad de los resultados de Ia
muestra.
 Con frecuencia, ponerse en contacto
con toda Ia población supondría
mucho tiempo.
 La naturaleza destructiva de ciertas
pruebas.
 La imposibilidad física de verificar
todos los articulos de Ia población.
Métodos de muestreo probabilístico
En general, existen dos tipos de muestras:
-
probabilísticas
no probabilísticas.
En el muestreo probabilístico, cada
uno de los artículos de Ia población
tiene Ia misma oportunidad de ser
elegido para la muestra.
Si se utilizan métodos no
probabilisticos, no todos los artículos
o personas en Ia población tienen Ia
misma posibilidad de ser incluídos en la
muestra.
En tal caso, quizá los resultados
estén sesgados, Io que significa que es
posible que los resultados de Ia muestna
no sean representativos de Ia población.
El muestreo por paneles y el muestreo
de conveniencia son dos métodos no
probabilísticos.
La selección de los miembros se
basa en eI criterio de quien dirige Ia
investigación, y por Io tanto, tal vez
no sea representativa del total de Ia
población.
Los procedimientos estadísticos
que se usarán en esta unidad se basan
en el muestreo probabilístico.
No existe un “mejor” método para
seleccionar una muestra probabilística
de una población de interés.
Todos los métodos de muestreo
probabilístico tienen similar finalidad:
- permitir que el azar determine
los artículos o personas que
incluye Ia muestra.
Tipos de muestreo probabilístico
El tipo de muestreo que más se utiliza
es el muestreo aleatorio simple.
En el muestreo aleatorio simple se
selecciona la muestra de tal forma que
cada uno de los elementos o personas
en la población tenga las mismas
probabilidades de ser incluído.
Ejemplos:

Por sorteo

utilizando una tabla de
números aleatorios
(apéndice E)
página 524
Extracto de la tabla de números aleatorios
02711
94873
54921
77640
61545
08182
90935
78680
97636
00835
Autoevaluación 7-1
(página 224)
El segundo tipo de muestreo es el
muestreo aleatorio sistemático.
En el muestreo aleatorio
sistemático se acomodan los los
elementos o personas de la población
utilizando algún patrón o razón.
Se selecciona un punto de partida
aleatorio (al azar) y luego se toma
cada k-ésimo miembro para formar
parte de la muestra.
En ciertas circunstancias una muestra
sistemática podría producir
resultados sesgados.
El tercer tipo de muestreo es el
muestreo aleatorio estratificado.
En el muestreo aleatorio estratificado:
1) se divide la población en
subgrupos llamados estratos,
2) y se selecciona una muestra
de cada uno de ellos.
Una muestra estratificada garantiza la
representación de cada subgrupo.
El cuarto tipo de muestreo es el
muestreo por conglomerados.
Muchas veces se le emplea para reducir el
costo de realizar un muestreo de una
población dispersa en una gran área
geográfica
.
Se emplea el muestreo por conglomerados
subdividiendo el área en unidades pequeñas,
ya fueran municipios o regiones. Muchas
veces, éstas se conocen como unidades
primarias.
Se trata de una combinación del muestreo
por conglomerados y el muestreo aleatorio
simple.
Autoevaluación 7-2
(página 228)
“Error” en el muestreo
Es posible que existan ciertas diferencias
entre las estadísticas de Ia muestra,
como Ia media o Ia desviación estándar de Ia
muestra, y los parámetros de la población
correspondientes.
La diferencia entre un estadístico de Ia
muestra y un parámetro de Ia población se
conoce como error de muestreo.
Distribución muestral de las medias
de las muestras
Si se organizaran las medias de todas las
muestras posibles de un tamaño de
muestra dado, en una distribución de
probabilidad, se obtendrá una distribución
muestral de las medias de las muestras.
Ejemplo:
Tartus Industries tiene siete empleados de
producción (tamaño de Ia población).
Los salarios por hora de cada uno de ellos
se enlistan a continuación:
Empleado
Salario Por hora
Joe
7
Sam
7
Sue
8
Bob
8
Jan
7
Art
8
Ted
9
¿Cuál es la media de la población?
La media de Ia población es:
7+7+8+8+7+8+9
u = -----------------------------------7
u = 7.71
¿Cuál es Ia distribución muestral de
las medias del muestreo para
muestras tamaño 2?
Para construir Ia distribución muestral de
las medias de las muestras, se
seleccionan todas las muestras de
tamaño dos sin reemplazo de Ia
población.
Se encuentran utilizando esta fórmula:
Donde:
N = 7 es el número de elementos en Ia
población y
n = 2 es el número de elementos en Ia
muestra.
Existen 21 muestras posibles.
y se calculan las medias.
Muestra
Salario por
Empleados
hora
Suma
Media
1
Joe, Sam
$7, $7
$14
$7.00
2
Joe, Sue
7, 8
15
7.50
3
Joe, Bob
7, 8
15
7.50
4
Joe, Jan
7, 7
14
7.00
5
Joe, Art
7, 8
15
7.50
6
Joe, Ted
7, 9
16
8.00
7
Sam, Sue
7, 8
15
7.50
8
Sam, Bob
7, 8
15
7.50
9
Sam, Jan
7, 7
14
7.00
10
Sam, Art
7, 8
15
7.50
11
Sam, Ted
7, 9
16
8.00
¿Cuál es Ia media de Ia distribución
muestral?
suma de todas las medias de las muestras
ux = -----------------------------------------------número de medias de las muestras
162
ux = -------- = 7.71
21
Esta distribución de probabilidad es Ia
distribución muestral de las medias
de muestras.
Media
de muestra
7.00
7.50
8.00
8.50
Número
de medias
3
9
6
3
21
Probabilidad
.1429
.4285
.2857
.1429
1.000
¿Qué se puede decir de Ia población y
de Ia distribución muestral?
Pueden hacerse las siguientes
observaciones:
a) La media de las medias de Ia muestra es
igual a Ia media de Ia población 7.71 ux = u
b) La dispersión de Ia distribución de las
medias de Ia muestra es menor a Ia
dispersion en los valores de Ia población.
Las medias de Ia muestra van de
7.00 a 8.50, en tanto que los valores
de Ia población varían de 7.00 a 9.00.
c) La gráfica de Ia distribución muestral de
las medias de muestras y Ia gráfica de Ia
distribución de frecuencia de los valores de Ia
población es diferente.
La distribución de las medias de Ia
muestra tiende a tener una forma de
campana y a aproximarse a Ia
distribución de probabilidad normal.
En resumen:
se calcularon y presentaron todas las
muestras aleatorias posibles de una
población
para cada muestra se calculó su media.
se preparó una distribución de las
medias de las muestras
Debido a que cada muestra posible tiene Ia
misma posibilidad de ser seleccionada, se
puede determinar Ia probabilidad asociada.
La distribución muestral de las medias de
muestras se utiliza para medir lo probable
que podría ser obtener un resultado
específico.
Autoevaluación 7-3
(página 233)
Ejercicios 3 y 5
(página 233)
El teorema del límite central
El teorema del límite central afirma que,
para grandes muestras aleatorias,
Ia distribución muestral de las medias
de las muestras está más próxima a una
distribución de probabilidad normal.
La aproximación es más precisa para
muestras grandes.
Esta es una de las conclusiones
más útiles en estadística.
Es posible razonar sobre Ia distribución
muestral de las medias de las muestras sin
contar con información alguna sobre Ia
forma de Ia distribución original de Ia que se
toma Ia muestra.
En otras palabras, el teorema del límite
central es válido para todas las
distribuciones.
Si Ia población tiene una distribución de
probabilidad normal, entonces, para cualquier
tamaño de muestra Ia distribución del
muestreo de Ia media también tendrá una
distribución normal.
Si Ia distribuciôn de Ia población es simétrica
(pero no normal), se veáa que surge Ia forma
normal como lo establece el teorema del
lImite central aún con muestras tan pequeñas
como de tamaño 10.
Por otra parte, si se toma una distribución
que esté sesgada o que tenga extremos muy
gruesos, quizá requiera muestras de al
menos 30 para observar Ia característica de
normalidad.
La mayorIa de los estadísticos consideran
que una muestra de 30 es lo bastante grande
para poder emplear el teorema del límite
central.
Ejemplo:
Ed Spence comenzó su empresa de
engranes hace 20 años. Con el paso del
tiempo, Ia empresa creció y hoy en día
emplea a 40 personas.
Spence Sprockets Inc., enfrenta algunas
importantes decisiones respecto a Ia salud de
estos empleados. Antes de tomar una
decisión final sobre el plan de salud que
debería adquirir, Ed decide formar un comité
de cinco representantes de los empleados.
Se pedirá al comité que estudie con cuidado
Ia cuestión del plan de salud y haga una
recomendación sobre el plan que mejor se
ajuste a las necesidades de los empleados.
Ed siente que las opiniones de los empleados
más jóvenes hacia el cuidado de su salud
pueden diferir de las de los empleados de
mayor edad.
Si Ed selecciona al azar a su comité,
¿qué puede esperar en cuanto a Ia media de
años de servicio en Spence Sprockets para
los integrantes del comité?
¿De qué manera Ia forma de Ia distribución
de los años de antiguedad de todos los
empleados se compara con Ia forma de Ia
distribución de muestreo de las medias?
Los años de servicio (redondeados a años
completos) de los 40 empleados que hoy en
día están en Ia nómina de Spence Sprockets,
Inc., son como sigue:
Vamos a considerar el primero de los
problemas de Ed Spence. Quiere formar un
comité de cinco miembros para analizar Ia
cuestión del cuidado de Ia salud y sugerir el
tipo de seguro que sería el más apropiado
para Ia mayoría de los trabajadores.
¿Cómo debería seleccionar el comité?
Si Spence elige al comité al azar, ¿qué podría
esperar, en cuanto a los años de antiguedad
de los integrantes del comité?
Para comenzar, Ed anota los años de
servicio de cada uno de los 40 empleados en
un papel y los pone en una vieja gorra de
béisbol. revuelve los papeles y toma al azar
cinco de ellos. Los años de servicio de estos
cinco empleados son: 4, 1, 0, 14 y 9.
Así, la antigüedad media de servicio para
estos cinco empleados es 5.60 años.
¿se compara con Ia media de Ia población?
En este momento, Ed no conoce Ia media de
Ia población, pero el número de empleados
en Ia población es de solo 40, de modo que
decide calcular Ia antiguedad media de
servicio para todos los empleados.
Es 4.80 años, que se encuentra sumando los
años de servicio para todos los empleados y
dividiendo el total entre 40. La diferencia
entre Ia media de Ia muestra y Ia media de Ia
población es el error de muestreo.
En otras palabras, Ia diferencia de 0.80 años
entre Ia media de Ia población 4.80 y Ia
media de Ia muestra de 5.60, es el error de
muestreo.
Esto se debe al azar. AsI, si Ed hubiera
seleccionado a estos cinco empleados para
crear el comité, Ia antigüedad media del
servicio sería un poco mayor a Ia media de
Ia población.
¿Qué ocurriría si Ed devolviera los cinco
trozos de papel a Ia gorra de béisbol y
seleccionara otra muestra?
¿Esperarías que Ia media de esta segunda
muestra fuera exactamente Ia misma que Ia
anterior?
Supongamos que Ed selecciona otra muestra
de cinco empleados y descubre que las
antigüedades de servicio en esta muestra son
8, 3, 1, 1 y 14. La media de esta muestra es
de 5.40 años.
La ilustración 7-5 muestra el resultado de
seleccionar 30 muestras de más de 5
empleados cada una, y calcular las medias
de estas muestras.
Estas medias de muestra se organizan
entonces en un histograma (diagrama 7-4).
La forma de Ia distribución de 30 medias de
muestra es diferente de Ia de Ia población.
En el diagrama 7-2, Ia distribución de todos
los empleados tiene un sesgo positivo.
Sin embargo, Ia distribución muestral de las
medias de muestras, (diagrama 7-4), está
más próxima a una distribución normal.
Esto ilustra el teorema del límite central.
Existe menos dispersión en Ia distribución
muestral de las medias de muestras que en
Ia distribución de Ia población.
En Ia población, Ia antigüedad de servido iba
de 0 a 19 años. En Ia distribución muestral
de las medias de muestras, estas últimas
iban de 2.2 a sólo 9.2 años.
También es posible comparar Ia media de las
medias de muestras con Ia media de Ia
población. La media de las 30 muestras es
4.7133 años, es muy próxima a Ia media de
población de 4.80 años.
¿Qué se puede concluir de este ejemplo?
El teorema del Iímite central indica que,
independientemente de Ia forma de Ia
población, Ia distribución muestral de las
medias de muestras se aproximará a Ia
distribución normal. Mientras mayores sean
las muestras, mayor será Ia convergencia.
Spence Sprockets, Inc. , es una evidencia
empírica del funcionamiento del teorema del
límite central.
Este ejemplo comienza con una población
con sesgo positivo (diagrama 7-2).
Se eligió un pequeño número de muestras y
se observó una distribución de medias de
muestra.
Se observó un cambio en Ia forma de Ia
poblaciôn para Ia distribución de medias de
muestra (al comparar diagramas 7-3 y 7-4).
Cuando se aumenta el número de
muestras de 10 a 30, se comienza a
ver Ia característica de normalidad.
La forma de Ia distribución de 30
medias de muestra que se reportaron
en el diagrama 7-4 claramente tiende
hacia una distribución normal a medida
que aumenta el tamaño de Ia muestra.
El teorema del Ilmite central no dice nada de
Ia dispersión de Ia distribución de medias de
muestras o respecto de una comparación de
Ia media de las medias de muestras, con Ia
media de Ia población.
Sin embargo, en el ejemplo se observó que
hay menos dispersion en la distribución de
medias de muestra que en Ia población al
comparar el rango de Ia población y el de las
medias de las muestras.
A medida que aumenta el tamaño de Ia
muestra disminuye Ia dispersión de las
medias de las muestras.
La media de Ia población es exactamente
igual a Ia media de todas las medias de las
muestras.
Estimadores puntuales
En Ia mayoría de los casos es necesario,
por su tamaño, estimar Ia media de Ia
población. Por lo general no se conoce
este parámetro de Ia población.
Se llama estimador puntual al número
único que se usa para estimar un
parámetro de Ia población.
El estimador puntual es un valor que se
calcula a partir de la información de la
muestra, y que se usa para estimar el
parámetro de Ia población.
Sin embargo, un estimador puntual sólo se
refiere una parte de Ia historia.
Si bien se espera que el estimador puntual
esté próximo al parámetro de Ia población,
es importante expresar qué tan cerca está.
Un intervalo de confianza sirve a este
propósito.
Intervalos de confianza
Un intervalo de confianza es un rango
de valores que se construye a partir de
datos de la muestra de modo que el
parámetro ocurre dentro de dicho rango
con una probabilidad específica.
La probabilidad específica se conoce
como nivel de confianza.
La información de Ia distribución muestral
de las medias de muestras, permite localizar
un intervalo con una probabilidad específica
de contener Ia media de Ia población.
Para muestras razonablemente grandes, es
posible utilizar el teorema del Iímite central
para afirmar que el:
95% de las medias de muestra
seleccionadas de una población
estarán dentro de
1.96 desviaciones estándar de Ia media de
Ia población.
99% de las medias de muestra
seleccionadas estarán dentro de
2.58 desviaclones estáridar de Ia media de
la población.
En este caso, Ia desviación estándar a
utilizarse es Ia de Ia distribución muestral de
las medias de muestras.
Los intervalos que se calculan de esta forma
son el intervalo del 95% de confianza, y el
intervalo del 99% de confianza.
El teorema del límite central afirma que
Ia distribución muestral de las medias
de las muestras es aproximadamente
normal.
|
|
|
|
|
95%
|
|
|
.4750 | .4750
.0250
.0250
|
-1.96
1.96
Por lo tanto, se puede usar el apéndice D
(página 523) para encontrar los valores z
apropiados.
Para el 95% se busca 0.4750 en el cuerpo de
Ia tabla, luego se lee los valores
correspondientes de fila y columna. Es 1.96.
Por tanto, Ia probabilidad de encontrar un
valor z entre 0 y 1.96 es 0.4750. Asimismo, Ia
probabilidad de encontrarse en el intervalo
entre -1.96 y 0 es también de 0.4750.
Cómo se calcula el intervalo de confianza
de 95%?
Veamos un ejemplo, supongamos que se
realiza una investigación sobre el salario
inicial de los graduados de Ia facultad de
administración.
Se calculó la media de la muestra en
$27,000 y Ia desviación estándar de las
medias de Ia muestra en $200.
El intervalo de confianza de 95 por ciento se
encuentra entre 26,608 y 27,392 dólares,
que se encuentra mediante
$27,000 ± 1 .96($200).
Si se seleccionaran 100 muestras del mismo
tamaño de Ia población de interés y se
determinaran los 100 intervalos
correspondientes de confianza, se podría
esperar encontrar Ia media de Ia población
en 95 de los 100 intervalos de confianza.
El error estándar de la media de la muestra
A Ia desviación estándar de Ia
distribución muestral de las medias de
muestras se le llama error estándar de
Ia media de la muestra.
Muchas veces se abrevia a
error estándar.
Fórmula:
donde:
es el error estándar de la media,
llamado también desviación estándar de la
distribución muestral de medias.
es la desviación estándar de la
población.
n es el tamaño de la muestra.
Pero, como en Ia mayoría de las situaciones
no se conoce Ia desviación estándar de Ia
población. se le estima por la desviación
estándar de la muestra: es decir, se
remplaza con s.
El tamaño del error estándar se ve
afectado por dos valores.
El primero es Ia desviación estándar.
Si ésta es grande, entonces el error
estándar también se ve afectado por el
tamaño de Ia muestra.
A medida que éste aumenta, se reduce
el error estándar, indicando que hay
menos variabilidad en la distribución
muestral de las medias de las muestras.
Esto es lógico, porque una estimación
con base en una muestra grande es
más precisa que otra que se hace con
una muestra más pequeña.
Cuando el tamaño de Ia muestra, n, es por lo
menos de 30, generalmente se acepta que el
teorema del Iímite central asegurará una
distribución normal de las medias de las
muestras.
Como ya sabemos, esta consideración es
importante.
Si las medias de las muestras tienen una
distribución normal, es posible usar Ia
distribución normal estándar, es decir, z, en
nuestros cálculos.
Los intervalos de confianza de 95 y 99 por
ciento se calculan de Ia manera siguiente,
cuando n ≥ 30.
INTERVALO DE CONFIANZA DE 95%
INTERVALO DE CONFIANZA DE 99%
INTERVALO DE CONFIANZA
Así, para un intervalo de confianza de 92 %
Ia fórmula se convierte en:
El valor de 1.75 se determina con base en el
apéndice D. La tabla se basa en Ia mitad de
Ia distribución normal, de modo que 0.92/2 =
0.4600.
El valor más próximo en Ia tabla es 0.4599, y
el valor z correspondiente es 1 .75.
Con frecuencia, también se usa el nivel de
confianza de 90 %. En este caso, el área
entre 0 y z es 0.4500, que se encuentra
dividiendo 0.90/2.
El area que corresponde a un valor z de 1.64
es 0.4495 y para 1.65 es 0.4505.
Se utiliza 1.65. (valor mayor)
Ejemplo:
Un estudio abarca Ia selección de una muestra
aleatoria de 256 representantes de ventas
menores de 35 años de edad.
La media de Ia muestra de sus ingresos
anuales es $55,420, con una desviación
estándar de $2,050.
1.¿Cuál es el ingreso media estimado de
todos los gerentes (Ia población)?
Es decir, ¿cuál es Ia estimación puntual?
La estimación puntual de Ia media de Ia
población es $55,420. En otras palabras, no
se conoce Ia media de Ia población.
El valor $55,420 es Ia mejor estimación que
hay de un valor desconocido.
2. ¿Cuál es el intervalo de confianza del 95
% para Ia media (redondeada a Ia decena
de dólares más próxima)?
El intervalo de confianza está entre $55,170 y
$55,670, que se encuentra mediante:
Al redondear a Ia decena de dólares más
próxima: $55,170 y $55,670.
3. ¿Cuáles son los Iímites del 95 % del nivel
de confianza para Ia media de Ia población?
Los puntos finales del intervalo de confianza
son los límites de conflanza.
En este ejemplo, $55,170 y $55,670 son los
Iímites de confianza.
4. ¿Qué grado de confianza se utiliza?
La medición de confianza que tiene una
persona se refiere al grado de confianza o nivel
de confianza. En este caso, es 0.95.
5. Interpretemos los resultados.
Si se pudieran seleccionar muchas muestras
que incluyeran a la población de los256
representantes de ventas menores de 35 años
de edad, y calcular las medias e intervalos de
confianza de Ia muestra, el ingreso medio anual
de Ia población estaría en aproximadamente 95
de cada 100 intervalos de confianza. Más o
menos 5 de los 100 intervalos de confianza no
incluiría el ingreso medio anual de Ia población.
, p Esto se ilustra en el diagrama siguiente.
Observe que el quinto intervalo de confianza no
incluye a Ia media de Ia poblaciOn.
Autoevaluación 7-5
(página 249)
Ejercicios 9 y 10
(página 249)
Intervalo de confianza
para una proporción de la población
La determinación de un estimador puntual y
uno de intervalo para una proporción de
población es similar a los métodos que se
describieron en Ia sección anterior.
Un estimador puntual para Ia proporción de
Ia población se encuentra al dividir el número
de éxitos en Ia muestra entre el número que
se muestreó.
Suponga que 100 personas de las 400 que se
muestrearon dijeron que les gustaba más un nuevo
refresco de cola que el refresco normal.
La mejor estimación de Ia proporción de la
población que favorece el nuevo refresco es 0.25, o
25 %, que se encuentra al dividir 100/400.
Recordemos que Ia proporción es Ia fracción del
número de “éxitos” con relación al número
muestreado.
¿Cómo se calcula el intervalo de confianza
para una proporción de población?
INTERVALO DE CONFIANZA PARA
UNA PROPORCION DE
POBLACION
donde:
P es Ia proporción de Ia muestra.
z es el valor normal estándar para el grado de
confianza seleccionado.
n es el tamaño de Ia muestra.
Ejemplo:
Luego de una larga carrera como miembro del
Consejo de Ia ciudad de Chicago, Scott lsenberg
decidió postularse para alcalde.
La campaña contra su oponente, el alcalde
Arthur Smith, ha sido enconada, y ambos
candidatos han gastado varios millones de
dólares en anuncios por televisión.
En las semanas finales, lsenberg se encuentra
adelante de acuerdo con las encuestas
publicadas en el “Chicago Tribune”.
Para comprobar los resultados, el personal de
campaña de Isenberg realiza una encuesta
propia durante el fin de semana previo a Ia
elección.
Los resultados demuestran que, para una
muestra aleatoria de 500 votantes, 290 votarán
por Isenberg.
Desarrolle un intervalo de confianza de 95 % para
Ia proporción de Ia población que votará por
Isenberg. ¿Puede éste Ilegar a Ia conclusión de
que ganará Ia elección?
Se comienza estimando Ia proporción de
votantes que votarán por Isenberg.
La muestra incluyó a 500 votantes y 290
apoyaron a Isenberg, de modo que Ia
proporción de Ia muestra es 0.58, que se
encuentra al dividir 290/500.
El valor 0.58 es una estimación puntual de Ia
proporción de Ia población desconocida (P).
Se utiliza Ia fórmula para determinar el
intervalo de confianza.
Los puntos finales del intervalo de confianza son
0.537 y 0.623. El punto mínimo del intervalo de
confianza es mayor a 0.50. Por lo tanto, se
concluye que Ia proporción de votantes en Ia
población que apoya a lsenberg es mayor al 50
%. Con base en los resultados de Ia encuesta,
ganará Ia elección.
Autoevaluación 7-6
(página 252)
Ejercicios 17 y 18
(página 252)
Factor de corrección de una población finita
Las poblaciones que se han muestreado
hasta ahora han sido muy grandes o se ha
supuesto que son infinitas.
¿Qué ocurre si Ia población que se muestrea
no es infinita, o ni siquiera muy grande?
En tales casos, se harán ciertos ajustes en Ia
forma en que se calcula el error estándar de
las medias de Ia muestra y el error estándar
de las proporciones de Ia muestra.
Para una población finita, en Ia que el
número total de objetos es N y el tamaño de
Ia muestra n, se hace el siguiente ajuste a los
errores estándar de las medias de Ia muestra
y Ia proporción:
ERROR ESTANDAR DE LAS
MEDIAS DE LA MUESTRA,
UTILIZANDO UN FACTOR
DE CORRECCION
ERROR ESTANDAR DE LAS
PROPORCIONES DE LA
MUESTRA,UTILIZANDO UN
FACTOR DE CORRECCION
Ejemplo:
En el pequeño pueblo de Scandia viven 250
familias.
Una encuesta con 40 familias reveló que Ia
contribución anual promedio a Ia iglesia es
de 450 dólares, con una desviación
estándar de 75 dólares.
Construya un intervalo de confianza de 95
por ciento para Ia contribución media anual.
Primero, observemos que Ia población es finita.
Es decir, hay un límite para el número de personas
en Scandia.
Segundo, Ia muestra constituye más del 5 por
ciento de Ia po blación;
es decir, n/N = 40/250 = 0.16.
Por lo tanto, se utiliza el factor de corrección de Ia
población finita.
El intervalo de confianza de 95 por ciento se
construye de Ia manera siguiente, utilizando las
fOrmulas.
Autoevaluación 7-7
(página 254)
Ejercicios 21 y 22
(página 254)
Elección de un tamaño apropiado de muestra
Una cuestión que por lo general surge
cuando se diseña un estudio estadístico es:
“¿cuántos artículos debería haber en Ia
muestra?”.
Si una muestra es demasiado grande, se
desperdicia dinero recolectando datos.
lgualmente, Si es demasiado pequeña, las
conclusiones resultantes serán inciertas.
El tamaño de Ia muestra depende de tres
factores:
1. El nivel de confianza que se desea.
2. El margen de error que puede tolerar el
investigador.
3. La variabilidad en Ia población que se
estudia.
Mientras más alto sea el nivel de confian za,
mayor será el tamaño de Ia muestra.
Un error permisible pequeño requerirá
una muestra grande, y un error permisible
grande permitirá una muestra menor.
Si Ia población tiene una dispersión
amplia, se requiere una muestra grande.
Por otra parte, si Ia población está
concentrada (es homogénea), el tamaño
requerido de Ia muestra será pequeño.
Al resolver esta ecuación para n, se obtiene el
tamaño de muestra requerido.
TAMANO DE MUESTRA
PARA ESTIMAR UNA
MEDIA
El resultado de este cálculo debe ser un número entero.
Ejemplo:
Un estudiante de administración pública desea
determinar Ia cantidad media que ganan los
miembros de los concejos de ciudades.
El error para estimar Ia media es menor de 100
dólares, con un nivel de confianza de 95 por
ciento.
El estudiante encontró un informe del
Departamento del Trabajo de Estados Unidos
que estimó que Ia desviación estándar es de
1,000 dólares.
¿Cuál es el tamaño requerido de Ia muestra?
El error máximo permisible, E, es 100 dólares.
El valor de z para un nivel de confianza de 95
por ciento es 1.96, y el estimado de Ia
desviación estándar son 1,000 dólares.
Al sustituir estos valores en Ia fórmula, el
tamaño requerido de Ia muestra es:
El valor calculado de 384.16 se redondea
hacia arriba a 385.
Se requiere una muestra de 385 para cumplir
con las especificaciones.
Si se desea un nivel mayor de confianza, por
ejemplo de 99 por ciento, entonces también
se requiere una muestra mayor.
Se recomiendaría una muestra de 666.
El resultado de un aumento en el nivel de
confianza de 95 a 99 % fue un aumento de 281
observaciones.
Esto podría elevar en gran medida el costo del
estudio, en cuanto a dinero y tiempo. Por lo
tanto, es preciso considerar con todo cuidado el
nivel de confianza.
Descargar

Slide 1