Depto. Matemáticas – IES Elaios
Tema: Estadística
Inferencial
1. MUESTREO ALEATORIO
Presentación elaborada por el profesor José Mª Sorando,
ampliando y adaptando las diapositivas de la Editorial SM
Muestra y población
•
Población: es el conjunto de todos los elementos que poseen una determinada
característica. En general supondremos que la población es muy grande.
•
Muestra: es un subconjunto de la población.
•
•
Muestreo: es el proceso mediante el cual se escoge una muestra de la población.
Inferencia estadística: proceso a través del cual se obtienen conclusiones sobre una
población, a través de la información que proporciona una muestra. La confianza de
tal extrapolación dependerá de la representatividad de la muestra.
·
Razones para usar muestras: economía, observación destructiva, etc.
La representatividad de la muestra depende de dos
cosas:
a) Del mecanismo de selección: que ha de
garantizar que no hay un elemento de la
población con más probabilidad que otro de
entrar en la muestra. Si no, sería una muestra
sesgada.
b) Del tamaño de la muestra: si el mecanismo
de selección es correcto, cuanto más grande
sea la muestra mayor será la probabilidad de
que se parezca a la población.
Tipos de muestreo
Ejemplo. Tres empresas están investigando el nivel adquisitivo de las
personas que acuden a un determinado concierto de música clásica. Para
ello, cada una elige una muestra de la siguiente manera:
1.- 50 primeras personas que entren en el auditorio.
2.- 50 personas elegidas al azar de las que se ubican en la platea baja.
3.- 50 personas elegidas al azar de todas las asistentes.
Muestreo aleatorio
Muestreo no aleatorio
Ventajas y desventajas
Tipos de muestreo aleatorio
Muestreo aleatorio simple: todos los
elementos de la población tienen la
misma probabilidad de ser elegidos
para formar parte de la muestra.
Muestreo aleatorio estratificado: la
población se divide en grupos
homogéneos que llamamos estratos.
La proporción de cada estrato en la
población se mantiene en la muestra.
Cada uno de los estrato de la muestra
se obtiene por muestreo aleatorio
simple
sobre
el
estrato
correspondiente de la población.
Estrato 1
Estrato 2
Población
Muestra
Tipos de muestreo aleatorio (II)
Muestreo aleatorio sistemático: se
selecciona al azar un elemento de la
población y a partir de él se
seleccionan de k en k los elementos
siguientes.
Muestreo por conglomerados y
áreas: se divide la población en
distintas secciones o conglomerados.
Se eligen al azar unas pocas de estas
secciones y se toman todos los
elementos de las secciones elegidas
para formar la muestra.
Para dividir la población en secciones
podemos usar las provincias.
Tipos de muestreo no aleatorio
Muestras erráticas o casuales
Muestras intencionadas o racionales
Muestras por cuotas
Muestras “bola de nieve”
Distribución en el muestreo de la media
Supongamos que en una población una variable aleatoria se distribuye con media μ y
desviación típica σ.
• Al tomar diferentes muestras de igual tamaño en la población y calcular sus medias
y sus desviaciones típicas, obtendremos x–1, x–2, ..., x–n y s1, s2, ... , sn
• Los distintos valores de –xi dan lugar a una variable aleatoria que representamos
–
–
por X y se llama media muestral. La distribución de los valores de X se llama
distribución en el muestreo de la media.
–
La variable aleatoria X tiene las siguientes características:
1. Media : 

2. Desviación típica:
n
–
3. A medida que n crece, la distribución de X se aproxima a la normal.
Si σ es desconocida, se aproxima con s ·√n / √(n – 1)  Apuntes
Distribución en el muestreo de la media
Se supone que la distribución de la temperatura del cuerpo humano en la
población tiene una media μ = 37º y una desviación típica σ = 0,85º. Se elige
una muestra de 105 personas. Se desea obtener la probabilidad de la media
de la muestra sea menor que 36,9º.
Al ser n = 105, consideramos que la variable aleatoria media muestral es normal.
–
La variable aleatoria X se distribuye como una N(

) = N (37, 0,083)
n
Por tanto:
–

X –37 36,9 –37
–
p( X  36,9) =p  0,083 0,083  = p( Z – 1,20) = 1– p(Z  1,20) = 1– 0,8849 =
= 0,115
Se debe recordar que para una variable aleatoria continua se tiene que:
p(Z  a) = p(Z < a)
Teorema central del límite: idea intuitiva
• Muchos fenómenos se pueden considerar como suma de efectos parciales
independientes, pudiendo ocurrir que aunque los efectos no se ajusten a la normal, el
fenómeno resultante tienda asintóticamente a la normal.
• Una simulación con ordenador nos puede ayudar a entender esto:
1000 lanzamientos de un dado
1000 medias de 4 dados
1000 medias de dos dados
1000 medias de 10 dados
Teorema central del límite
Ya dijimos que…
Sea X una variable aleatoria de una población de media  y desviación típica ,
entonces se verifica que
1. La variable aleatoria media muestral (con muestras de tamaño n) tiene

media  y desviación típica
n
2. La variable aleatoria media muestral se aproxima a una normal a medida
que crece el tamaño de la muestra n
¿Qué se entiende por "cuando crece n"?
• Si la población de partida es normal, la distribución de las medias
muestrales es normal, cualquiera que sea n.
• Si la distribución de partida no es normal, la distribución de las medias
muestrales es normal si n  30.
Teorema central del límite: visión gráfica
Normal
Distribución
de la
población de
partida
Distribución
de las medias
muestrales
para n = 5
Distribución
de las medias
muestrales
para n = 10
Distribución
de las medias
muestrales
para n = 30
Uniforme
Sesgada
Distribución en el muestreo de una proporción
• Supongamos que en una población la proporción de elementos con una determinada
característica es p.
^
• En una muestra cualquiera la proporción de individuos con dicha característica será p.
^
• Los distintos valores de p^ dan lugar a una variable aleatoria que representamos por P, y
^
que recibe el nombre de proporción muestral. La distribución de P se llama distribución
en el muestreo de una proporción.
^
La variable aleatoria P tiene las siguientes características:
1. Media : p
p(1 – p)
2. Desviación típica: 
n
^
3. A medida que n crece, la distribución de P se aproxima a la normal,
siempre que p no se acerque ni a 0 ni a 1. En cualquier caso, se considera
normal si n ≥ 30.
Distribuciones en el muestreo de una proporción
Un nuevo medicamento ha curado al 85 % de los enfermos a los que se les ha
aplicado. Determinar las distribuciones en el muestreo de la proporción de enfermos
curados para muestras de tamaño 30, 100 y 1000 personas.
En nuestro caso p = 0,85
D istribuc ió n
m ue stral
T a m a ño
de la
m ue stra:
n
M ed ia:
 p
30
0,85
0,85(1 – 0,85)
= 0,065
30
N (0,85; 0,065)
100
0,85
0,85(1 – 0,85)
= 0,036
100
N (0,85; 0,036)
0,85
0,85(1 – 0,85)
= 0,011
1000
N (0,85; 0,011)
1000
D esviac ió n típ ica:

p(1 – p)
n
N (p,
p(1 – p)
)
n
Conviene observar cómo, a medida que el
tamaño de la muestra crece, la desviación
típica disminuye.
Descargar

Muestra y población