Comprensión de la variación o
dispersión de los datos.
1. Cuanto más dispersos estén los datos, mas grande
será el valor del rango, varianza y desviación estándar
2. Cuanto mas concentrados, u homogéneos, sean los
datos u observaciones, mas pequeño será el rango,
la varianza y la desviación estándar.
3. Si las observaciones o datos son todas iguales( de
manera que no hay variación de los datos), el rango,
la varianza y la desviación estándar serán iguales a
cero.
4. Las medidas de rango, varianza y desviación estándar
nunca son negativas.
Coeficiente de variación
• Es
una
indicación • Fórmula:
relativa de la variación,
se
expresa
en
porcentaje y es útil
cuando se requiere
comparar la dispersión
de dos o más conjuntos
de datos.
*100
Regla empírica
• Cuando los datos tienen una distribución en forma de
campana:
 Cerca del 68% de los valores de los datos se encontrarán a no más de
una desviación estándar desde la media.
 Aproximadamente 95% de los valores de los datos se encontrarán a no
más de dos desviaciones estándar desde la media.
 Casi todos los valores de los datos estarán a no mas de tres
desviaciones estándar de la media.
Ejemplo:
• Los envases con detergente
líquido en una fábrica se llenan
en forma automática en una línea
de producción. Los pesos de
llenado suelen tener una
distribución
en
forma
de
campana. Si el peso medio de
llenado es de 16 onzas y la
desviación estándar de 0.25
onzas, la regla empírica es
aplicada
para
sacar
las
conclusiones siguientes:
1.
2.
3.
Aproximadamente 68% de los
envases llenados pesarán entre
15.75 y 16.25 onzas (estará a no
más de una desviación estándar
de la media).
Cerca de 95% de los envases
llenados pesarán entre 15.50 y
16.50 onzas (estarán a no mas
de dos desviaciones estándar de
la media)
Casi todos los envases llenados
pesarán entre 15.25 y 16.75
onzas (estarán a no más de tres
desviaciones estándar de la
media).
Unidad VII y VIII
Medidas de forma de la distribución de datos.
• Sesgos y curtosis.
• Covarianza
• Coeficiente de correlacion
Forma:
La tercera propiedad importante de
un conjunto de datos es su forma ,
es decir, la manera en que se
distribuyen los datos.
El sesgo es una medida numérica importante de la forma de una distribución de
datos.
• Para describir su forma se comparan la media y la mediana
1. Si ambas medidas son iguales, los datos son simétricos(sesgo cero)
2. Si la media excede a la mediana, los datos se describen como sesgados a la
derecha (sesgo positivo)
3. Si la mediana excede a la media los datos se describen como sesgados a la
izquierda (sesgo negativo).
Es decir;
Media> mediana: sesgo positivo o a la derecha
Media = mediana: simetria o sesgo cero
Media< mediana: sesgo negativo o a la izquierda
Descargar

Material Examen Final