DIPLOMADO DE POSTGRADO
DE ESPECIALIZACION
EN ASESORIA DE TESIS
MEDIDAS DE
DISPERSIÓN Y
ASIMETRÍA
OBJETIVOS
Al finalizar el Tema 6, el participante será capaz de:
1. Calcular e interpretar las principales medidas de
dispersión:
A) Rango
B) Rango intercuartílico
C) Varianza
D) Desviación estándar
E) Coeficiente de variabilidad
2. Calcular e interpretar las principales medidas de
la forma de la distribución.
A) Coeficiente de asimetría
B) Coeficiente de curtosis
CONTENIDO
1. MEDIDAS DE DISPERSIÓN
1.1 Rango
1.2 Rango intercuartílico
1.3 Varianza
1.4 Desviación estándar
1.5 Coeficiente de variabilidad
2. MEDIDAS DE LA FORMA DE LA DISTRIBUCIÓN
2.1 Asimetría
2.2 Curtosis
6.1 Las medidas de dispersión
Llamadas también medidas de variabilidad
Son útiles porque:
1. Permiten juzgar la confiabilidad de la medida
de tendencia central.
2. Los datos demasiados dispersos tienen un
comportamiento especial.
3. Es posible comparar dispersión de diversas
muestras.
6.1.1 El rango (R)
Llamado también recorrido, amplitud total o
alcance.
a) Obtención: se obtiene de la influencia entre
el dato mayor y el dato menor más una
unidad significativa, a fin de incluir ambos
valores extremos.
Ejemplo:
Los siguientes datos representan el peso de 10 niños
al nacer, (en Kg.). Calcule e interprete el rango.
2,860 3,150 3,450 2,950 3,780
4,170 3,920 3,280 4,050 3,120
Rango = (4,170 - 2,860) + 0.001
Rango = 1,311 Kg.
b) Interpretación
La diferencia entre el bebe de mayor peso y el
bebe menor peso es 1,311 Kg.
c) Cálculo a partir de datos agrupados, se utiliza
la siguiente fórmula:
R= (Ls - Li ) + 1
L : Limite superior de la
donde:
s
última clase
L : Limite inferior de la
i
primera clase
Ejemplo:
La distribución de frecuencias siguiente representa el
tiempo que espera un paciente para ser atendido, en un
consultorio externo. Calcule e interprete el rango
Tiempo Nº de Pacientes
(minutos)
(por día)
12 - 16
4
17 - 21
8
22 - 26
15
27 - 31
23
32 - 36
10
Total
60
Rango = (36-12) + 1
R = 25 minutos
Interpretación: la diferencia de tiempo entre el paciente
que más espera y el que menos espera para ser atendido
es 25 minutos.
f) Ventajas y desventajas del rango
Ventajas
fácil de calcular
fácil de entender e interpretar
Desventajas
sólo considera los valores extremos
no toma en cuenta ni el número de
datos ni el valor de estos
no es posible calcular en tablas con
extremos abiertos.
6.1.2 El rango intercuartílico
Permite ubicar el
50% de los datos
que se encuentran
en el centro de la
distribución,
es
decir, el 25% de los
datos son menores
al primer cuartil y
también 25% de los
datos son mayores
al tercer cuartil.
Ejemplo:
La tabla muestra la experiencia (en años) del
personal que labora en el Hospital Central.
Experiencia
Trabajadores
(años)
0-3
18
4-7
42
8 - 11
68
12 - 15
120
16 - 19
40
20 - 23
34
24 - 27
12
Total
334
A)¿Entre qué valores
se encuentra el
50% intermedio de
estos datos?
B)¿Cuál es el rango
intercuartílico?
50 %
25 %
25 %
Q1
Q3
Rango
Intercuartílico
Lugar Q 1  P25 
25 ( 334 )
 83 . 5
o
se ubica en la 3ra clase
100
 25(334)

  60  1 
 100

Q  7 .5 
4


1
68


Q  8 . 82 años
1
Lugar Q 3  P75 
75 ( 334 )
 250 . 5
o
se ubica en la 5ta clase
100
 75(334)

  248  1 
 100

Q  15 . 5 
4


3
40




Q
3
 15 . 65 años
A. El 50% de los trabajadores con experiencia
intermedia se encuentran entre 8,82 y 15,65
años.
B. El rango intercuartílico es 6 años 10 meses
aproximadamente
6.1.3 La desviación cuartílica
Es una medida de variabilidad fácil de
calcular. Es la mitad del rango intercuartil.
Mide la dispersión del 50% central de las
observaciones respecto a la mediana.
Es imposible tener una DC negativa. Es raro,
pero podría tener un valor igual a 0, en el
caso que los percentiles sean iguales (P75 =
P25). Cuando mayor sea la diferencia entre
los percentiles, mayor será el valor de la DC.
DC 
P75  P25
2
Ejemplo:
Si P25 = 7,2
P75 = 13,4
DC 
13 ,4  7 ,2
2
 3 ,1
Interpretación:
50% central de las observaciones varía en 3,1 con
respecto a la mediana.
6.1.3 La varianza
Es una medida de desviación promedio con
respecto a la media aritmética
a) Cálculos a partir de datos no agrupados.
n
para una muestra
 (X  x )
2
S 
i 1
i
n 1
N
para un población

2
 (X   )

2
i 1
i
N
2
Ejemplo:
La siguiente información se refiere al número de
radiografías reprocesadas
durante una semana.
Calcule la varianza. 8, 10, 5, 12, 10, 15
Primero, elaboramos un cuadro de la forma siguiente:
Xi  x
x
X i  x 
2
8
8 - 10 = 2
10
5
10 - 10 = 0
5 - 10 = 5
12
12 - 10 = 2
25
4
10
10 - 10 = 0
15 - 10 = 5
0
25
15
X
 60
 X i  x   0
4
0
x 
60
6
x  10
 X i  x 
2
 58
 X i  x   58
2
2
S 
 (X i  x )
2
n 1
2
S 
58
6 1
 11 . 6
6.1.4 La desviación estándar
Llamada también desviación típica representa la
variabilidad (o desviaciones) promedio de los datos
con respecto a la media aritmética. Es la raíz cuadrada
de la varianza, sea poblacional o muestral.
a) Cálculos a partir de datos no agrupados
n
para la muestra
S
s
2

 (X i  x )
i 1
n 1
N
para la población
 

2

 (X i   )
i 1
N
2
2
Ejemplo:
La siguiente información se refiere al número de
radiografías reprocesadas durante una semana.
Calcule la desviación estándar.
8, 10, 5, 12, 10, 15
Ya sabemos por el ejemplo anterior que S2 = 11,6
Entonces
S s
2
S
11 , 6
S  3,4 radiografi
as
6.1.5 El coeficiente de variación
Es una medida relativa de variabilidad de los datos.
Permite comparar la variabilidad de dos o más
conjuntos de datos expresados en unidades
diferentes (peso: Kg. y libras).
a) Cálculos a partir de datos no agrupados
para la muestra:
CV 
s
 100
x
para la población:
CV 


 100
Ejemplo:
A continuación se presentan las tarifas (en
unidades monetarias) de dos laboratorios de
análisis clínicos. El laboratorio I tiene sus tarifas en
soles y el laboratorio II en dólares ¿Cuál de ellos
tiene un plan tarifario más homogéneo o estable?.
Laboratorio I (soles)
Laboratorio II (dólares)
40,70,60,48,52,65,58
70,35,150,140,82,110,140,120
Calculamos la media y desviación estándar por
cada una de los laboratorios
Laboratorio I
n
x

X
i 1
i

393
n
7
Xi  x
x
 56 . 14
X i  x 
2
40
-16.14
70
60
13.86
3.86
48
-8.14
14.90
66.26
52
-4.14
17.14
65
8.86
1.86
78.50
3.46
58
X
 393
 X i  x   0
260.50
192.10
 X i  x 
2
 632 ,86
Si  X i  x   632 . 86
2
n
S
 (X i 
x )2
i 1
CV 
n 1
S

632 . 86
CV 
10.27
7 1
 10 . 27
 100
x
56.14
 100  18 . 29
Laboratorio II
x
n
 Xi
 i 1
847
n
 105 . 87
8
X i  x 
2
Xi  x
x


70
-35.87
1286.6569
35
-70.87
5022.5569
150
44.13
1947.4569
140
34.13
1164.8569
82
-23.87
569.7769
110
4.13
17.0569
140
34.13
1164.8569
120
14.13
199.6569
X  847

X i  x   0 , 04

X i  x 
2
 11372 ,88

n
Si  X i 
i 1
n

S 
CV 
i 1
x   11372 . 88
2
(X i  x )
n 1
S
x
 100
2

11372 ,88
8 1
CV 
 40 . 30
40,30
 100  30 , 06
105,87
El Laboratorio II presenta una mayor variabilidad
en el plan tarifario.
6.2 MEDIDAS DE ASIMETRIA O SESGO
6.2.1 Coeficiente de Asimetría
Es un indicador del grado de asimetría que presenta
una distribución.
S kp 
3 ( X  Md )
S
Valores posibles
S kp
 3

 3
asimetría
negativa
asimetría
positiva
Si Skp tiende a 3 la distribución es asimétrica hacia la
derecha o asimetría positiva.
Si Skp tiende a -3 la distribución es asimétrica a la
izquierda o asimetría negativa.
En distribuciones simétricas, no existe sesgo, es
decir Skp = 0.
En la práctica, el coeficiente de Asimetría de Pearson
varía entre -1 y +1
6.2.2 Coeficiente de Curtósis
Es una medida del grado de apuntalamiento,
generalmente comparada con el apuntalamiento
de la distribución normal.
Ku 
0 , 5 ( P0 , 75  P0 , 25 )
P0 , 9  P0 ,1
Valores posibles
a) Leptocúrtica (concentración al centro): Si el grado de
apuntalamiento de una distribución es mayor que el de la
distribución normal. Kμ  0,5
b) Mesocúrtica (distribuidos simétricamente): Si el grado de
apuntalamiento de una distribución es igual que el de la
distribución normal. Kμ  0,25
c) Platicúrtica (aplanada).Si el grado de apuntalamiento de
una distribución es menor que el de la distribución
normal. 0 ≤ Kμ ≤ 0,25
Platicurtica
0,0
Mesocurtica
Leptocúrtica
0,25
0,50
Ejemplo:
La tabla muestra la edad (en años) de 70 pacientes
atendidos en el servicio de emergencia de un hospital
local.
4
3
5
6
7
25
13
2
4
5
67
85
6
7
7
10
12
15
16
17
18
15
16
17
15
13
13
14
20
14
15
15
15
16
17
17
13
14
16
17
11
14
13
10
6
4
8
14
18
20
3
5
7
8
12
15
17
18
20
21
24
26
21
22
17
16
9
9
15
12
A) Calcular e interpretar la asimetría de la distribución
B) Calcular e interpretar la curtosis de la distribución.
Los resultados han sido obtenidos usando Microsoft
Excel
Media aritmetica
Desviacion estandar
Mediana
Cuartil 1
Cuartil 3
Percentil 90
Percentil10
14.27
11.42
13.50
7.00
17.00
23.00
4.00
S kp 
Ku 
3 (14 , 27  13 ,50 )
 0 , 202
11 , 42
0 ,5 (17 ,00  7 ,00 )
23 ,00  4 ,00
 0 ,263
Hoja de Comprobación
1. El valor de cada observación del conjunto de datos se toma en cuenta
cuando calculamos su mediana
2. Cuando la población esta sesgada positiva o negativamente, a menudo es
preferible utilizar la mediana como mejor medida de posición, debido a
que siempre cae entre la media y la moda
3. Las medidas de tendencia central de un conjunto de datos se refieren al
grado en que las observaciones están dispersas
4. Una medida de la agudeza de una curva de distribución es el sesgo
5. Con un conjunto de datos no agrupados, la moda se utiliza con mas
frecuencia como medida de tendencia central
6. Si organizamos las observaciones de un conjunto de datos en orden
descendente, el punto de datos que se encuentra en medio es la mediana
del conjunto de datos
7. Cuando se trabaja con datos agrupados, podemos calcular una media
aproximada si suponemos que cada valor de una clase dada es igual a su
punto medio
8. El valor que más se repite en un conjunto de datos se conoce como media
aritmética
9.Para un arreglo de datos con 50 observaciones, la mediana será el valor de
la observación numero 25 del arreglo
10.La desviación estándar se mide en las mismas unidades que las
observaciones del conjunto de datos
11. Si la curva de una cierta distribución tiene el extremo mas largo
hacia la izquierda de la escala de medición del eje horizontal, se dice que
la distribución esta negativamente sesgada
12.Después de agrupar un conjuntos de datos en un cierto numero de clases,
podemos identificar la clase mediana como la que tiene el mayor numero
de observaciones
13.Una media calculada a partir de un conjunto de datos agrupados siempre
da una buena estimación del valor real, aunque rara vez es exacto
14..Podemos calcular una media para cualquier conjunto de datos, si se nos
da su distribución de frecuencias
15..La moda siempre se encuentra en el punto mas alto de una gráfica de un
arreglo de datos
16. El numero de elementos de una población se denota con n
17.Los valores extremos de un conjunto de datos tienen un fuerte efecto
sobre la mediana
18.La diferencia entre las observaciones mas alta y mas baja de un conjunto
de datos se conoce como media geométrica
19.La dispersión de un conjunto de datos da una cierta visión de la
confiabilidad de la medida de tendencia central
20.La desviación estándar es igual a la raíz cuadrada de la varianza
21. .La diferencia entre las observaciones mas alta y mas baja de un
conjunto de datos se conoce como el alcance cuartil
22. El alcance intercuartil esta basado solamente en dos valores tomados del
conjunto de datos
23.Un fractil es una posición en una distribución de frecuencias
en la que una determinada fracción (o porción) de los datos esta
situada en ella o por encima
24.La varianza, al igual que la desviación estándar, toma en cuenta cada una
de las observaciones del conjunto de datos
25. .El coeficiente de variación es una medida absoluta de la dispersión
26. La medida de dispersión que con mas frecuencia utilizan los
especialistas en estadística es la desviación estándar
27.Una de las ventajas de las medidas de dispersión es que cualquier
estadística que mide variación absoluta, también mide variación relativa
28. Una desventajas de utilizar el alcance para medir la dispersión es que no
toma en cuenta la naturaleza de las variaciones entre la mayoría de las
observaciones
29.La varianza indica la distancia promedio de cualquier
observación del conjunto de datos con respecto a la media
30. Cada población tiene una varianza que se simboliza con S2
31.De acuerdo con el teorema de Chebyshev, no mas de 11% de las
observaciones de una población puede tener resultados estándar de la
población mayores que 3 o menores que -3
32.El alcance intercuartil es un ejemplo especifico de un alcance interfractil
33.Es posible medir el alcance de una distribución de extremo abierto
34.El alcance intercuartil mide el alcance promedio de la cuarta parte más
baja de una distribución.
Descargar

Diapositiva 1 - IHMC Public Cmaps (2)