UNIDAD III
MEDIDAS DE DISPERSIÓN
“Medidas de dispersión”
MEDIDAS DE DISPERSIÓN
Miden qué tanto se dispersan las observaciones alrededor de su media.
MEDIDAS DE DISPERSIÓN
En algunos casos existen conjuntos de datos que tienen la misma media y la
misma mediana, pero esto no refleja qué tan dispersos están los elementos de
cada conjunto.
Ejemplo:
Conjunto 1.
Conjunto 2.
80, 90, 100, 110, 120
0, 50, 100, 150, 200
Conjunto 1
Media 
80  90  100  110  120
 100
5
Conjunto 2
Media 
0  50  100  150  200
 100
5
Observa que para ambos conjuntos la Mediana es igual a 100. También
nota que los datos del conjunto 2 están más dispersos con respecto a su
media que los datos del conjunto 1.
MEDIDAS DE DISPERSIÓN
Existen diversas medidas estadísticas de dispersión, pero muchos autores
coinciden en que las principales son:
Rango
Varianza
Desviación estándar
Coeficiente de variación
RANGO
Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el
valor más elevado (Límite superior) y el valor más bajo (Límite inferior).
FÓRMULA
Rango  X M AX  X M IN
Ejemplo 1.
Ante la pregunta sobre número de hijos por familia, una muestra de 12 hogares,
marcó las siguientes respuestas:
2
2
1
3
2
2
4
0
Calcula el rango de la variable
Solución.
R ango  5  0  5
1
5
3
1
Ejemplo 2.
Hay dos conjuntos sobre la cantidad de lluvia (mm) en Taipei y Seúl en un año.
Taipei
Seúl
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
86 135 178 170 231 290 231 305 244 122 66 71
40 77 83 89 147 168 184 252 209 101 32 13
Calcula el rango en cada una de las ciudades.
Solución.
Aplicando la fórmula correspondiente tenemos:
Taipei
R ango  305 m m  66 m m  239 m m
Seúl
R ango  252 m m  13 m m  239 m m
En este caso se puede
observar que el rango es el
mismo para ambos casos
aunque las cantidades sean
diferentes.
Cantidad de lluvia (mm)
Cantidad de lluvia en Taipei y Seúl 1998
350
300
250
200
150
100
50
0
Taipei
Seoul
Mes
VARIANZA (Datos no agrupados)
Mide la distancia existente entre los valores de la serie y la media. Se calcula
como sumatoria de las diferencias al cuadrado entre cada valor y la media,
multiplicadas por el número de veces que se ha repetido cada valor. La
sumatoria obtenida se divide por el tamaño de la muestra.
n
FÓRMULA
Muestral
s
2


( xi  x )
2
i 1
n 1
N
Poblacional

2


( xi   x )
i 1
N
2
La varianza siempre será mayor que cero. Mientras más se aproxima a cero,
más concentrados están los valores de la serie alrededor de la media. Por el
contrario, mientras mayor sea la varianza, más dispersos están.
Ejemplo 1.
Calcula la varianza para los siguientes datos
2
1
2
4
1
3
2
3
2
0
5
1
Solución.
Primero es necesario obtener la media. En este caso x  2 .1 6
Ahora aplicamos la fórmula correspondiente
(2  2.16)  (1  2.16)  (2  2.16)  (4  2.16)  (1  2.16)  (3  2.16)  (2  2.16)  (3  2.16)  (2  2.16)  (0  2.16)  (5  2.16)  (1  2.16)
2
s 
2
2
2
2
2
2
2
12  1
s 
2
21.6672
11
 1.9697
2
2
2
2
2
Ejemplo 2.
A continuación se muestran dos conjuntos de datos obtenidos a partir de un
experimento químico que realizaron dos estudiantes distintos. Calcular la
varianza.
Estudiante A
Estudiante B
8
7
Volumen de ácido medido (cm^3)
12
7
9
3
10 12 11
6
7 15 12
11
9
9
12
13
14
11
Solución.
Primero es necesario obtener la media de cada conjunto de datos. En este caso
Estudiante A
x 
8  12  7  9  3  10  12  11  12  14
 9 .8
10
Estudiante B
x 
7  6  7  15  12  11  9  9  13  11
10
Ahora aplicamos la fórmula correspondiente
 10
Solución (Continuación).
Estudiante A
(8  9.8)  (12  9.8)  (7  9.8)  (9  9.8)  (3  9.8)  (10  9.8)  (12  9.8)  (11  9.8)  (12  9.8)  (14  9.8)
2
s 
2
2
2
2
2
2
2
2
2
10  1
s 
2
91.6
 9.16
10
Estudiante B
(7  10)  (6  10)  (7  10)  (15  10)  (12  10)  (11  10)  (9  10)  (9  10)  (13  10)  (11  10)
2
s 
2
2
2
2
2
2
10  1
s 
2
76
10
 7.6
2
2
2
2
2
DESVIACIÓN ESTÁNDAR (Datos no agrupados)
También llamada desviación típica, es una medida de dispersión usada en
estadística que nos dice cuánto tienden a alejarse los valores puntuales del
promedio en una distribución.
Específicamente, la desviación estándar es "el promedio de la distancia de cada
punto respecto del promedio". Se suele representar por una S o con la letra
sigma,σ, según se calcule en una muestra o en la población.
Una desviación estándar grande indica que los puntos están lejos de la media, y
una desviación pequeña indica que los datos están agrupados cerca de la
media.
n
FÓRMULA
Muestral
s 

( xi  x )
2
i 1
n 1
N
Poblacional
 
 (x
i
 x)
i 1
N
2
Ejemplo 1.
Si retomamos el ejemplo 1 que corresponde a la varianza:
Calcula la desviación estándar para los siguientes datos
2
1
2
4
1
3
2
3
2
0
5
1
Solución.
Una vez que hemos calculado la media y la varianza, sólo resta calcular la raíz cuadrada de la
varianza.
x  2 .1 6
s 
2
21.6672
11
 1.9697
Ejemplo 2.
Considerando nuevamente el segundo ejemplo que estudiaste para calcular la varianza,
tenemos:
A continuación se muestran dos conjuntos de datos obtenidos a partir de un experimento
químico que realizaron dos estudiantes distintos. Calcular la varianza.
Estudiante A
Estudiante B
Volumen de ácido medido (cm^3)
12
7
9
3
10 12 11
6
7 15 12
11
9
9
8
7
12
13
14
11
Solución.
Una vez que has calculado la media y la varianza, es necesario calcular la desviación
estándar a partir de la obtención de la raíz cuadrada de la varianza.
Estudiante A
s 
2
91.6
 9.16
10
Estudiante B
s 
2
76
10
 7.6
COEFICIENTE DE VARIACIÓN
Es una medida de dispersión que se utiliza para poder comparar las
desviaciones estándar de poblaciones con diferentes medias y se calcula como
cociente entre la desviación típica y la media.
FÓRMULA
CV 
S
Muestral
x
Poblacional

CV 

 100%
100%
Ejemplo 1.
En dos cursos los promedios que sacaron sus alumnos fueron 6.1 y 4.3 y las
desviaciones estándar respectivas fueron 0.6 y 0.45 respectivamente. ¿En qué
curso hay mayor dispersión?
Solución
Para responder esto, debemos obtener el coeficiente de variación aplicando la
fórmula
S
CV 
 100%
x
CV A 
0 .6
CV B 
0 . 45
(100 %)  9 . 8 %
6 .1
(100 %)  10 . 4 %
4 .3
Claramente, el curso A tiene una dispersión menor que el B, pese a presentar
una mayor desviación estándar.
VARIANZA Y DESVIACIÓN ESTÁNDAR (Datos agrupados)
Cuando los datos están agrupados en tablas de frecuencias, el significado de las
medidas de dispersión es el mismo, sin embargo la manera de calcularlas es
diferente.
Enseguida se muestra la fórmula para la varianza, pero recuerda que la
desviación estándar es igual a la raíz cuadrada de la primera.
FÓRMULA
k
Muestral
s 
2

k
f i ( xi  x )
i 1
2

n 1

i 1
Poblacional

2
2
n 1
k

 k

  xi f i 
2
 i 1

f i xi 
n
k
f i ( xi   )
 i 1
2

2
f i xi
 i 1
N

N
2
Ejemplo 1.
Se han registrado durante 20 días, el número de viajeros que hacen
reservaciones a una agencia de viajes pero que no las hacen efectivas:
i
Número de viajeros
(xi )
Frecuencia
(fi)
1
12
3
2
13
3
3
14
6
4
15
3
5
16
5
Total
70
20
Calcula las medidas de dispersión de la variable en estudio. Interpreta
Solución.
Tal como lo indica la fórmula, primero es necesario multiplicar la
variable (xi ) por la frecuencia (fi) y añadirlo como una columna a la
tabla.
2
k
s 
2


x
f



i
i
k
 i 1

 ...
...
i 1
...
i
Número de viajeros
(xi )
Frecuencia
(fi)
xi fi
1
12
3
36
2
13
3
39
3
14
6
84
4
15
3
45
5
16
5
80
Total
70
20
284
Solución (Continuación).
Después se obtiene el cuadrado de la variable x, o sea, (xi )2.
k
s 
 ... x
2
2
i
...
i 1
...
i
Número de viajeros
(xi )
Frecuenc
ia
(fi)
xi fi
xi2
1
12
3
36
144
2
13
3
39
169
3
14
6
84
196
4
15
3
45
225
5
16
5
80
256
Total
70
20
284
990
Solución (Continuación).
Ahora se multiplica el cuadrado de la variable por la frecuencia, es
decir, (fixi2).
k
s 
2

f i xi 
2
i 1
...
...
...
i
Número de
viajeros
(xi )
Frecuencia
(fi)
xi fi
xi2
fixi2
1
12
3
36
144
432
2
13
3
39
169
507
3
14
6
84
196
1176
4
15
3
45
225
675
5
16
5
80
256
1280
Total
70
20
284
990
4070
Solución (Continuación).
Una vez obtenidos todos los datos anteriores, se procede a aplicar la
fórmula
2
k
k
s 
2

i 1


  xi f i 
2
 i 1

f i xi 
n
n 1
i
Número de
viajeros
(xi )
Frecuencia
(fi)
xi fi
xi2
fixi2
1
12
3
36
144
432
2
13
3
39
169
507
3
14
6
84
196
1176
4
15
3
45
225
675
5
16
5
80
256
1280
Total
70
20
284
990
4070
Solución (Continuación).
i
Número de
viajeros
(xi )
Frecuencia
(fi)
xi fi
xi2
fixi2
1
12
3
36
144
432
2
13
3
39
169
507
3
14
6
84
196
1176
4
15
3
45
225
675
5
16
5
80
256
1280
Total
70
20
284
990
4070
4070 
s
2
284
20

2
 1 . 9579
19
s 
1 . 9579  1 . 3992
Ejemplo 2.
De acuerdo a la siguiente tabla, calcula la varianza y la desviación estándar:
NOTA
x
FREC. ABSOLUTA
f
1.2
1.4
1.6
1.8
2.0
2.2
2.4
2.6
2.8
3.0
3.2
3.4
3.6
3.8
4.0
4.2
4.4
4.6
4.8
5.0
5.2
5.4
5.6
5.8
6.0
6.2
6.4
6.6
6.8
7.0
TOTAL
1
2
3
8
14
18
19
22
25
26
27
31
35
38
45
46
48
52
58
60
56
54
51
50
46
44
40
32
31
18
1000
FREC. ABSOLUTA
ACUMULADA
1
3
6
14
28
46
65
87
112
138
165
196
231
269
314
360
408
460
518
578
634
688
739
789
835
879
919
951
982
1000
4717
FREC. RELATIVA %
0.1
0.2
0.3
0.8
1.4
1.8
1.9
2.2
2.5
2.6
2.7
3.1
3.5
3.8
4.5
4.6
4.8
5.2
5.8
6.0
5.6
5.4
5.1
5.0
4.6
4.4
4.0
3.2
3.1
1.8
23970.12
FREC RELATIVA
ACUMULADA %
0.1
0.3
0.6
1.4
2.8
4.6
6.5
8.7
11.2
13.8
16.5
19.6
23.1
26.9
31.4
36.0
40.8
46.0
51.8
57.8
63.4
68.8
73.9
78.9
83.5
87.9
91.9
95.1
98.2
100
Solución.
El primer paso es calcular xi fi:
NOTA
x
FREC. ABSOLUTA
f
1.2
1.4
1.6
1.8
2.0
2.2
2.4
2.6
2.8
3.0
3.2
3.4
3.6
3.8
4.0
4.2
4.4
4.6
4.8
5.0
5.2
5.4
5.6
5.8
6.0
6.2
6.4
6.6
6.8
7.0
TOTAL
1
2
3
8
14
18
19
22
25
26
27
31
35
38
45
46
48
52
58
60
56
54
51
50
46
44
40
32
31
18
1000
FREC. ABSOLUTA
ACUMULADA
1
3
6
14
28
46
65
87
112
138
165
196
231
269
314
360
408
460
518
578
634
688
739
789
835
879
919
951
982
1000
4717
FREC. RELATIVA %
0.1
0.2
0.3
0.8
1.4
1.8
1.9
2.2
2.5
2.6
2.7
3.1
3.5
3.8
4.5
4.6
4.8
5.2
5.8
6.0
5.6
5.4
5.1
5.0
4.6
4.4
4.0
3.2
3.1
1.8
23970.12
FREC RELATIVA
ACUMULADA %
0.1
0.3
0.6
1.4
2.8
4.6
6.5
8.7
11.2
13.8
16.5
19.6
23.1
26.9
31.4
36.0
40.8
46.0
51.8
57.8
63.4
68.8
73.9
78.9
83.5
87.9
91.9
95.1
98.2
100
xi fi
1.2
2.8
4.8
14.4
28
39.6
45.6
57.2
70
78
86.4
105.4
126
144.4
180
193.2
211.2
239.2
278.4
300
291.2
291.6
285.6
290
276
272.8
256
211.2
210.8
126
Solución (Continuación).
Después se obtiene el cuadrado de la variable x, o sea, (xi )2.
NOTA
x
FREC. ABSOLUTA
f
1.2
1.4
1.6
1.8
2.0
2.2
2.4
2.6
2.8
3.0
3.2
3.4
3.6
3.8
4.0
4.2
4.4
4.6
4.8
5.0
5.2
5.4
5.6
5.8
6.0
6.2
6.4
6.6
6.8
7.0
TOTAL
1
2
3
8
14
18
19
22
25
26
27
31
35
38
45
46
48
52
58
60
56
54
51
50
46
44
40
32
31
18
1000
FREC. ABSOLUTA
ACUMULADA
1
3
6
14
28
46
65
87
112
138
165
196
231
269
314
360
408
460
518
578
634
688
739
789
835
879
919
951
982
1000
4717
FREC. RELATIVA %
0.1
0.2
0.3
0.8
1.4
1.8
1.9
2.2
2.5
2.6
2.7
3.1
3.5
3.8
4.5
4.6
4.8
5.2
5.8
6.0
5.6
5.4
5.1
5.0
4.6
4.4
4.0
3.2
3.1
1.8
23970.12
FREC RELATIVA
ACUMULADA %
0.1
0.3
0.6
1.4
2.8
4.6
6.5
8.7
11.2
13.8
16.5
19.6
23.1
26.9
31.4
36.0
40.8
46.0
51.8
57.8
63.4
68.8
73.9
78.9
83.5
87.9
91.9
95.1
98.2
100
xi fi
1.2
2.8
4.8
14.4
28
39.6
45.6
57.2
70
78
86.4
105.4
126
144.4
180
193.2
211.2
239.2
278.4
300
291.2
291.6
285.6
290
276
272.8
256
211.2
210.8
126
xi2
1.44
1.96
2.56
3.24
4
4.84
5.76
6.76
7.84
9
10.24
11.56
12.96
14.44
16
17.64
19.36
21.16
23.04
25
27.04
29.16
31.36
33.64
36
38.44
40.96
43.56
46.24
49
Solución (Continuación).
Ahora se multiplica el cuadrado de la variable por la frecuencia, es decir, (fixi2).
NOTA
x
FREC. ABSOLUTA FREC. ABSOLUTA FREC. RELATIVA
f
ACUMULADA
%
1.2
1.4
1.6
1.8
2.0
2.2
2.4
2.6
2.8
3.0
3.2
3.4
3.6
3.8
4.0
4.2
4.4
4.6
4.8
5.0
5.2
5.4
5.6
5.8
6.0
6.2
6.4
6.6
6.8
7.0
TOTAL
1
2
3
8
14
18
19
22
25
26
27
31
35
38
45
46
48
52
58
60
56
54
51
50
46
44
40
32
31
18
1
3
6
14
28
46
65
87
112
138
165
196
231
269
314
360
408
460
518
578
634
688
739
789
835
879
919
951
982
1000
0.1
0.2
0.3
0.8
1.4
1.8
1.9
2.2
2.5
2.6
2.7
3.1
3.5
3.8
4.5
4.6
4.8
5.2
5.8
6.0
5.6
5.4
5.1
5.0
4.6
4.4
4.0
3.2
3.1
1.8
1000
4717
23970.12
FREC RELATIVA
ACUMULADA %
0.1
0.3
0.6
1.4
2.8
4.6
6.5
8.7
11.2
13.8
16.5
19.6
23.1
26.9
31.4
36.0
40.8
46.0
51.8
57.8
63.4
68.8
73.9
78.9
83.5
87.9
91.9
95.1
98.2
100
xi fi
1.2
2.8
4.8
14.4
28
39.6
45.6
57.2
70
78
86.4
105.4
126
144.4
180
193.2
211.2
239.2
278.4
300
291.2
291.6
285.6
290
276
272.8
256
211.2
210.8
126
4717
xi2
1.44
1.96
2.56
3.24
4
4.84
5.76
6.76
7.84
9
10.24
11.56
12.96
14.44
16
17.64
19.36
21.16
23.04
25
27.04
29.16
31.36
33.64
36
38.44
40.96
43.56
46.24
49
f i xi 2
1.44
3.92
7.68
25.92
56
87.12
109.44
148.72
196
234
276.48
358.36
453.6
548.72
720
811.44
929.28
1100.32
1336.32
1500
1514.24
1574.64
1599.36
1682
1656
1691.36
1638.4
1393.92
1433.44
882
23970.12
Solución (Continuación).
Una vez obtenidos todos los datos anteriores, se procede a aplicar la fórmula
k
s 
2

i 1
 k

  xi f i 
2
 i 1

f i xi 
n
n 1
23970 . 12 
4717
1000
1000  1
s 
2
s
2
2
 1 . 7217
1 . 7217  1 . 3121
Varianza
Desviación estándar
Fuentes de información
•
http://medicina.unimayab.edu.mx/propedeutico/2009/semana1/chpt04.ppt.
•
http://beta.upc.edu.pe/matematica/mbcc/paginas/recursos/semana14/Clase01_Sem
ana14.ppt
•
http://www.demre.cl/text/doc_tecnicos/p2009/estadistica_descriptiva.pdf
•
http://www.cgonzalez.cl/archivos/estadistica2.ppt.
•
http://repositorio.utpl.edu.ec/bitstream/123456789/3013/1/estadisticasegundobimestr
e-090305174953-phpapp02.ppt.
•
netdrive.puiying.edu.hk/~ms/f7it/MATHS.PPT
Créditos
Título :
Medidas de dispersión
Colaborador:
M. en C. Mario Arturo Vilchis Rodríguez
Nombre de la Asignatura:
Estadística aplicada a la mercadotecnia
Programa Académico
Lic. Mercadotecnia
Descargar

Diapositiva 1