1. Introducción a la Estadística
2. Descripción de los conjuntos de
datos
3. Uso de la Estadística para sintetizar
conjuntos de datos
4. Probabilidad
5. Variables aleatorias discretas
6. Variables aleatorias normales
2.1 Introducción
2.2 Tablas y gráficas de frecuencias
2.3 Datos agrupados e histogramas
2.4 Gráficas de tallos y hojas
2.5 Conjuntos de datos apareados
Es muy importante que los
resultados numéricos de cualquier
estudio se presenten en forma clara
y concisa, de modo que
rápidamente se pueda tener una
idea de las características
esenciales de los datos.
Esto es particularmente necesario
cuando se trata de un gran
conjunto de datos, como
frecuentemente ocurre en las
encuestas o en los experimentos
controlados.
Realmente, una presentación
efectiva de los datos a menudo
revela con rapidez elementos tales
como su categoría, su grado de
simetría, lo concentrados o
dispersos que están, dónde se
concentran, etcétera.
2.1 Introducción
2.2 Tablas y gráficas de
frecuencias
2.3 Datos agrupados e histogramas
2.4 Gráficas de tallos y hojas
2.5 Conjuntos de datos apareados
La frecuencia es el
número de veces que un
dato aparece en el
conjunto total de datos.
Cuando se tiene un conjunto de
datos que contiene un número
relativamente pequeño de valores
diferentes, conviene representarlo
en una tabla de frecuencias, la cual
incluye cada valor distinto junto con
su frecuencia de ocurrencia.
En dicha tabla, la columna
de frecuencias representa el
número de ocurrencias de
cada valor distinto del
conjunto de datos.
El experimento consiste en tirar un dado
200 veces.
La variable aleatoria es la cara del dado
que queda hacía arriba; le podemos
asignar el número que dicha cara tiene,
pero igual podría tener un gatito, un color
o lo que sea.
La tabla
muestra los
resultados
obtenidos:
#
3
3
6
1
2
4
4
6
4
6
4
3
2
2
2
1
1
6
1
6
#
3
4
6
4
2
1
6
1
4
6
6
2
1
5
1
2
1
2
6
4
#
3
2
6
6
3
2
1
5
5
1
3
4
5
6
3
6
1
5
4
3
#
5
4
3
1
6
5
6
6
2
5
3
2
1
3
3
5
4
3
3
2
#
5
5
6
5
2
2
4
4
2
5
6
2
2
4
2
3
1
3
2
6
#
2
4
5
3
2
6
1
4
6
5
4
3
5
1
6
1
4
6
2
3
#
3
2
1
2
2
3
4
4
5
3
5
3
5
2
4
1
2
3
2
2
#
2
4
1
6
4
1
2
1
5
2
3
1
6
2
5
1
1
3
4
2
#
2
1
2
3
2
6
2
3
5
1
2
4
5
6
3
2
6
6
1
4
#
2
6
1
1
5
1
2
4
4
6
6
6
6
1
1
2
1
6
4
2
La tabla
muestra los
resultados
obtenidos
ordenados
en orden
creciente:
#
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
#
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
#
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
#
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
#
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
#
3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
4
4
4
#
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
#
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
#
5
5
5
5
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
#
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
#
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
#
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
#
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
#
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
#
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
#
3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
4
4
4
#
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
#
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
#
5
5
5
5
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
#
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
Número
obtenido Frecuencia
Total
1
35
2
45
3
30
4
30
5
24
6
36
200
Esta es la
tabla de
frecuencias:
Número obtenido
Frecuencia
1
35
2
45
3
30
4
30
5
24
6
36
Total
200
En un grupo de 75 alumnos se
pone un examen.
La variable aleatoria, que es
cuantitativa, es la calificación
obtenida por el estudiante.
La siguiente tabla muestra la
frecuencia observada de las
diferentes calificaciones:
Esta es la
tabla de
frecuencias:
Calificación
Número de alumnos
0
1
2
3
4
5
6
7
8
9
10
1
2
4
7
12
23
12
7
4
2
1
TOTAL
75
En un estudio sociológico, con la participación de
un grupo minoritario, se registró el nivel educativo
de los participantes.
El nivel educativo se codificó de la siguiente
manera: menos de la escuela secundaria fue
codificada como 1, la escuela secundaria fue
codificado como 2, graduado de la universidad fue
codificado como 3, y de postgrado que se cifraron
como 4.
Los resultados fueron:
112343222211122123322112222
2211332222212222213
Menos de la escuela
secundaria fue codificada
como 1, la escuela
secundaria fue codificado
como 2, graduado de la
universidad fue
codificado como 3, y de
postgrado que se cifraron
como 4.
1
1
2
3
4
3
2
2
2
2
1
1
1
2
2
1
2
3
3
2
2
1
1
2
2
2
2
2
2
1
1
3
3
2
2
2
2
2
1
2
2
2
2
2
1
3
1
1
2
3
4
3
2
2
2
2
1
1
1
2
2
1
2
3
3
2
2
1
1
2
2
2
2
2
2
1
1
3
3
2
2
2
2
2
1
2
2
2
2
2
1
3
O rdenando
de m enor
a m ayor


1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
4
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
4
Escolaridad
C o n tan d o
la
ap arició n
d e cad a
n ú m ero
  

Número de
personas
1
12
2
26
3
7
4
1
Total
46
Esta es la
tabla de
frecuencias:
Escolaridad
Número de
personas
1
12
2
26
3
7
4
1
Total
46
Se pueden mostrar gráficamente los
datos de una tabla de frecuencias
mediante un gráfico de líneas, en el
que los valores sucesivos se
representan sobre el eje horizontal y
sus correspondientes frecuencias se
representan mediante la altura de una
línea vertical.
Gráfico de una tabla de
frecuencias.
La abscisa especifica el valor
de un dato, y la frecuencia de
ocurrencia de tal valor se
identifica con la altura de una
línea vertical.
El experimento consiste en tirar un dado
200 veces.
La variable aleatoria es la cara del dado
que queda hacía arriba; le podemos
asignar el número que dicha cara tiene,
pero igual podría tener un gatito, un color
o lo que sea.
La tabla
muestra los
resultados
obtenidos:
#
3
3
6
1
2
4
4
6
4
6
4
3
2
2
2
1
1
6
1
6
#
3
4
6
4
2
1
6
1
4
6
6
2
1
5
1
2
1
2
6
4
#
3
2
6
6
3
2
1
5
5
1
3
4
5
6
3
6
1
5
4
3
#
5
4
3
1
6
5
6
6
2
5
3
2
1
3
3
5
4
3
3
2
#
5
5
6
5
2
2
4
4
2
5
6
2
2
4
2
3
1
3
2
6
#
2
4
5
3
2
6
1
4
6
5
4
3
5
1
6
1
4
6
2
3
#
3
2
1
2
2
3
4
4
5
3
5
3
5
2
4
1
2
3
2
2
#
2
4
1
6
4
1
2
1
5
2
3
1
6
2
5
1
1
3
4
2
#
2
1
2
3
2
6
2
3
5
1
2
4
5
6
3
2
6
6
1
4
#
2
6
1
1
5
1
2
4
4
6
6
6
6
1
1
2
1
6
4
2
Número obtenido
Frecuencia
1
35
2
45
3
30
4
30
5
24
6
36
Total
200
Número obtenido
Frecuencia
1
2
3
4
5
6
35
45
30
30
24
36
1. D eterm ina uno el área rectangular del
papel en la cual quiere uno hacer la grá fica.
E n este ejem plo use 20 cm horizontal
por 14 cm vertical.
1 4 cm
2 0 cm
2. T raza uno los ejes perpendiculares,
uno horizontal y otro vertical,
las abscisas y las ordenadas,
respectivam ente.
M ide uno sus respectivas longitudes.
E n este ejem plo use 18 cm en el eje X
y 12 cm en el eje Y .
1 2 cm
1 8 cm
3. E n el eje horizontal, el de las absci sas,
m arca uno los valores. P ara ello, m ide u no
la longitud horizontal del área de la gr áfica,
y divide uno dicha longitud entre el núm ero
de m arcas que se van a co locar en el eje.
S e colocan las m arcas.
E n este caso son 6, así que cada m arca e stá a
3 cm .
1 2 cm
3 cm
4. E n el eje vertical, m ide uno la longitud del
eje y para determ inar la altura de cada línea
utiliza uno una proporción directa.
E n este ejem plo la prim era linea es 35, así que
35
50

x
12
 x
35  12
50

76
5

42
5
 8.4
8 .4 cm
3 cm
4. E n el eje vertical, m ide uno la longi tud del
eje y para determ inar la altura de cada línea
utiliza uno una proporción directa.
La segunda línea es 45, así que
45
50

x
12
 x
45  12
50

96
5

54
5
 10.8
1 0 .8 cm
8 .4 cm
3 cm
En un estudio sociológico, con la participación de
un grupo minoritario, se registró el nivel educativo
de los participantes.
El nivel educativo se codificó de la siguiente
manera: menos de la escuela secundaria fue
codificada como 1, la escuela secundaria fue
codificado como 2, graduado de la universidad fue
codificado como 3, y de postgrado que se cifraron
como 4.
Los resultados fueron:
112343222211122123322112222
2211332222212222213
Escolaridad
Número de
personas
1
12
2
26
3
7
4
1
Total
46
Escolaridad
Número de
personas
1
12
2
26
3
7
4
1
Total
46
En ocasiones, las frecuencias no
se representan mediante líneas
sino mediante barras de una
cierta anchura.
Estas gráficas, llamadas gráficas
de barras, se utilizan muy a
menudo.
La abscisa especifica el valor de
un dato, y la frecuencia de
ocurrencia de tal valor se
identifica con la altura de una
barra vertical.
Las principales causas de muerte no natural
en Inglaterra están resumidas en la siguiente
tabla:
Causa de muerte
Número
Coche
30,500
Otros accidentes
27,500
Suicidio
20,234
Homicidio
8,342
Causa de muerte
Número
Coche
30,500
Otros accidentes
27,500
Suicidio
20,234
Homicidio
8,342
Causa de muerte
Coche
Otros accidentes
Suicidio
Homicidio
Número
30,500
27,500
20,234
8,342
35,000
30,000
25,000
20,000
15,000
10,000
5,000
Coche
Otros
accidentes
Suicidio
Homicidio
30,500
27,500
20,234
8,342
Coche
Otros
accidentes
Suicidio
Homicidio
El experimento consiste en tirar un dado
200 veces.
La variable aleatoria es la cara del dado
que queda hacía arriba; le podemos
asignar el número que dicha cara tiene,
pero igual podría tener un gatito, un color
o lo que sea.
La tabla
muestra los
resultados
obtenidos:
#
3
3
6
1
2
4
4
6
4
6
4
3
2
2
2
1
1
6
1
6
#
3
4
6
4
2
1
6
1
4
6
6
2
1
5
1
2
1
2
6
4
#
3
2
6
6
3
2
1
5
5
1
3
4
5
6
3
6
1
5
4
3
#
5
4
3
1
6
5
6
6
2
5
3
2
1
3
3
5
4
3
3
2
#
5
5
6
5
2
2
4
4
2
5
6
2
2
4
2
3
1
3
2
6
#
2
4
5
3
2
6
1
4
6
5
4
3
5
1
6
1
4
6
2
3
#
3
2
1
2
2
3
4
4
5
3
5
3
5
2
4
1
2
3
2
2
#
2
4
1
6
4
1
2
1
5
2
3
1
6
2
5
1
1
3
4
2
#
2
1
2
3
2
6
2
3
5
1
2
4
5
6
3
2
6
6
1
4
#
2
6
1
1
5
1
2
4
4
6
6
6
6
1
1
2
1
6
4
2
Número obtenido
Frecuencia
1
35
2
45
3
30
4
30
5
24
6
36
Total
200
50
45
40
Número
obtenido
Frecuencia
1
35
2
45
3
30
4
30
5
24
6
36
35
30
25
20
15
10
5
0
1
2
3
4
5
6
45
36
35
30
30
24
1
2
3
4
5
6
En un grupo de 75 alumnos se
pone un examen.
La variable aleatoria, que es
cuantitativa, es la calificación
obtenida por el estudiante.
La siguiente tabla muestra la
frecuencia observada de las
diferentes calificaciones:
Calificación
Número de alumnos
0
1
2
3
4
5
6
7
8
9
10
1
2
4
7
12
23
12
7
4
2
1
TOTAL
75
25
20
15
10
5
0
0
1
2
3
4
5
6
7
8
9
10
Calificación
Número de
alumnos
0
1
1
2
2
4
3
7
4
12
5
23
6
12
7
7
8
4
9
2
10
1
TOTAL
75
23
12
12
7
7
4
1
0
4
2
1
2
2
3
4
5
6
7
8
9
1
10
En un estudio sociológico, con la participación de
un grupo minoritario, se registró el nivel educativo
de los participantes.
El nivel educativo se codificó de la siguiente
manera: menos de la escuela secundaria fue
codificada como 1, la escuela secundaria fue
codificado como 2, graduado de la universidad fue
codificado como 3, y de postgrado que se cifraron
como 4.
Los resultados fueron:
112343222211122123322112222
2211332222212222213
Escolaridad
Número de
personas
1
12
2
26
3
7
4
1
Total
46
30
25
Escolaridad
20
Número de
personas
1
12
2
26
3
7
4
1
Total
46
15
10
5
0
1
2
3
4
26
12
7
1
1
2
3
4
Aguascalientes
Baja California
Baja California Sur
Campeche
Coahuila
Colima
Chiapas
Chihuahua
Distrito Federal
Durango
Guanajuato
Guerrero
Hidalgo
Jalisco
México
Michoacán
Morelos
Nayarit
Nuevo León
Oaxaca
Puebla
Querétaro
Quintana Roo
San Luis Potosí
Sinaloa
Sonora
Tabasco
Tamaulipas
Tlaxcala
Veracruz
Yucatán
Zacatecas
Población por estado (Censo 2005)
16,000,000
14,000,000
12,000,000
10,000,000
8,000,000
6,000,000
4,000,000
2,000,000
0
Yucatán
Tlaxcala
Tabasco
Sinaloa
Quintana Roo
Puebla
Nuevo León
Morelos
México
Hidalgo
Guanajuato
Distrito Federal
Chiapas
Coahuila
Baja California Sur
Aguascalientes
Población por estado (Censo 2005)
16,000,000
14,000,000
12,000,000
10,000,000
8,000,000
6,000,000
4,000,000
2,000,000
0
14,000,000
12,000,000
0
Aguascalientes
Baja California
Baja California…
Campeche
Coahuila
Colima
Chiapas
Chihuahua
Distrito Federal
Durango
Guanajuato
Guerrero
Hidalgo
Jalisco
México
Michoacán
Morelos
Nayarit
Nuevo León
Oaxaca
Puebla
Querétaro
Quintana Roo
San Luis Potosí
Sinaloa
Sonora
Tabasco
Tamaulipas
Tlaxcala
Veracruz
Yucatán
Zacatecas
Comparación de la población
16,000,000
2000
2005
10,000,000
8,000,000
6,000,000
4,000,000
2,000,000
Yucatán
Tlaxcala
Tabasco
Sinaloa
Quintana Roo
Puebla
Nuevo León
Morelos
México
Hidalgo
Guanajuato
Distrito Federal
Chiapas
Coahuila
Baja California Sur
Aguascalientes
7000
Densidad de población por entidad federativa
6000
5000
4000
3000
2000
1000
0
Otro tipo de gráfica utilizada para
representar una tabla de frecuencias es
el polígono de frecuencias, en el que se
muestran gráficamente las frecuencias
de los diferentes valores de los datos y
luego se conectan los puntos de la
gráfica mediante líneas rectas.
El experimento consiste en tirar un dado
200 veces.
La variable aleatoria es la cara del dado
que queda hacía arriba; le podemos
asignar el número que dicha cara tiene,
pero igual podría tener un gatito, un color
o lo que sea.
Número obtenido
Frecuencia
1
35
2
45
3
30
4
30
5
24
6
36
Total
200
50
Número
obtenido
Frecuencia
40
1
35
35
2
45
3
30
20
4
30
15
5
24
6
36
45
30
25
10
5
0
1
2
3
4
5
6
45
36
30
35
30
24
1
2
3
4
5
6
En un grupo de 75 alumnos se
pone un examen.
La variable aleatoria, que es
cuantitativa, es la calificación
obtenida por el estudiante.
La siguiente tabla muestra la
frecuencia observada de las
diferentes calificaciones:
Calificación
Número de alumnos
0
1
2
3
4
5
6
7
8
9
10
1
2
4
7
12
23
12
7
4
2
1
TOTAL
75
25
20
15
10
5
0
0
1
2
3
4
5
6
7
8
9
10
Calificación
Número de
alumnos
0
1
1
2
2
4
3
7
4
12
5
23
6
12
7
7
8
4
9
2
10
1
TOTAL
75
23
12
12
7
1
7
4
2
4
2
1
0
1
2
3
4
5
6
7
8
9
10
En un estudio sociológico, con la participación de
un grupo minoritario, se registró el nivel educativo
de los participantes.
El nivel educativo se codificó de la siguiente
manera: menos de la escuela secundaria fue
codificada como 1, la escuela secundaria fue
codificado como 2, graduado de la universidad fue
codificado como 3, y de postgrado que se cifraron
como 4.
Los resultados fueron:
112343222211122123322112222
2211332222212222213
Escolaridad
Número de
personas
1
12
2
26
3
7
4
1
Total
46
30
25
Escolaridad
20
Número de
personas
1
12
2
26
3
7
4
1
Total
46
15
10
5
0
1
2
3
4
26
12
7
1
1
2
3
4
S e dice que un conjunto de datos
es sim étrico con respecto al
valor x 0 , si las frecuencias de los
valores x 0  c y x 0  c son
iguales para todo c .
E s decir, para cada constante c ,
existe el m ism o núm ero de datos
con un valor igual a e unidades
por debajo de x 0 que con un valor
igual a e unidades por encim a de x 0 .
En un grupo de 75 alumnos se
pone un examen.
La variable aleatoria, que es
cuantitativa, es la calificación
obtenida por el estudiante.
La siguiente tabla muestra la
frecuencia observada de las
diferentes calificaciones:
Calificación
Número de alumnos
0
1
2
3
4
5
6
7
8
9
10
1
2
4
7
12
23
12
7
4
2
1
TOTAL
75
23
12
12
7
7
4
1
0
4
2
1
2
2
3
4
5
6
7
8
9
1
10
23
12
12
7
7
4
2
1
0
4
1
2
2
3
4
5
6
7
8
9
1
10
Los datos "próximos" a ser
simétricos se dice que son
aproximadamente
simétricos.
Los datos "próximos" a ser simétricos se dice
que son aproximadamente simétricos.
La forma más fácil de determinar si
un conjunto de datos es
aproximadamente simétrico consiste
en representarlos gráficamente.
S im étrico
A proxim adam ete
sim étrico
A sim étrico
Frecuencia de un valor
dividida entre el número
total de datos del
conjunto.
S i f rep resen ta la frecu en cia d e
o cu rren cia d el valo r x , y n rep resen ta
el n ú m ero to tal d e o b servacio n es d el
co n ju n to d e d ato s, se d efin e la
frecu en cia relativa co m o
f
n
En ocasiones, es más
conveniente considerar y
representar gráficamente las
frecuencias relativas que las
frecuencias absolutas de los
datos.
S i f representa la frecuencia de ocurrenc ia
del valor x , se puede m ostrar gráficam ente
la frecuencia relativa
f
frente a x ,
n
donde n representa el núm ero total de
observaciones del conjunto de datos.
Una gráfica de frecuencias relativas
tiene la misma apariencia que la
gráfica análoga de frecuencias
absolutas, aunque los valores del eje
vertical se han dividido entre el
número total de observaciones del
conjunto de datos.
1 . O rd en e el co n ju n to d e d ato s
en fo rm a crecien te en valo res.
2. D eterm ine los valores distintos
y sus frecuencias de ocurrencia.
3. L iste los citados valores distintos
junto con sus frecuencias f y sus
frecuenciasrelativas
f
, donde n
n
es el núm ero total de observaciones
del conjunto de datos.
1 . O rd en e el co n ju n to d e d ato s
en fo rm a crecien te en valo res.
2 . D eterm in e lo s valo res d istin to s
y su s frecu en cias d e o cu rren cia.
3 . L iste lo s citad o s valo res d istin to s j u n to
co n su s frecu en cias f y su s fr ecu en cias
relativas
f
, d o n d e n es el n ú m ero to tal
n
d e o b servacio n es d el co n ju n to d e d ato s.
El experimento consiste en tirar un dado
200 veces.
La variable aleatoria es la cara del dado
que queda hacía arriba; le podemos
asignar el número que dicha cara tiene,
pero igual podría tener un gatito, un color
o lo que sea.
La tabla
muestra los
resultados
obtenidos:
#
3
3
6
1
2
4
4
6
4
6
4
3
2
2
2
1
1
6
1
6
#
3
4
6
4
2
1
6
1
4
6
6
2
1
5
1
2
1
2
6
4
#
3
2
6
6
3
2
1
5
5
1
3
4
5
6
3
6
1
5
4
3
#
5
4
3
1
6
5
6
6
2
5
3
2
1
3
3
5
4
3
3
2
#
5
5
6
5
2
2
4
4
2
5
6
2
2
4
2
3
1
3
2
6
#
2
4
5
3
2
6
1
4
6
5
4
3
5
1
6
1
4
6
2
3
#
3
2
1
2
2
3
4
4
5
3
5
3
5
2
4
1
2
3
2
2
#
2
4
1
6
4
1
2
1
5
2
3
1
6
2
5
1
1
3
4
2
#
2
1
2
3
2
6
2
3
5
1
2
4
5
6
3
2
6
6
1
4
#
2
6
1
1
5
1
2
4
4
6
6
6
6
1
1
2
1
6
4
2
Número obtenido
Frecuencia
1
35
2
45
3
30
4
30
5
24
6
36
Total
200
Número obtenido
Frecuencia
1
2
3
4
5
6
35
45
30
30
24
36
50
45
Número
obtenido
Frecuencia
1
35
25
2
45
20
3
30
4
30
5
24
6
36
40
35
30
15
10
5
0
1
2
3
4
5
6
50
45
40
Número
obtenido
Frecuencia
1
35
2
45
3
30
10
4
30
5
5
24
6
36
35
30
25
20
15
0
1
2
3
4
5
6
Número
obtenido
Frecuencia
Frecuencia
relativa
1
35
0.175
2
45
0.225
3
30
0.150
4
30
0.150
5
24
0.120
6
36
0.180
Total
200
1.000
0.250
Número
obtenido Frecuencia
Frecuencia
relativa
0.200
0.150
1
35
0.175
2
45
0.225
3
30
0.150
4
30
0.150
5
24
0.120
6
36
0.180
Total
200
1.000
0.100
0.050
0.000
1
2
3
4
5
6
0.225
0.180
0.175
0.150
0.150
0.120
1
2
3
4
5
6
0.250
Número
Frecuencia
obtenido Frecuencia
relativa
0.200
0.150
0.100
0.050
1
35
0.175
2
45
0.225
3
30
0.150
4
30
0.150
5
24
0.120
6
36
0.180
0.000
1
2
3
4
5
6
Total
200
1.000
0.225
0.180
0.175
0.150
0.150
0.120
1
2
3
4
5
6
En un grupo de 75 alumnos se
pone un examen.
La variable aleatoria, que es
cuantitativa, es la calificación
obtenida por el estudiante.
La siguiente tabla muestra la
frecuencia observada de las
diferentes calificaciones:
Calificación
Número de alumnos
0
1
2
3
4
5
6
7
8
9
10
1
2
4
7
12
23
12
7
4
2
1
TOTAL
75
25
20
15
10
5
0
0
1
2
3
4
5
6
7
8
9
10
Calificación
Número de
alumnos
0
1
1
2
2
4
3
7
4
12
5
23
6
12
7
7
8
4
9
2
10
1
TOTAL
75
25
20
15
10
5
0
0
1
2
3
4
5
6
7
8
9 10
Calificación
Número de
alumnos
0
1
1
2
2
4
3
7
4
12
5
23
6
12
7
7
8
4
9
2
10
1
TOTAL
75
Calificación
Número de alumnos
Frecuencia relativa
0
1
2
3
4
5
6
7
8
9
10
1
2
4
7
12
23
12
7
4
2
1
0.013
0.027
0.053
0.093
0.160
0.307
0.160
0.093
0.053
0.027
0.013
TOTAL
75
1.000
0.350
Número de
Calificación
alumnos
0.300
0.250
0.200
0.150
0.100
0.050
0.000
0
1
2
3
4
5
6
7
8
9
10
Frecuencia
relativa
0
1
0.013
1
2
0.027
2
4
0.053
3
7
0.093
4
12
0.160
5
23
0.307
6
12
0.160
7
7
0.093
8
4
0.053
9
2
0.027
10
1
0.013
TOTAL
75
1.000
0.307
0.160
0.160
0.093
0.093
0.053
0.013
0
0.053
0.027
1
0.027
2
3
4
5
6
7
8
9
0.013
10
0.350
0.300
Calificación
0.250
0.200
0.150
0.100
0.050
0.000
0
1
2
3
4
5
6
7
8
9 10
Número de
alumnos
Frecuencia
relativa
0
1
0.013
1
2
0.027
2
4
0.053
3
7
0.093
4
12
0.160
5
23
0.307
6
12
0.160
7
7
0.093
8
4
0.053
9
2
0.027
10
1
0.013
TOTAL
75
1.000
0.307
0.160
0.160
0.093
0.093
0.053
0.027
0.013
0
0.053
1
0.027
2
3
4
5
6
7
8
9
0.013
10
En un estudio sociológico, con la participación de
un grupo minoritario, se registró el nivel educativo
de los participantes.
El nivel educativo se codificó de la siguiente
manera: menos de la escuela secundaria fue
codificada como 1, la escuela secundaria fue
codificado como 2, graduado de la universidad fue
codificado como 3, y de postgrado que se cifraron
como 4.
Los resultados fueron:
112343222211122123322112222
2211332222212222213
Escolaridad
Número de
personas
1
12
2
26
3
7
4
1
Total
46
Escolaridad
1
2
3
4
Total
Número de
personas
12
26
7
1
46
26
12
7
1
1
2
3
4
26
12
7
1
1
2
3
4
Escolaridad
Número de
personas
Frecuencia relativa
1
12
0.261
2
26
0.565
3
7
0.152
4
1
0.022
Total
46
1.000
Número de
Escolaridad personas
1
12
2
26
3
7
4
1
Total
46
0.600
0.500
Frecuencia
relativa
0.261
0.565
0.152
0.022
1.000
0.400
0.300
0.200
0.100
0.000
1
2
3
4
0.565
0.261
0.152
0.022
1
2
3
4
Número de
Escolaridad personas
1
12
2
26
3
7
4
1
Total
46
0.600
0.500
Frecuencia
relativa
0.261
0.565
0.152
0.022
1.000
0.400
0.300
0.200
0.100
0.000
1
2
3
4
0.565
0.261
0.152
0.022
1
2
3
4
Los siguientes datos representan los
tiempos de progresión, medidos en
meses, de un tipo particular de tumor
cerebral, llamado glioblastoma, en 65
pacientes:
6, 5, 37, 10, 22, 9, 2, 16, 3, 3, 11, 9, 5, 14,
11, 3, 1, 4, 6, 2, 7, 3, 7, 5, 4, 8, 2, 7, 13,
16, 15, 9, 4, 4, 2, 3, 9, 5, 11, 3, 7, 5, 9, 3,
8, 9, 4, 10, 3, 2, 7, 6, 9, 3, 5, 4, 6, 4, 14, 3,
12, 6, 8, 12, 7
6, 5, 37, 10, 22,
9, 2, 16, 3, 3, 11,
9, 5, 14, 11, 3, 1,
4, 6, 2, 7, 3, 7, 5,
4, 8, 2, 7, 13, 16,
15, 9, 4, 4, 2, 3,
9, 5, 11, 3, 7, 5,
9, 3, 8, 9, 4, 10,
3, 2, 7, 6, 9, 3, 5,
4, 6, 4, 14, 3, 12,
6, 8, 12, 7
Meses
6
5
37
10
22
9
2
16
3
3
11
9
5
14
11
3
1
4
6
2
7
3
Meses
7
5
4
8
2
7
13
16
15
9
4
4
2
3
9
5
11
3
7
5
9
3
Meses
8
9
4
10
3
2
7
6
9
3
5
4
6
4
14
3
12
6
8
12
7
Meses
6
5
37
10
22
9
2
16
3
3
11
9
5
14
11
3
1
4
6
2
7
3
Meses
7
5
4
8
2
7
13
16
15
9
4
4
2
3
9
5
11
3
7
5
9
3
Meses
8
9
4
10
3
2
7
6
9
3
5
4
6
4
14
3
12
6
8
12
7
Meses
Meses
1
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
Meses
4
5
5
5
5
5
5
6
6
6
6
6
7
7
7
7
7
7
8
8
8
9
9
9
9
9
9
9
10
10
11
11
11
12
12
13
14
14
15
16
16
22
37
Meses
1
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
Meses
4
5
5
5
5
5
5
6
6
6
6
6
7
7
7
7
7
7
8
8
8
9
Meses
9
9
9
9
9
9
10
10
11
11
11
12
12
13
14
14
15
16
16
22
37
Meses Pacientes Frecuencia relativa
1
1
0.015
2
5
0.077
3
10
0.154
4
7
0.108
5
6
0.092
6
5
0.077
7
6
0.092
8
3
0.046
9
7
0.108
10
2
0.031
11
3
0.046
12
2
0.031
13
1
0.015
14
2
0.031
15
1
0.015
16
2
0.031
22
1
0.015
37
1
0.015
Total
65
1.000
Meses
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
22
37
Total
Pacientes
1
5
10
7
6
5
6
3
7
2
3
2
1
2
1
2
1
1
65
Frecuencia relativa
0.015
0.077
0.154
0.108
0.092
0.077
0.092
0.046
0.108
0.031
0.046
0.031
0.015
0.031
0.015
0.031
0.015
0.015
1.000
Meses
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
22
37
Total
12
10
8
6
4
Pacientes
1
5
10
7
6
5
6
3
7
2
3
2
1
2
1
2
1
1
65
2
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 22 37
Meses
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
22
37
Total
12
10
8
6
4
Pacientes
1
5
10
7
6
5
6
3
7
2
3
2
1
2
1
2
1
1
65
2
0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 22 37
Meses Pacientes
1
1
2
5
3
10
4
7
5
6
6
5
7
6
8
3
9
7
10
2
11
3
12
2
13
1
14
2
15
1
16
2
22
1
37
1
Total
65
0.180
0.160
0.140
0.120
0.100
0.080
0.060
Frecuencia
relativa
0.015
0.077
0.154
0.108
0.092
0.077
0.092
0.046
0.108
0.031
0.046
0.031
0.015
0.031
0.015
0.031
0.015
0.015
1.000
0.040
0.020
0.000
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
22
37
Meses Pacientes
1
1
2
5
3
10
4
7
5
6
6
5
7
6
8
3
9
7
10
2
11
3
12
2
13
1
14
2
15
1
16
2
22
1
37
1
Total
65
0.180
0.160
0.140
0.120
0.100
0.080
0.060
Frecuencia
relativa
0.015
0.077
0.154
0.108
0.092
0.077
0.092
0.046
0.108
0.031
0.046
0.031
0.015
0.031
0.015
0.031
0.015
0.015
1.000
0.040
0.020
0.000
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
22
37
12
Frecuencia absoluta
10
8
6
4
2
0
1
2
3
4
5
0.180
6
7
8
9
10
11
12
13
14
15
16
22
37
Frecuencia relativa
0.160
0.140
0.120
0.100
0.080
0.060
0.040
0.020
0.000
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
22
37
12
Frecuencia absoluta
10
8
6
4
2
0
1
2
3
4
5
0.180
6
7
8
9
10
11
12
13
14
15
16
22
37
Frecuencia relativa
0.160
0.140
0.120
0.100
0.080
0.060
0.040
0.020
0.000
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
22
37
Es una gráfica que
representa las
frecuencias relativas
mediante la división de
un círculo en sectores.
Las gráficas de pastel
suelen utilizarse para
representar las frecuencias
relativas cuando los datos
no son numéricos.
Se construye un círculo
que luego se divide en
sectores, uno por cada
valor diferente de los
datos.
E l área de cada sector, con la que se pretende
representar la frecuencia relativa de un valor,
se determ ina com o sigue:
S i la frecuencia relativa del valor es
f
,
n
el área de su sector debe coincidir con l a
fracción
f
n
del área total del círculo.
S i un determ inado valor tiene una
frecuencia relativa
f
, su sector
n
correspondiente puede obtenerse
con la selección de un ángulo
igual a 360
f
n
grados.
La tabla siguiente muestra el número de
muertes que hubo en las carreteras británicas
durante 1987 distribuidas por clases:
Clases
Número de muertes
Peatones
1699
Ciclistas
280
Motociclistas
650
Automovilistas
1327
Clases
Número de muertes
%
Grados
Peatones
1699
0.43
155
Ciclistas
280
0.07
25
Motoristas
650
0.16
59
Automovilistas
1327
0.34
121
Total
3956
1.00
360
Clases
Número de muertes
Peatones
1699
Ciclistas
280
Motoristas
650
Automovilistas
1327
Total
3956
Peatones
Ciclistas
Motoristas
Automovilistas
1327
1699
650
280
Peatones
Ciclistas
Motoristas
Automovilistas
La tabla siguiente muestra
la composición de la actual
cámara de diputados en
nuestro país:
Partido
Total
PRI
237
PAN
143
PRD
71
PVEM
21
PT
13
NA
9
CONV
6
TOTAL
500
Partido
Total
%
Grados
PRI
237
0.47
171
PAN
143
0.29
103
PRD
71
0.14
51
PVEM
21
0.04
15
PT
13
0.03
9
NA
9
0.02
6
CONV
6
0.01
4
TOTAL
500
1.00
360
Partido
Total
PRI
237
PAN
143
PRD
71
PRI
PAN
PRD
PVEM
PVEM
21
PT
NA
PT
13
NA
9
CONV
6
TOTAL
500
CONV
6
13
9
21
71
237
143
PRI
PAN
PRD
PVEM
PT
NA
CONV
Partido
PRI
237
PAN
143
PRD
3% 2% 1%
Total
71
PVEM
21
PT
13
NA
9
CONV
6
TOTAL
500
4%
PRI
PAN
14%
47%
PRD
PVEM
PT
29%
NA
CONV
Las principales causas de muerte no natural
en Inglaterra están resumidas en la siguiente
tabla:
Causa de muerte
Número
Coche
30,500
Otros accidentes
27,500
Suicidio
20,234
Homicidio
8,342
Causa de muerte
Número
%
Grados
Coche
30,500
0.35
127
Otros accidentes
27,500
0.32
114
Suicidio
20,234
0.23
84
8,342
0.10
35
Homicidio
Total
86,576
1.00
360
Causa de muerte
Coche
Otros accidentes
Suicidio
Homicidio
Coche
Otros accidentes
Suicidio
Homicidio
Número
30,500
27,500
20,234
8,342
8,342
30,500
Coche
20,234
Otros accidentes
Suicidio
Homicidio
27,500
Homicidio
10%
Coche
35%
Suicidio
23%
Otros
accidentes
32%
Población cuya lengua materna es el inglés
2.1 Introducción
2.2 Tablas y gráficas de frecuencias
2.3 Datos agrupados e
histogramas
2.4 Gráficas de tallos y hojas
2.5 Conjuntos de datos apareados
Como hemos visto, el uso
de gráficas de barras o
líneas es una forma
bastante efectiva de
representar las frecuencias
de los diferentes valores.
Sin embargo, en algunos
conjuntos de datos el
número de valores
distintos es demasiado
grande para que se
puedan utilizar los gráficas
citados.
En su lugar, es posible
clasificar dichos valores en
grupos o intervalos de clase,
para luego representar
gráficamente el número de
datos que corresponden a
cada clase.
En la elección del número de intervalos de
clase se debe ponderar entre:
(i) elegir pocos a costa de perder mucha
información sobre los datos reales de cada
intervalo de clase,
o
(ii) elegir muchos, con lo que las frecuencias
resultantes de cada intervalo de clase
pueden ser demasiado pequeñas para que
se reconozcan los patrones de forma.
Aunque lo más habitual suele ser entre
5 y 10 intervalos de clase, el número
apropiado es una elección subjetiva, y
uno puede, como es natural, probar
distintos números de intervalos de
clase para ver cuál de las gráficas
resultantes revela más información
sobre los datos.
Es corriente, aunque no
esencial, elegir
intervalos de clase de
igual longitud.
Los puntos inicial y final de
cada intervalo de clase se
llaman extremos o límites
del mismo, extremo inferior
y extremo superior
respectivamente.
Nosotros utilizaremos el
convenio de inclusión por la
izquierda, lo que significa que
el intervalo de clase incluye el
extremo de la izquierda pero
no el de la derecha.
Es la diferencia entre
los extremos de clase
que la forman.
La marca de clase es el
punto medio del intervalo
de clase, y se obtiene
sumando los extremos
inferior y superior de la
clase y dividiendo entre 2.
Los siguientes datos (en miles de
pesos) representan las rentas netas
anuales de una muestra de
contribuyentes:
47,55,18,24,27,41,50,38,33,29,15,77,64
,22,19,35,39,41,67,55,121,77,80,34,41,
48,60,30,22,28,84,55,26,105,62,30,17,2
3,31,28,56,64,88,104,115,39,25,18,21,3
0,57,4038,29,19,46,40,49,72,70,37,39,1
8,22,29,52,94,86,23,36
Ingreso
47
55
18
24
27
41
50
38
33
29
15
77
64
22
Ingreso
19
35
39
41
67
55
121
77
80
34
41
48
60
30
Ingreso
22
28
84
55
26
105
62
30
17
23
31
28
56
64
Ingreso
88
104
115
39
25
18
21
30
57
40
38
29
19
46
Ingreso
40
49
72
70
37
39
18
22
29
52
94
86
23
36
Ingreso
15
17
18
18
18
19
19
21
22
22
22
23
23
24
Ingreso
25
26
27
28
28
29
29
29
30
30
30
31
33
34
Ingreso
35
36
37
38
38
39
39
39
40
40
41
41
41
46
Ingreso
47
48
49
50
52
55
55
55
56
57
60
62
64
64
Ingreso
67
70
72
77
77
80
84
86
88
94
104
105
115
121
Ingreso Ingreso Ingreso Ingreso Ingreso
15
25
35
47
67
17
26
36
48
70
18
27
37
49
72
in tervalo s, h acem o s
18
28
38
50
77
18
28
38
52
77
121  15
19
29
39
55
80
19
29
39
55
84
21
29
39
55
86
22
30
40
56
88
22
30
40
57
94
22
30
41
60
104
23
31
41
62
105
23
33
41
64
115
24
34
46
64
121
S i q u erem o s 5
 2 1 .1
5
A sí q u e el tam añ o
d e cad a in tervalo
lo to m am o s d e 2 2 .
Ingreso Ingreso Ingreso Ingreso Ingreso
15
25
35
47
67
17
26
36
48
70
18
27
37
49
72
18
28
38
50
77
18
28
38
52
77
19
29
39
55
80
19
29
39
55
84
21
29
39
55
86
22
30
40
56
88
22
30
40
57
94
22
30
41
60
104
23
31
41
62
105
23
33
41
64
115
24
34
46
64
121
Intervalo
Frecuencia
15-37
30
37-59
22
59-81
10
81-103
4
103-125
4
Ingreso Ingreso Ingreso Ingreso Ingreso
15
25
35
47
67
17
26
36
48
70
S i q u erem o s 1 0
18
27
37
49
72
in tervalo s, h acem o s
18
28
38
50
77
18
28
38
52
77
121  15
19
29
39
55
80
10
19
29
39
55
84
21
29
39
55
86
22
30
40
56
88
22
30
40
57
94
22
30
41
60
104
23
31
41
62
105
23
33
41
64
115
24
34
46
64
121
 1 0 .6
A sí q u e el tam añ o
d e cad a in tervalo
lo to m am o s d e 1 1 .
Ingreso Ingreso Ingreso Ingreso Ingreso
Intervalo Frecuencia
15
25
35
47
67
17
26
36
48
70
15-26
15
18
27
37
49
72
26-37
15
18
28
38
50
77
18
28
38
52
77
37-48
13
19
29
39
55
80
48-59
9
19
29
39
55
84
59-70
5
21
29
39
55
86
22
30
40
56
88
70-81
5
22
30
40
57
94
81-92
3
22
30
41
60
104
92-103
1
23
31
41
62
105
23
33
41
64
115
103-114
2
24
34
46
64
121
114-125
2
Tiempo que tardan 124,089,000 gringos en ir
al trabajo (Encuesta realizada por la Oficina de censos en el año 2000):
Intervalo
Ancho
0
5
10
15
20
25
30
35
40
45
60
90
5
5
5
5
5
5
5
5
5
15
30
60
Cantidad (miles)
4,180
13,687
18,618
19,634
17,981
7,190
16,369
3,212
4,122
9,200
6,461
3,435
Una gráfica de barras
en la que las barras
sean adyacentes se
llama histograma.
Gráfica en la que los datos
se dividen en intervalos de
clase, cuyas frecuencias
se muestran en una
gráfica de barras.
El eje vertical de un histograma
puede representar, bien las
frecuencias de los intervalos de clase
o bien sus frecuencias relativas. En el
primer caso, el histograma se llama
histograma de frecuencias; en el
segundo, se trata de un histograma
de frecuencias relativas.
Es importante notar, que una
tabla de frecuencias de
intervalos de clase o un
histograma basado en tal
tabla, no contiene toda la
información del conjunto de
datos originales.
Ambas representaciones utilizan sólo
el número de valores dentro de cada
intervalo de clase, y no los valores
reales de los datos. Así pues, aunque
las tablas y los gráficas citados son
un útil reflejo de los datos, el conjunto
de datos originales se debe mantener
siempre.
1. Ordene los datos en forma creciente.
2. Elija los intervalos de clase de
manera que todos los datos aparezcan
en alguno de ellos.
3. Construya una tabla de frecuencias.
4. Dibuje las barras adyacentes con
alturas iguales a las frecuencias del
paso 3.
Los siguientes datos (en miles de pesos)
representan las rentas netas anuales de una
muestra de contribuyentes:
47,55,18,24,27,41,50,38,33,29,15,77,64,22,19,
35,39,41,67,55,121,77,80,34,41,48,60,30,22,2
8,84,55,26,105,62,30,17,23,31,28,56,64,88,10
4,115,39,25,18,21,30,57,40,38,29,19,46,40,49,
72,70,37,39,18,22,29,52,94,86,23,36
Ingreso
47
55
18
24
27
41
50
38
33
29
15
77
64
22
Ingreso
19
35
39
41
67
55
121
77
80
34
41
48
60
30
Ingreso
22
28
84
55
26
105
62
30
17
23
31
28
56
64
Ingreso
88
104
115
39
25
18
21
30
57
40
38
29
19
46
Ingreso
40
49
72
70
37
39
18
22
29
52
94
86
23
36
70
67
64
61
58
55
52
49
46
43
40
37
34
31
28
25
22
19
16
13
10
7
4
1
140
120
100
80
60
40
20
0
Ingreso
15
17
18
18
18
19
19
21
22
22
22
23
23
24
Ingreso
25
26
27
28
28
29
29
29
30
30
30
31
33
34
Ingreso
35
36
37
38
38
39
39
39
40
40
41
41
41
46
Ingreso
47
48
49
50
52
55
55
55
56
57
60
62
64
64
Ingreso
67
70
72
77
77
80
84
86
88
94
104
105
115
121
1
4
7
10
13
16
19
22
25
28
31
34
37
40
43
46
49
52
55
58
61
64
67
70
140
120
100
80
60
40
20
0
Ingreso Ingreso Ingreso Ingreso Ingreso
15
25
35
47
67
17
26
36
48
70
18
27
37
49
72
18
28
38
50
77
18
28
38
52
77
19
29
39
55
80
19
29
39
55
84
21
29
39
55
86
22
30
40
56
88
22
30
40
57
94
22
30
41
60
104
23
31
41
62
105
23
33
41
64
115
24
34
46
64
121
Intervalo
Frecuencia
15-37
30
37-59
22
59-81
10
81-103
4
103-125
4
35
Intervalo
Frecuencia
30
25
20
15
15-37
30
37-59
22
59-81
10
81-103
4
103-125
4
10
5
0
15-37
37-59
59-81
81-103
103-125
30
22
10
15-37
37-59
59-81
4
4
81-103
103-125
Ingreso Ingreso Ingreso Ingreso Ingreso
Intervalo Frecuencia
15
25
35
47
67
17
26
36
48
70
15-26
15
18
27
37
49
72
26-37
15
18
28
38
50
77
18
28
38
52
77
37-48
13
19
29
39
55
80
48-59
9
19
29
39
55
84
59-70
5
21
29
39
55
86
22
30
40
56
88
70-81
5
22
30
40
57
94
81-92
3
22
30
41
60
104
92-103
1
23
31
41
62
105
23
33
41
64
115
103-114
2
24
34
46
64
121
114-125
2
Intervalo
16
14
12
10
8
Frecuencia
15-26
15
26-37
15
37-48
13
48-59
9
59-70
5
70-81
5
81-92
3
92-103
1
103-114
2
114-125
2
6
4
2
0
15-26
26-37
37-48
48-59
59-70
70-81
81-92
92-103 103-114 114-125
15
15
13
9
5
5
3
2
2
1
15-26
26-37
37-48
48-59
59-70
70-81
81-92
92-103 103-114 114-125
30
22
15 15
13
9
4
5
4
3
92-…
81-…
70-…
59-…
81-103 103-125
48-…
59-81
37-…
37-59
26-…
15-37
15-…
1
2
2
114…
5
103…
10
Tiempo que tardan 124,089,000 gringos en ir
al trabajo (Encuesta realizada por la Oficina de censos en el año 2000):
Intervalo
Ancho
0
5
10
15
20
25
30
35
40
45
60
90
5
5
5
5
5
5
5
5
5
15
30
60
Cantidad (miles)
4,180
13,687
18,618
19,634
17,981
7,190
16,369
3,212
4,122
9,200
6,461
3,435
La importancia de un histograma
estriba en que permite organizar y
presentar los datos gráficamente
para que se pueda prestar
atención a determinadas
características importantes de los
datos.
Un histograma puede indicar:
1. La simetría de los datos
2. La dispersión de éstos.
3. Si existen intervalos que tienen un alto
nivel de concentración de datos.
4. Si existen brechas entre los datos.
5. Si algunos valores de datos están muy
separados de otros.
S im étrico
A sim étrico
D isperso
C o n cen trad o
C o n u n a b rech a
C on datos separados unos de otros
Un histograma es, en esencia,
un diagrama de barras que
muestra gráficamente las
frecuencias o las frecuencias
relativas de los datos que
aparecen dentro de los distintos
intervalos de clase.
Dichas frecuencias de clase
también se pueden representar
gráficamente mediante
polígonos de frecuencias
absolutas o de frecuencias
relativas.
Cada intervalo de clase es
identificado por un valor,
que generalmente coincide
con el punto medio del
intervalo.
Después, estos valores se
representan gráficamente frente a
las frecuencias de los intervalos de
clase que representan y los puntos
de la gráfica se conectan mediante
líneas rectas para conseguir el
polígono de frecuencias.
Estas gráficas son
especialmente útiles para
comparar conjuntos de datos,
puesto que en una misma
gráfica se pueden mostrar
varios polígonos de frecuencias.
Migración
a los
Estados
Unidos
Intervalo
1821–1830
1831–1840
1831–1850
1851–1860
1861–1870
1871–1880
1881–1890
1891–1900
1901–1910
1911–1920
1921–1930
1931–1940
1941–1950
1951–1960
1961–1970
1971–1980
1981–1990
1991–2000
Europa
98,797
495,681
1,597,442
2,452,577
2,064,141
2,271,925
4,735,484
3,555,352
8,056,040
4,321,887
2,463,194
347,566
621,147
1,325,727
1,123,492
800,368
761,550
1,359,737
México
4,817
6,599
3,271
3,078
2,191
5,162
1,913
971
49,642
219,004
459,287
22,319
60,589
299,811
453,937
640,294
1,655,843
2,249,421
1991–2000
1981–1990
1971–1980
1961–1970
1951–1960
1941–1950
1931–1940
1921–1930
1911–1920
1901–1910
1891–1900
1881–1890
1871–1880
1861–1870
1851–1860
1831–1850
1831–1840
1821–1830
Migración de Europa a los USA
9,000,000
8,000,000
7,000,000
6,000,000
5,000,000
4,000,000
3,000,000
2,000,000
1,000,000
-
1991–2000
1981–1990
1971–1980
1961–1970
1951–1960
1941–1950
1931–1940
1921–1930
1911–1920
1901–1910
1891–1900
1881–1890
1871–1880
1861–1870
1851–1860
1831–1850
1831–1840
1821–1830
Migración de Europa a los USA
9,000,000
8,000,000
7,000,000
6,000,000
5,000,000
4,000,000
3,000,000
2,000,000
1,000,000
-
1991–2000
1981–1990
1971–1980
1961–1970
1951–1960
1941–1950
1931–1940
1921–1930
1911–1920
1901–1910
1891–1900
1881–1890
1871–1880
1861–1870
1851–1860
1831–1850
1831–1840
1821–1830
Migración de México a los USA
2,500,000
2,000,000
1,500,000
1,000,000
500,000
-
1991–2000
1981–1990
1971–1980
1961–1970
1951–1960
1941–1950
1931–1940
1921–1930
1911–1920
1901–1910
1891–1900
1881–1890
1871–1880
1861–1870
1851–1860
1831–1850
1831–1840
1821–1830
Migración de México a los USA
2,500,000
2,000,000
1,500,000
1,000,000
500,000
-
1991–2000
1981–1990
1971–1980
1961–1970
1951–1960
1941–1950
1931–1940
1921–1930
1911–1920
1901–1910
1891–1900
1881–1890
1871–1880
1861–1870
1851–1860
1831–1850
1831–1840
1821–1830
9,000,000
8,000,000
7,000,000
6,000,000
5,000,000
4,000,000
Europa
México
3,000,000
2,000,000
1,000,000
-
2.1 Introducción
2.2 Tablas y gráficas de frecuencias
2.3 Datos agrupados e histogramas
2.4 Gráficas de tallos y hojas
2.5 Conjuntos de datos
apareados
En ocasiones, los
conjuntos de datos
consisten en pares de
valores con algún tipo de
relación entre ellos.
En ocasiones, los conjuntos de datos consisten
en pares de valores con algún tipo de relación
entre ellos.
C ad a in d ivid u o d el co n ju n to d e d ato s
p resen ta u n valo r x y u n valo r y .
P o r lo g en eral, el p ar i -ésim o se
d en o ta m ed ian te
 xi , y i  ,
i  1, ... , n .
Para determinar la relación entre la temperatura que hay al
mediodía (medida en grados Celsius) y el número de piezas
defectuosas producidas dicho día, una compañía registró los
datos siguientes correspondientes a 22 días laborables:
Para determinar la
relación entre la
temperatura que hay
al mediodía (medida
en grados Celsius) y
el número de piezas
defectuosas
producidas dicho día,
una compañía
registró los datos
siguientes
correspondientes a
22 días laborables:
Temperatura
24.2
22.7
30.5
28.6
25.5
32.0
28.6
26.5
25.3
26.0
24.4
24.8
20.6
25.1
21.4
23.7
23.9
25.2
27.4
28.3
28.8
26.6
Total
Piezas defectuosas
25
31
36
33
19
24
27
25
16
14
22
23
20
25
25
23
27
30
33
32
35
24
569
Para determinar la relación entre la temperatura que hay al
mediodía (medida en grados Celsius) y el número de piezas
defectuosas producidas dicho día, una compañía registró los
datos siguientes correspondientes a 22 días laborables.
En este caso los pares de datos son la temperatura
y el numero de piezas defectuosas.
Tenemos un conjunto de 22 parejas de datos, cuya
primera componente es la temperatura y la segunda
componente el número de piezas defectuosas
encontradas en ese momento.
Por ejemplo, el tercer día la temperatura era de 30.5
grados centígrados y el número de piezas
defectuosas halladas fue de 36.
Una posibilidad de representación de
esos conjuntos de datos consiste en
considerar separadamente cada uno
de los datos apareados y en
representar cada uno de ellos
mediante histogramas o gráficas de
tallos y hojas.
Sin embargo, dicha representación por
separado, en general no nos dicen nada
acerca de la relación existente entre
ambas variables.
Así por ejemplo, no son útiles por sí
mismas para ayudar a discernir si existe
algún tipo de correlación o dependencia
entre las dos variables.
Para responder a cuestiones de
este tipo, es preciso considerar
simultáneamente los valores
apareados de cada dato puntual.
Para determinar la
relación entre la
temperatura que hay
al mediodía (medida
en grados Celsius) y
el número de piezas
defectuosas
producidas dicho día,
una compañía
registró los datos
siguientes
correspondientes a 22
días laborables:
Temperatura
24.2
22.7
30.5
28.6
25.5
32.0
28.6
26.5
25.3
26.0
24.4
24.8
20.6
25.1
21.4
23.7
23.9
25.2
27.4
28.3
28.8
26.6
Total
Piezas defectuosas
25
31
36
33
19
24
27
25
16
14
22
23
20
25
25
23
27
30
33
32
35
24
569
35.0
30.0
25.0
20.0
15.0
10.0
5.0
0.0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20 21 22
7
8
9
10
40
35
30
25
20
15
10
5
0
1
2
3
4
5
6
11
12
13
14
15
16
17
18
19
20
21
40.0
35.0
30.0
25.0
20.0
Temperatura
15.0
Piezas
defectuosas
10.0
5.0
0.0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Una posibilidad para considerar
simultáneamente los valores
apareados de cada dato puntual,
es mediante un diagrama de
dispersión.
Una forma útil de mostrar un
conjunto de datos con
valores apareados es la de
representarlos mediante un
gráfico cartesiano con dos
ejes perpendiculares.
En el eje X aparecerían los
valores x de los datos, mientras
que los valores y estarían en el
eje Y.
Tales gráficas se denominan
diagramas de dispersión.
Para determinar la
relación entre la
temperatura que hay al
mediodía (medida en
grados Celsius) y el
número de piezas
defectuosas producidas
dicho día, una
compañía registró los
datos siguientes
correspondientes a 22
días laborables:
Temperatura
24.2
22.7
30.5
28.6
25.5
32.0
28.6
26.5
25.3
26.0
24.4
24.8
20.6
25.1
21.4
23.7
23.9
25.2
27.4
28.3
28.8
26.6
Total
Piezas defectuosas
25
31
36
33
19
24
27
25
16
14
22
23
20
25
25
23
27
30
33
32
35
24
569
Número de piezas defectuosas
40
35
30
25
20
15
10
20.0
25.0
30.0
Temperatura
35.0
Aparte de que representan los
patrones conjuntos de dos variables y
de que nos permiten hacer
predicciones, los diagramas de
dispersión resultan útiles para
detectar outliers, los datos puntuales
que aparentemente no siguen los
patrones de los demás datos.
El tiempo de
espera entre las
erupciones y la
duración de la
erupción del géiser
Old Faithful en el
Parque Nacional
Yellowstone,
Wyoming, EE.UU..
Esta gráfica
sugiere que por lo
general hay dos
"tipos" de
erupciones en
cuanto a la espera:
cortos y largos.
L a sig u ien te tab la n o s m u estra las
calificacio n es d e 1 5 alu m n o s en
d o s ex am en es, el p rim ero es d e
m atem áticas y el seg u n d o d e
co m p ren sió n d e la lectu ra.
Matemáticas
Comprensión de lectura
750
750
700
710
720
700
790
780
700
680
750
700
620
610
640
630
700
710
710
680
540
550
570
600
580
600
790
750
710
720
900
Matemáticas
800
Lectura
750
750
600
700
710
500
720
700
790
780
200
700
680
100
750
700
620
610
640
630
800
700
710
700
710
680
540
550
400
570
600
300
580
600
790
750
710
720
700
400
300
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15
900
600
500
200
100
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15
Matemáticas
Lectura
750
750
700
710
720
700
790
780
700
680
750
700
620
610
640
630
700
710
700
710
680
600
540
550
570
600
300
580
600
200
790
750
710
720
900
800
700
600
500
400
300
200
100
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15
900
800
500
400
100
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Matemáticas Lectura
800
750
700
650
600
550
500
500
550
600
650
700
750
800
750
750
700
710
720
700
790
780
700
680
750
700
620
610
640
630
700
710
710
680
540
550
570
600
580
600
790
750
710
720
Matemáticas Lectura
800
750
700
650
600
550
500
500
550
600
650
700
750
800
750
750
700
710
720
700
790
780
700
680
750
700
620
610
640
630
700
710
710
680
540
550
570
600
580
600
790
750
710
720
A pesar de algunas pequeñas
incongruencias, lectura y
matemáticas tienen una fuerte
relación lineal: personas con altos
niveles de comprensión de lectura
tienden a tener altas calificaciones
en matemáticas y viceversa, y
aquellos con puntuaciones más
bajas en un área tienden a tener
peores puntuaciones en la otra.
Los datos siguientes relacionan el periodo de atención (en
minutos) y la puntuación en un test de inteligencia (IQ) de
18 niños en edad preescolar.
Periodo de
atención
Puntuación IQ
Periodo de
atención
Puntuación IQ
Periodo de
atención
Puntuación IQ
2.0
82
6.3
105
5.5
118
3.0
88
5.4
108
3.6
128
4.4
86
6.6
112
5.4
128
5.2
94
7.0
116
3.8
130
4.9
90
6.5
122
2.7
140
6.1
99
7.2
110
2.2
142
150
140
Puntuación IQ
130
120
110
100
90
80
70
1.0
2.0
3.0
4.0
5.0
Periodo de atención
6.0
7.0
8.0
Descargar

Slide 1