DISTRIBUCIONES DE FRECUENCIAS
UNIDIMENSIONALES
Introducción
• La estadística busca obtener conclusiones sobre
una población a partir de datos muestrales
(inferencia)
• Para ello es necesario ordenar previamente los
datos de la variable de interés, X (altura, renta, …)
• El proceso de organizar, condensar y sintetizar la
información estadística, recibe el nombre de
tabulación
• La tabulación consiste en ordenar de menor a mayor
los datos de la variable objeto de estudio agrupando
valores y contanto del nº de veces que se repiten
Introducción
• La tabla resultante recibe el nombre de
distribución de frecuencias unidimensional
• Por ejemplo, en una CV viven 20 familias. Se ha
preguntado el número de personas que trabajan
en cada familia, obteniéndose,
1
0
2
4
1
3
2
0
1
1
1
2
1
1
0
0
1
1
1
2
Distribuciones de frecuencias
• Podemos sintetizar la información en la tabla,
xi
ni
Ni
fi
Fi
0
4
4
4/20
4/20
1
10
14
10/20
14/20
2
4
18
4/20
18/20
3
1
19
1/20
19/20
4
1
20
1/20
20/20
20
1
xi: valores que toma la variable X N: total de observaciones
ni: frecuencia absoluta
fi: frecuencia relativa
Ni: frecuencia absoluta acumulada Fi: frecuencia relativa acumulada
Distribuciones de frecuencias
• Podemos sintetizar la información en la tabla,
xi
ni
Ni
fi
Fi
0
4
4
4/20
4/20
1
10
14
10/20
14/20
2
4
18
4/20
18/20
3
1
19
1/20
19/20
4
1
20
1/20
20/20
20
1
N: total de observaciones,
k
N   ni
i 1
Distribuciones de frecuencias
• Podemos sintetizar la información en la tabla,
xi
ni
Ni
fi
Fi
0
4
4
4/20
4/20
1
10
14
10/20
14/20
2
4
18
4/20
18/20
3
1
19
1/20
19/20
4
1
20
1/20
20/20
20
1
ni: frecuencia absoluta: número de veces que se repite una
observación
Distribuciones de frecuencias
• Podemos sintetizar la información en la tabla,
xi
ni
Ni
fi
Fi
0
4
4
4/20
4/20
1
10
14
10/20
14/20
2
4
18
4/20
18/20
3
1
19
1/20
19/20
4
1
20
1/20
20/20
20
1
Ni: frecuencia absoluta acumulada: suma de la frecuencia
absoluta del dato, más todas las frecuencias absolutas
anteriores
Distribuciones de frecuencias
• Podemos sintetizar la información en la tabla,
xi
ni
Ni
fi
Fi
0
4
4
4/20
4/20
1
10
14
10/20
14/20
2
4
18
4/20
18/20
3
1
19
1/20
19/20
4
1
20
1/20
20/20
20
1
fi: frecuencia relativa: cociente entre la frecuencia absoluta
y el número total de observaciones: fi = ni /N.
k
Debe cumplirse: 
fi  1
i 1
Distribuciones de frecuencias
• Podemos sintetizar la información en la tabla,
xi
ni
Ni
fi
Fi
0
4
4
4/20
4/20
1
10
14
10/20
14/20
2
4
18
4/20
18/20
3
1
19
1/20
19/20
4
1
20
1/20
20/20
20
1
Fi: frecuencia relativa acumulada: cociente entre la
frecuencia absoluta acumulada y el número total de
observaciones: Fi = Ni /N. O suma de la fi del dato más
todas las fi anteriores
Distribuciones de frecuencias
• La tabla anterior es un ejemplo de distribución
de frecuencias con datos no agrupados
• Un caso particular es aquel en el que ni = 1
• En una distribución de frecuencias con datos
agrupados, los valores de X es agrupan en
intervalos.
• La agrupación conlleva pérdida de información
pero a cambio, se gana en facilidad de cálculo
Distribuciones de frecuencias
• Por ejemplo, las recaudaciones de un comercio
durante los 25 días laborales de un mes
determinado, fueron:
16500
10050
12320
10000
22450
7325
13800
18300
14600
25000
17085
19000
11900
13760
15075
20210
7280
21200
23090
24500
15800
5000
13050
21600
17700
Distribuciones de frecuencias
• Esta información podría agruparse en la tabla:
Intervalos
ni
Ni
fi
Fi
[5000, 9000)
3
3
3/25
3/25
[9000,13000)
4
7
4/25
7/25
[13000, 17000)
7
14
7/25
14/25
[17000, 21000)
5
19
5/25
19/25
[21000, 25000)
6
25
6/25
25/25
• Los intervalos quedan definidos por sus límites:
• Li-1: límite inferior, Li: límite superior
Distribuciones de frecuencias
• Se definen los siguientes conceptos:
– Límites: extremos que acotan cada intervalo (Li-1, Li)
– Amplitud de los intervalos: ai = LiLi-1. La amplitud
del intervalo puede ser constante (como en el
ejemplo) o variable.
– Marca de clase: para operar necesitamos un valor
representativo de cada intervalo. Para ello se usa la
marca de clase, que es el punto medio de cada
intervalo:
xi 
Li  Li 1
2
Distribuciones de frecuencias
• La tabla anterior quedaría:
Intervalos
xi
ni
Ni
fi
Fi
[5000, 9000)
7000
3
3
3/25
3/25
[9000,13000)
11000
4
7
4/25
7/25
[13000, 17000)
15000
7
14
7/25
14/25
[17000, 21000)
19000
5
19
5/25
19/25
[21000, 25000]
23000
6
25
6/25
25/25
Distribuciones de frecuencias
• Para elegir la amplitud de los intervalos se suele
seguir el siguiente criterio:
– Determinación del rango o recorrido de la distribución
o diferencia entre el valor máximo y el mínimo: R =
25000-5000=20000
– Se divide el rango entre el número de intervalos
deseados (arbitrario). Por ejemplo, para k=5 se
obtendría a = 20000/5 = 4000
– Partiendo del valor mínimo, se van construyendo los
extremos …
Distribuciones de frecuencias
• La tabla anterior con k = 8 quedaría:
Intervalos
[5000, 7500)
[7500, 10000)
[10000, 12500)
[12500, 15000)
[15000, 17500)
[17500, 20000)
[20000, 22500)
[22500, 25000)
xi
ni
Ni
fi
Fi
Distribuciones de frecuencias
• La tabla anterior con k = 8 quedaría:
Intervalos
xi
ni
Ni
fi
Fi
[5000, 7500)
6250
3
3
3/25
3/25
[7500, 10000)
8750
0
3
0/25
3/25
[10000, 12500)
11250
4
7
4/25
7/25
[12500, 15000)
13750
4
11
4/25
11/25
[15000, 17500)
16250
4
15
4/25
15/25
[17500, 20000)
18750
3
18
3/25
18/25
[20000, 22500)
21250
3
21
3/25
21/25
[22500, 25000)
23750
4
25
4/25
25/25
Representación gráfica
• Diagramas de barras: datos sin agrupar; variables
discretas. En abcisas representamos cada valor de X y
en ordenadas una barra de altura igual a ni (fi)
Representación gráfica
• Histograma: es un tipo especial de diagrama de barras
para datos agrupados.
• Las barras aparecen pegadas
• La base de cada barra es igual a la amplitud del intervalo
• La altura es,
– Si los intervalos son de la mima amplitud: igual a la frecuencia
absoluta (relativa) de dicho intervalo
– Si tienen amplitudes diferentes: Se emplea la fórmula
hi = ni /ai
Representación gráfica
• Diagrama de sectores: se representan los datos como
sectores de un círculo.
• El área de cada uno de los sectores es proporcional a la
frecuencia absoluta o relativa del valor.
• Suele emplearse con atributos
• Por ejemplo, en una muestra de 100 personas adultas
hay 50 casados, 15 viudos, 25 solteros y 10 divorciados,
Representación gráfica
• Por ejemplo, en una muestra de 100 personas adultas
hay 50 casados, 15 viudos, 25 solteros y 10 divorciados,
Representación gráfica
• Diagrama de tallo y hojas:
• De cada dato se separa el último dígito (el de la derecha)
que constituye la hoja del resto del bloque de cifras, que
forma el tallo.
• Tallos y hojas se ordenan de menor a mayor
Descargar

DISTRIBUCIONES UNIDIMENSIONALES