Distribución de los datos
Representación gráfica de la distribución: Histograma
 Representa el valor de la frecuencia de aparición de un
determinado valor.
 Sirve para analizar la distribución estadística de los datos.
 Hace uso de datos estadísticos básicos como la media o la
desviación típica.
 Normalmente, su estudio constituye el primer paso para
producir un mapa temático.
Uniforme
Frecuencia

Valor
Normal
Exponencial
Ejemplo de Histograma
Métodos de Distribución de los datos
1. Intervalos Iguales




Cada clase tiene un rango igual
de valores.
La diferencia entre el mayor y
el menor de los valores se
divide entre el número de
categorías.

(Mayor-Menor)/Categorías
Fácil de interpretar.
Es bueno para las
distribuciones uniformes y
datos continuos.
Inadecuado si los datos están
concentrados en unos pocos
valores.
C1
C2
C3
C4
Frecuencia

Menor
Valor
Mayor
Intervalos Iguales
Métodos de Distribución de los datos
3. Igual Área


Las clases se dividen para tener un
área similar para cada una de ellas.
Es muy similar que los cuartiles si el
superficie de cada elementos es
similar.
C2
C3
C4
n(C4)

C1
n(C3)

n(C2)

Número igual de observaciones para
cada categoría.
n(C1) = n(C2) = n(C3) = n(C4).
Adecuado para datos uniformemente
distribuidos.
Elementos con valores muy similares
pueden acabar en categorías
diferentes.
n(C1)

Frecuencia
2. Cuartiles
Valor
Cuartiles
Igual Área
Métodos de Distribución de los datos
4. Desviación Estándar




La Media (X) y la desviación
estándar (STD) se utilizan
para determinar los puntos de
corte.
Es adecuado cuando la
distribución de los datos es
normal.
Muestra los elementos que
están por debajo y por arriba
de la media.
Se muestran los elementos
que son muy diferentes de la
media
No muestra los valores de los
atributos, sólo su distancia
respecto del valor promedio.
C1
C2
C3
C4
Frecuencia

Valor
-1STD X +1STD
Desviación Estándar
Métodos de Distribución de los datos
5. Progresión aritmética o
geométrica

Aumenta la anchura de los
intervalos de las clases de
una forma no lineal.
Es adecuado para las
distribuciones exponenciales.
C1
C2
Frecuencia

Valor
C3 C4
Progresión Geométrica
Métodos de Distribución de los datos
6. Límites naturales




Método de optimización complejo.
Minimiza la suma de la variación
de cada clase.
Adecuado para datos que no se
distribuyen uniformemente.
Difícil de comparar con otras
clasificaciones.
Difícil de escoger el número
idóneo de clases.
C1
C2
Frecuencia

Valor
C3 C4
Límites Naturales
Descargar

GEOG 60 Introduction to Geographic Information Systems