Curso de Estadística Básica
SESION 2
PRESENTACIÓN GRÁFICA DE DATOS
MCC. Manuel Uribe Saldaña
MCC. José Gonzalo Lugo Pérez
Estadística Básica
Objetivo
Aprender cómo presentar y describir conjuntos de
datos
Estadística Básica
Agenda Sesión 2
•
Presentación gráfica
de datos
–
Diagramas de pastel
y gráficas de barras
–
Diagrama de Pareto
–
Gráfica de Puntos
–
Distribución de
frecuencia
–
Histogramas
Estadística Básica
Resultados del examen de
matemáticas…
Calificación: 78
E: ¿Cuál fue la calificación
promedio del examen?
I: el promedio del salón fue de
68
E: ¿cuán próxima del máximo
está mi calificación?
I: las calificaciones variaron de
42 a 87 puntos.
42
68
78
87
Estadística Básica
Resultados del examen de
matemáticas…
Calificación: 78
E: ¿Cómo están distribuidas las
calificaciones?
I: la mitad del grupo obtuvo
calificaciones entre 65 y
75.
Conclusión del estudiante: su
calificación es buena
Estadística Básica
Reflexión…
• Conjunto de datos:
Calificaciones del examen
• Estadísticas descriptivas:
calificación promedio y
calificaciones máxima y
mínima
• Con esta información los
estudiantes pueden obtener
conclusiones sobre su éxito
relativo
Estadística Básica
Estadística descriptiva
Medidas de
tendencia
central
Medidas de
dispersión
Medidas de
posición
Tipos de
distribución
Estadística Básica
Gráficas
• Una vez recolectado los datos de la muestra, es necesario
“familiarizarse” con ellos.
• Aplicar una técnica inicial exploratoria de análisis de datos que
produzca una representación visual.
• Las representaciones visuales revelan patrones de comportamiento
de la variable de estudio.
• Existen muchas formas gráficas (visuales) para describir los datos.
• El método que se aplique es determinado por el tipo de datos y el
concepto a representar.
NOTA: Cuando se elabora una representación gráfica no existe solamente una
respuesta correcta. El juicio del analista y las circunstancias que rodean al
problema desempeñan un papel primordial en el desarrollo de la gráfica.
Estadística Básica
Diagramas de pastel
• Gráficas que se utilizan
para resumir datos de
atributo (cualitativos).
Los diagramas de pastel
muestran la cantidad de
datos que pertenecen a
cada categoría como
una parte proporcional
de un círculo.
Estadística Básica
Ejemplo
En la tabla se muestra el número de casos de cada tipo
de operación realizada en el Hospital General, el año
pasado
Tipo de operación
Torácica
Huesos y articulaciones
Ojos, oídos, nariz y garganta
General
Abdominal
Urológicas
Proctológicas
Neurocirugía
Total
Número de casos
20
45
58
98
115
74
65
23
498
Estadística Básica
Ejemplo
Estos datos se muestran en un diagrama de pastel, donde cada tipo de operación
está representado por una proporción relativa del círculo identificada con un
porcentaje.
Estadística Básica
Diagramas de barras
• Gráficas que se utilizan
para resumir datos de
atributo (cualitativos).
Las gráficas de barras
muestran la cantidad de
datos que pertenecen a
cada categoría como
áreas rectangulares de
tamaño proporcional.
Estadística Básica
Ejemplo
En la figura se presentan los mismos datos sobre el “tipo de operación” en forma de
gráfica de barras
Estadística Básica
Pregunta
• En su opinión, con qué
gráfica, diagrama de
pastel o gráfica de
barras, se obtiene una
mejor representación de
la información?
Estadística Básica
Respuesta
• La gráfica de círculo
facilita la comparación
visual de los tamaños
relativos de las partes
entre sí y el tamaño de
cada parte con respecto
al todo.
Estadística Básica
Diagrama de Pareto
Gráfica de barras con éstas dispuestas de la categoría más numerosa a la
menos numerosa. Incluye una gráfica hecha a base de rectas que muestra
los porcentajes acumulados y la cantidad de datos representada por cada
barra. Es una representación gráfica de los datos obtenidos sobre un
problema, que ayuda a identificar cuáles son los problemas prioritarios que
hay que tratar
Estadística Básica
Ejemplo
Estadísticas de delitos por animadversión cometidos en 1993
4500
120,00%
4000
100,00%
3500
80,00%
2500
60,00%
2000
1500
Porcentaje
Cantidad
3000
40,00%
1000
20,00%
500
0
Cantidad
Porcentaje acumulado
Racial
Religioso
Sexual
Étnico
4168
1189
806
583
61,78%
79,41%
91,36%
100,00%
0,00%
Estadística Básica
Consejos para elaborar y usar los
diagramas de Pareto
• No es conveniente que la categoría de “otros”
represente un porcentaje de los más altos. De ser así,
se debe utilizar un método diferente de clasificación.
• Es preferible representar los datos (si es posible) en
valores monetarios.
• Si un factor se puede solucionar fácilmente debe
afrontarse de inmediato aunque sea de poca
importancia.
• Es imprescindible realizar un diagrama de causas si se
quieren realizar mejoras
Estadística Básica
Ejercicio
1.
Se tienen los datos de una
inspección final de defectos para la
línea de ensamble A12 organizados
en la siguiente tabla:
2.
Representar los datos en un
diagrama de pareto
Defecto
Cantidad
Manchado
56
Rayado
45
Astillado
23
Doblado
12
Abollado
8
Otros
6
Estadística Básica
Pareto de la línea de ensamble A12
60
120,0%
50
100,0%
40
80,0%
30
60,0%
20
40,0%
10
20,0%
0
Cantidad
Porcentaje acumulado
Manchado
Rayado
Astillado
Doblado
Abollado
Otros
56
45
23
12
8
6
37,3%
67,3%
82,7%
90,7%
96,0%
100,0%
0,0%
Estadística Básica
Porcentaje
Cantidad
Defectos del producto
Ejercicio propuesto
Utilizando como herramienta el diagrama de Pareto, analice las pérdidas
por rechazos en una fábrica de papel, teniendo en cuenta que se han
detectado los conceptos que se muestran en la tabla siguiente, en la que
también se indican los costes asociados a cada concepto.
Estadística Básica
Gráficas para datos cuantitativos
• Una razón fundamental para elaborar una gráfica de datos cuantitativos es
mostrar la distribución de éstos.
Distribución
• Patrón de variabilidad mostrado por los datos de una variable. La
distribución muestra la frecuencia de cada valor de la variable.
Estadística Básica
Gráfica de puntos
Presenta los datos de una muestra mediante la representación de cada porción de
datos con un punto ubicado a lo largo de una escala. Esta escala puede ser vertical u
horizontal. La frecuencia de los valores está representada a lo largo de la otra
escala.
19 Calificaciones del examen
3,5
3
Frecuencia
•
2,5
2
1,5
1
0,5
0
0
20
40
60
80
100
120
Calificación
Estadística Básica
Gráfica de puntos
• La gráfica de puntos es una técnica que conviene utilizar al
inicio del análisis de los datos. Esta representación da por
resultado una imagen y una clasificación de los datos en orden
numérico. (Clasificar datos es ordenarlos según el valor
numérico)
Estadística Básica
Ejercicio
Se eligió una muestra aleatoria de 50 estudiantes universitarios. Sus pesos
fueron obtenidos de sus registros médicos. En la siguiente tabla se
muestran los datos resultantes: obtener el diagrama de puntos y una
conclusión
Estudiante
Sexo:
Peso
Estudiante
Sexo:
Peso
Estudiante
Sexo:
Peso
Estudiante
Sexo:
Peso
Estudiante
Sexo:
Peso
Masculino (M)
Femenino (F)
Masculino (M)
Femenino (F)
Masculino (M)
Femenino (F)
Masculino (M)
Femenino (F)
Masculino (M)
Femenino (F)
1
2
3
4
5
6
7
8
9
10
F
98
11
M
150
12
F
108
13
M
158
14
M
162
15
F
112
16
F
118
17
M
167
18
M
170
19
F
120
20
M
177
21
M
186
22
M
191
23
F
128
24
F
135
25
M
195
26
F
137
27
M
205
28
M
190
29
F
120
30
M
188
31
M
176
32
F
118
33
M
168
34
F
115
35
F
115
36
M
162
37
M
157
38
M
154
39
M
148
40
F
101
41
M
143
42
M
145
43
F
108
44
M
155
45
F
110
46
M
154
47
F
116
48
M
161
49
M
165
50
F
142
M
184
F
120
M
170
M
195
F
132
F
129
M
215
M
176
M
183
Estadística Básica
Distribuciones de frecuencia
Los listados de grandes conjuntos de datos no presentan una imagen
valiosa. A veces se desea condensar los datos en una forma más
manejable. Esto puede lograrse con ayuda de una distribución de
frecuencia.
Distribución de frecuencias
Listado, a menudo expresado en forma de diagrama, que asocia cada valor
de una variable con su frecuencia.
Estadística Básica
Ejemplo
Se tiene el siguiente conjunto de datos:
3
4
4
2
2
4
3
1
2
1
2
3
3
2
0
3
2
2
2
1
Si x representa una variable, puede usarse una distribución de frecuencias para
representar este conjunto de datos enumerando los valores x con sus
frecuencias. Por ejemplo, el valor 1 se presenta tres veces en la muestra; por
tanto, la frecuencia de x = 1 es 3.
x
0
1
2
3
4
f
1
3
8
5
3
Estadística Básica
Frecuencia
La frecuencia f es el número de veces que aparece el valor x en la muestra.
La tabla anterior es una distribución de frecuencias no agrupadas,
porque cada valor de x en la distribución permanece solo. Cuando un gran
conjunto de datos tiene muchos valores x distintos, es posible agrupar los
valores en un conjunto de clases y elaborar una distribución de
frecuencias agrupadas.
Estadística Básica
Ejercicio
Forme una distribución de frecuencias no agrupadas de
los datos resultantes: 1, 2, 1, 0, 4, 2, 1, 1, 0, 1, 2, 4
Estadística Básica
Distribución de frecuencias Agrupadas
y No Agrupadas
De un grupo grande se extrajo aleatoriamente una muestra de 19 calificaciones
de un examen:
76
74
82
96
66
76
78
72
52
68
86
Calificaciones
52
62
66
68
72
74
76
78
82
84
86
88
92
96
Total
Frecuencia
1
1
1
1
1
2
3
2
2
1
1
1
1
1
19
84
62
76
78
92
50 o más hasta menos que 60
60 o más hasta menos que 70
70 o más hasta menos que 80
80 o más hasta menos que 90
90 o más hasta menos que 100
82
74
88
Clase
50 ≤ x < 60
60 ≤ x < 70
70 ≤ x < 80
80 ≤ x < 90
90 ≤ x < 100
Total
Frecuencia
1
3
8
5
2
19
Distribución de frecuencias agrupadas
Distribución de frecuencias no agrupadas
Estadística Básica
Distribución de frecuencias Agrupadas
y No Agrupadas
19 Calificaciones del examen
3,5
Frecuencia
3
2,5
2
Distribución de frecuencias no agrupadas
1,5
1
0,5
0
0
20
40
60
80
100
120
Calificación
Frecuencia
19 Calificaciones del examen
9
8
7
6
5
4
3
2
1
0
Distribución de frecuencias agrupadas
0
20
40
60
80
100
120
Calificacion
Estadística Básica
Procedimiento para elaborar una
distribución de frecuencias agrupadas
1. Cada clase debe ser del mismo ancho
2. Las clases deben estar dispuestas de modo que no se
superpongan y que cada porción de información
pertenezca exactamente a una clase
3. La raíz cuadrada de n es un lineamiento razonable
para el número de clases con muestras de menos de
150 datos.
4. Utilizar un sistema que aproveche un patrón numérico,
para garantizar precisión
5. Cuando sea conveniente, un ancho de clase par suele
ser ventajoso
Estadística Básica
Ejemplo
Se considera una muestra de 50 puntajes del examen
final del curso de estadística básica. A continuación se
muestran los puntajes:
60
90
77
58
72
47
77
39
78
86
82
86
90
89
50
95
58
63
44
94
88
64
68
55
92
72
95
97
85
80
67
74
70
82
91
66
72
64
83
75
68
88
70
72
76
98
74
70
77
78
Estadística Básica
Procedimiento
1.
Identifique los puntajes máximo y mínimo y determine el rango.
Máx = 98, Mín = 39.
Rango = Máx – Mín = 98 – 39 = 59
2.
Elija un número de clases m y un ancho de clase c de modo que el
producto mc sea ligeramente mayor que el rango
m = raíz cuadrada de n = 50
m=7
c = 10
mc = 70 Es mayor que el rango = 59
Estadística Básica
Procedimiento
3.
Elija un punto inicial, que debe ser algo menor que el puntaje más
bajo (min). Posteriormente se cuenta a partir de ahí en
incrementos del ancho de clase. Cada número obtenido se
denomina límites de clase.
35 ≤ x < 45
45 ≤ x < 55
55 ≤ x < 65
65 ≤ x < 75
75 ≤ x < 85
85 ≤ x < 95
95 ≤ x < 105
Estadística Básica
Procedimiento
4.
Una vez establecidas las clases, es necesario clasificar los datos
en dichas clases. El método utilizado para realizar la clasificación
depende del formato actual de los datos: si los datos están
ordenados, es posible contar las frecuencias; si los datos no están
ordenados, se efectúa un conteo de éstos para determinar los
números de frecuencia. Cuando se efectúa la clasificación de los
datos, es de utilidad usar un diagrama estándar.
Número de clases
Límites
1
35 ≤ x < 45
2
45 ≤ x < 55
3
55 ≤ x < 65
4
65 ≤ x < 75
5
75 ≤ x < 85
6
85 ≤ x < 95
7
95 ≤ x < 105
Frecuencia
2
2
7
13
11
11
4
50
Estadística Básica
Notas
1. Si se han ordenado los datos (en forma de lista, gráfica
de puntos o representación de tallo y hojas) el conteo
es innecesario; simplemente se cuentan los datos que
pertenecen a cada clase.
2. Si los datos no están ordenados, debe tenerse cuidado
al efectuar el conteo.
3. La frecuencia f para cada clase es el número de datos
que pertenecen a esa clase.
4. La suma de frecuencias debe ser exactamente igual al
número de datos n (n = Σf). Esta sumatoria es una
verificación aceptable.
Estadística Básica
Notas
5.
Cada clase requiere un solo valor numérico para representar todos
los valores de datos que caen en esa clase. La marca de clase
(algunas veces denominada punto medio de clase) es el valor
numérico que está exactamente a la mitad de ésta y se encuentra
al sumar los límites de clase y dividirlo entre 2.
Número de clases
Límites
1
35 ≤ x < 45
2
45 ≤ x < 55
3
55 ≤ x < 65
4
65 ≤ x < 75
5
75 ≤ x < 85
6
85 ≤ x < 95
7
95 ≤ x < 105
Frecuencia
2
2
7
13
11
11
4
50
Marca de clase
40
50
60
70
80
90
100
Estadística Básica
Histograma
Gráfica de barras que representa una distribución
de frecuencias de una variable cuantitativa. Un
histograma está integrado por los siguientes
componentes:
1. Un título, que identifica la población o la muestra de interés
2. Una escala vertical, que identifica las frecuencias que hay
en las diversas clases
3. Una escala horizontal, que identifica la variable x. Los
valores de los límites de una clase de las marcas de clase
deben identificarse a lo largo del eje x. El empleo de
cualquier método para identificar el eje presenta mejor a la
variable.
Estadística Básica
Ejemplo
50 puntajes del examen final de estadística básica
14
Frecuencia
12
10
8
6
4
2
0
40
50
60
70
80
90
100
Puntaje
Estadística Básica
Forma de los histogramas
Simétrico, normal o triangular
Sesgado a la izquierda
Uniforme o rectangular
En forma de J
Sesgado a la derecha
Bimodal
Estadística Básica
Descargar

Estadistica Basica Sesion 2