Unidad
ESTADÍSTICA
DESCRIPTIVA
80.33%
19.67%
Tasa de
SIDA
por millón
hab. (2002)
46.7
1
La Estadística se utiliza como tecnología al
servicio de las ciencias donde la
variabilidad y la incertidumbre forman parte
de su naturaleza.
La Estadística es la Ciencia de la
• Sistematización,
recolección,
ordenación
y
presentación de los datos referentes a un fenómeno que
presenta variabilidad o incertidumbre para su estudio
metódico, con objeto de
• deducir las leyes que rigen esos fenómenos,
• y poder de esa forma hacer previsiones sobre los
mismos, tomar decisiones u obtener conclusiones.
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
2
ESTADÍSTICA DESCRIPTIVA
Se ocupa de la sistematización, recolección,
ordenación y presentación de los datos referentes a un
fenómeno que presenta variabilidad o incertidumbre para
su estudio metódico, de forma que la información
contenida en esos datos sea fácilmente aprehensible.
A través de…
 Descripciones tabulares
Género
Frec
Hombre
4
Mujer
6
7
 Descripciones gráficas
# de alumnos
6
5
4
3
2
1
0
35
67
79
80
83
84
85
87
88
89
90
94
95
97
98
99 100
Calificaciones
 Descripciones numéricas
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
n
Varianza
(S ) 
2
 (x
i
 X)
2
i 1
n 1
3
Método científico y estadística
Plantear
hipótesis
Diseñar
experimento
Obtener
conclusiones
Recoger datos
y analizarlos
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
4
 OBJETIVO EDUCACIONAL DE LA UNIDAD 1
 En el desarrollo de la presente unidad, el estudiante
analizará conjuntos de datos tomados de una
situación real o simulada, haciendo síntesis de ellos,
mediante descripciones numéricas, tabulares y/o
gráficas.
 ACTIVIDADES DE APRENDIZAJE
 Hacer cálculos usando la notación sumatoria
 Calcular medidas de tendencia central y de dispersión
tanto para datos no-agrupados como para datos
agrupados
 Construir distribuciones de frecuencias
 Realizar gráficas de barras, de pastel, polígono de
frecuencia, pictogramas, etc.
 Interpretar los resultados que obtenga en sus
ejercicios
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
5
TEMAS DE LA UNIDAD 1
Introducción (conceptos)
Notación sumatoria
Datos no agrupados (enlistados)
Medidas de tendencia central
Medidas de dispersión
Datos agrupados
Construir tablas de frecuencias
Descripciones numéricas (tend central y dispersión)
Métodos gráficos
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
6
POBLACIÓN Y MUESTRA
 Población. Es el conjunto sobre el que estamos
interesados en obtener conclusiones (hacer
inferencia).
 Normalmente es demasiado grande para poder
abarcarlo.
 Muestra. Es un subconjunto suyo al que tenemos
acceso y sobre el que realmente hacemos las
observaciones (mediciones).
 Debería ser “representativa” (¡si se obtiene
correctamente!)
 Está formado por miembros “seleccionados” de
la población (individuos, unidades
experimentales).
 La muestra es menos costosa que el censo, es
más precisa y más ágil.
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
7
CONCEPTO DE VARIABLE
 Una variable es una característica observable que
varía entre los diferentes individuos de una
población. La información que disponemos de
cada individuo es resumida en variables.
 Relacionado
con
el
concepto
anterior,
posteriormente veremos una definición formal
de variable aleatoria en términos del concepto
de función. Por el momento es conveniente
entender por variable, lo que se ha escrito arriba.
 Otro aspecto importante es conocer la
tipología de las variables, que se
encuentra en las siguientes dos
diapositivas.
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
8
TIPOS DE VARIABLES
 Cualitativas
Si sus valores no se pueden asociar naturalmente a un número (no se
pueden hacer operaciones algebraicas con ellos)
 Nominales: Si sus valores no se pueden ordenar
 Sexo (H/M), Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)
 Ordinales: Si sus valores se pueden ordenar
 Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor
 Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones
algebraicas con ellos)
 Discretas: Si toma valores enteros
 Número de hijos, Número de cigarrillos, Num. de “cumpleaños”
 Continuas: Si entre dos valores, son posibles infinitos valores intermedios.
 Altura, Presión intraocular, Dosis de medicamento administrado, edad
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
9
EJEMPLOS DE VARIABLES
Si seleccionamos a un grupo de integrantes de la comunidad
tecnológica, podemos observar que de un individuo a otro es variable:
El grupo sanguíneo
 {A, B, AB, O}  Var. Cualitativa
Su nivel de felicidad “declarado”
 {Deprimido, Ni fu ni fa, Muy Feliz}  Var. Ordinal
El número de hijos
 {0,1,2,3,...}  Var. Numérica discreta
La estatura
 {1.62, 1.74, ...}  Var. Numérica continua
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
10
NOTACIÓN SUMATORIA
De la notación sumatoria, estudiaremos…
El significado del símbolo  (sigma
mayúscula)
Extremos inferior y superior de 
Modalidades en la representación de
una sumatoria
Propiedades de la notación sumatoria
Información complementaria y ejemplos
Alerta: casos confusos más comunes
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
11
SIGNIFICADO DE 
b
x
ia
i
 xa + xa +1 + xa + 2 + K + xb 1 + xb
Significa que se suman los valores que representan las xi
desde i = a hasta i = b.
a
es el extremo inferior de la sumatoria. Nos indica que el
primer valor de la sumatoria es el de xa
b
STOP! Es el extremo superior de la sumatoria. El valor de
xb es el último que se suma.
i
es el índice de sumatoria. Las letras que usualmente se
emplean para representar el índice de sumatoria son i, j,
Unidad 1: Estadística Descriptiva.
12
k, h, l.
Arturo A. Alvarado S. (ITSY 2006)
EJEMPLO
Individuo
Valor de la Observación
1
3
2
5
3
2
4
7
5
9
6
6
7
2
8 9
8 5
Si el valor del primer dato es representado por x1, el
segundo valor por x2, así enseguida, hasta que el
valor del noveno dato por x9, tenemos que:
x1  3 , x 2  5 , x3  2 , x 4  7 , x5  9 , x 6  6 , x 7  2 , x8  8 y x9  5
Observe que en este caso, tenemos nueve valores: uno
para cada individuo. El individuo podría ser un jefe de
familia a quien se le registra el número de hijos que tiene
(valor de la ‘variable’)
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
13
EJEMPLO
Individuo
Valor de la Observación
1
3
2
5
3
2
4
7
5
9
6
6
7
2
8 9
8 5
Con los datos del cuadro anterior, usando la
notación sumatoria podemos escribir:
7
x
i
 x3 + x 4 + x5 + x6 + x7
i3
.........  2 + 7 + 9 + 6 + 2  26
Esto es, sumamos los números de hijos que tienen los
jefes de familia, desde el tercero (extremo inferior es 3)
hasta el séptimo (extremo superior es 7).
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
14
EJEMPLO
Individuo
Valor de la Observación
1
3
2
5
3
2
4
7
5
9
6
6
7
2
8 9
8 5
Usando los mismos datos, tenemos:
6
x
2
i
 x + x +K + x
2
1
2
2
2
6
i 1
= 32 + 52 + 22 + 72 + 92 +62
=
En palabras, la sumatoria desde 1 hasta 6, de
los cuadrados de las xi.
Repase los ejercicios de la Actividad de aprendizaje 1, sugerida en
el salón. Si tiene dudas, plantéelas en la sesión siguiente.
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
15
DATOS NO AGRUPADOS
Media aritmética
Medidas de
tendencia central
Mediana
Moda
Percentiles
(posición)
Rango (amplitud)
Medidas de
dispersión
Rango intercuartílico
Varianza
Coef. de variación
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
16
MEDIDAS DE TENDENCIA CENTRAL
Media aritmética
x 
-
Actúa como centro geométrico
-
Funciona como una balanza
-
Es influida por valores atípicos
Mediana
-
x
i
n
 (x
i
 x) 
x
i
nx
=0
Valor de forma que si se ordenan los datos, la mitad
son menores y la otra mitad mayores
fr ( x  x a )  0 ,5 y
Sólo tiene en cuenta la
fr ( x  x b )  0 ,5
ordenación de los datos
Moda
Percentiles
Es el valor más frecuente
Lea en la siguiente diapositiva
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
17
MEDIDAS DE TENDENCIA CENTRAL
Percentiles
Si una serie de datos se colocan en orden de magnitud, el valor
medio (o la media aritmética de los dos valores medios) que divide
el conjunto de datos en dos partes iguales es la mediana. Por
extensión, de esta idea se puede pensar en aquellos valores que
dividen a los datos en cuatro partes iguales. Estos valores,
representados por Q1, Q2 y Q3 se llaman primero, segundo y tercer
cuartil, respectivamente; el valor de Q2 es igual al de la mediana.
Análogamente los valores que dividen los datos en diez partes
iguales se llaman deciles y se representan por D1, D2,..., D9,
mientras que los valores que dividen los datos en cien partes
iguales se llaman percentiles y se representan por P1, P2, …, P99.
El quinto decil y el quincuagésimo percentil, se corresponden con la
mediana. Los percentiles P25 y P75 se corresponden con el primer y
tercer cuartil respectivamente
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
18
MEDIDAS DE DISPERSIÓN
n
Varianza
(S ) 
S 
2
2
S
CV 
 (x
i
 X)
2
i 1
n 1
S
X
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
19
EJERCICIO (para datos no-agrupados)
En una empresa con 60 empleados, 25 son personal de fábrica y están
cobrando unos sueldos semanales ordenados de menor a mayor de:
240, 241, 250, 266, 293, 294, 295, 296, 298, 299, 300, 300, 310, 311, 314,
315, 316, 316, 317, 317, 318, 318, 340, 345, 360.
La media del personal de fábrica es 302.76 y la desviación estándar 28.48.
El resto del personal trabaja en oficina y tiene un sueldo medio de
$336.57 por semana y una desviación estándar de $50.
a) Calcular el sueldo medio por semana de todo el personal.
b) Supongamos que se dobla el sueldo a todos los empleados y a
continuación, por la excesiva subida, se decide quitarles $275 por semana.
Calcular las nuevas medias y desviaciones estándar del sueldo semanal
correspondientes al personal de fábrica y de oficina.
c) Calcula la mediana del sueldo por semana del personal de fábrica
antes y después del cambio.
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
20
[email protected]
Gracias
Vea la segunda
parte depor
estas su
diapositivas…
atención
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
21