•
•
•
•
Al hacer
Un sondeo de opinión
El control de calidad de un artículo
Un estudio para conocer la efectividad de un
medicamento
• Calcular la composición futura de una población
• .... Estamos haciendo
Estadística
Tipos de Estadística
• La Estadística descriptiva o deductiva:
– Trata del recuento, ordenación y clasificación de los
datos obtenidos de las observaciones:
• Construcción de tablas, gráficos y cálculo de parámetros.
• La Estadística inferencial o inductiva:
– Utiliza los resultados de la estadística descriptiva y se
apoya en el cálculo de probabilidades para la obtención
de conclusiones sobre una población a partir de los
resultados obtenidos de una muestra.
Población, muestra y variable estadística
Población: Conjunto de elementos que se quiere estudiar.
• Habitantes de una ciudad.
• Televisores fabricados en una factoría.
•Alumnos de primero de bachillerato.
Muestra: Cualquier subconjunto de una población. El número de
elementos de una muestra se llama tamaño.
Variable estadística: Cada uno de los rasgos o características que
se quiere estudiar de los elementos de la población, susceptible o no
de medida.
• Color del pelo: negro, castaño, rubio o pelirrojo
• Sexo: hombre o mujer
• Miembros asalariados de una familia: 0, 1 , 2 , 3 ,4 , 5
• Alturas de alumnos:178, 169, 172, 183, …
Variables cualitativas y cuantitativas
Población: Alumnos de bachillerato de una localidad determinada
 Cualitativ as

 (modalidad)



Variables 

 Cuantitati vas

 (números)

•Sexo
•Modelo de zapatillas deportivas
•Barrio de la localidad en que vive
•Deporte preferido
 Discretas
 (Recuentos)




 Continuas
(Cualquier
cantidad en
un intervalo)
•Número de hermanos
•Núm.de suspensos en la 1ª evaluación
•Núm de libros leídos trimestralmente
•Num. de llamadas telefónicas diarias
•Tiempo diario delante del televisor
•Tiempo de estudio
•Altura
•Peso
•Tiempo empleado en llamadas
Variables cualitativas: Distribución de frecuencias
Preferencias musicales de 120 alumnos
Música
Clásica
Rock
Pop
Jazz
Flamenco
Techno
Sumas
Frecuencias
absolutas
fi
1
36
49
4
2
28
120
Propiedades:
Frecuencias
relativas
hi
0,008
0,300
0,408
0,033
0,017
0,233
1
Clase modal o moda
Frecuencia absoluta del valor xi:
Número de veces que se repite.
Se representa por fi.
Frecuencia relativa del valor xi:
Cociente entre la frecuencia
absoluta de xi y el número total de
datos de la distribución.
Se representa por hi.
Las frecuencias absolutas fi , i= 1,..., r, verifican:
I ni  0
II n1 + n2 + n3 + ... + nr = N
Las frecuencias relativas hi, i= 1,..., r, verifican:
I hi  0
II h1 + h2 + h3 + ... + hr = 1
Variables cualitativas: Representación gráfica
Sabores de refrescos preferidos por 50 personas
Clases
Refrescos
Frecuencias
absolutas: fi
Frecuencias
relativas: hi
Naranja
Limón
Piña
Manzana
Sumas
18
12
10
10
50
0,36
0,24
0,20
0,20
1
Sabores de refescos
20
18
Manzana
20%
Frecuencias
16
14
Naranja
36%
12
10
8
Limón
Piña
Piña
20%
6
Naranja
Manzana
4
Limón
24%
2
0
Naranja
Limón
Piña
Manzana
Diagrama de Barras
Diagrama de Sectores
Nº de alumnos (Frec. Abs. acumuladas)
Número de alumnos (Frec. absolutas)
Frecuencias
Frecuencias
absolutas
absolutas
acumuladas
Variables
cuantitativas
discretas:
Diagrama
Diagrama
dedebarras
barrasy ypolígono
polígono
dede Distribución de frecuencias
frecuencias
frecuencias
Abs.
Frec. Abs. las
Frec.
Relat.
Frec. Relat.
Notas Frec.
Un
profesor
tiene
anotadas
en
su
cuaderno
notas
Tabla
de Frecuencias
8
Acumuladas
Acumuladas
35
de
30
alumnos
de
un
clase:
xi
fi
Fi
hi
Hi
7
6
5
4
3
2
1
0
0
30
5
9
9
1
8
25
20
15
10
5
0
1
02
1 3
3
8
8
5
8
0
2
4
2
7
3
47
5
9
6
78
3
8
7
5
1
1
6
1
1 7
3
9
2
5 9
1
9
2 4 3 5 4 6 5 7 6 8 7 9
Suma
Notas de alumnos
Notas de alumnos
8
9
30
2
0,07
0,07
0,10
0,17
0,03
0,20
0,03
0,23
0,03
0,27
0,10
0,37
0,07
0,43
0,17
0,60
25
0,23
0,83
30
0,17
1,00
25
6
67
18
11
813
518
8
7
0
0
7
1
Frecuencia relativa
absolutaacumulada
acumuladade
dexxi:
Suma deentre
las frecuencias
la
i: Cociente
absoluta deabsoluta
frecuencia
todos losacumulada
valores anteriores
de xi y ela número
xi más latotal
frecuencia
de datos:
absoluta de xi: H
Fii=f
=1F+fi/N
h1+h21+h3+…+hi
2+f=
3+…+f
Agrupación de datos
•
Si la variable es continua, o discreta con un número de datos muy grande, es aconsejable
agrupar los datos en CLASES.
•
¿Cuál es el número idóneo de clases?
–
•
El número clases debe ser aproximadamente igual a la raíz cuadrada positiva del número de datos.
¿Cómo escoger las clases?
–
Es aconsejable que los límites de clase (tanto el superior como el inferior) sean números “redondos”,
como múltiplos de 5, 10, …
–
Se debe procurar que todas las clases tengan la misma amplitud o tamaño.
–
Los intervalos se deben construir de modo que el límite superior de una clase coincida con el límite
inferior de la siguiente.
–
Adoptaremos el criterio de que los intervalos sean cerrados por la izquierda y abiertos por la derecha.
Variables cuantitativas discretas: Datos agrupados
Histograma
Nº de pacientes
Los histogramas se utilizan
Clases
Marcas
Fi
hi
Hi a lo
14
Como
36 datos,
de
clases
quefi debemos
Lashay
edades
de el
lasnúmero
personas
que
acuden
al
logopeda
generalmente
para
de clase
12
formar
puede
ser
aproximadamente
lo0,36 0,36
largo
de
mes
son: [0,5) 6.2,5Si el13intervalo
distribuciones
de un
variable
13
extendemos
desde
0gran
hasta 30, al10dividir por 6 se tiene
continua
o3discreta
con
7,5
2 de 11
13 [5,10)
48 ser
35. 112 244 0,315 0,676
que
la
amplitud
cada
clase
debe
número de datos y que se han [10,15) 12,5
6
30
0,17
0,83
6
7
3
4
5
3
2
5
6
27
15
agrupado en clases.
[15,20)
17,5
2
32
0,06
0,89
4
4
21
12
4
3
6
29
13
6
17
Si los intervalos no son de
[20,25)
22.5
1
33
0,03
0,92
2
6
13altura
6 de los
5 [25,30)
12
26 3
igual amplitud,
la
27,5
36
0,08
1
0
0
5
10
15
20
25
30
rectángulos deben calcularse
Edades
0
15
20
30
5 36 10
Sumas
1 25
teniendo en cuenta que sus
Los rectángulos tienen como base
áreas sean proporcionales a la
la longitud de los intervalos y
frecuencia de cada intervalo.
como altura la frecuencia absoluta
de cada intervalo
Variables cuantitativas: Medidas de posición
Media aritmética: Valor tal que si todos los N valores de la
variable tomaran dicho valor, sumarían lo mismo que suman
efectivamente. Se obtiene dividiendo la suma de todos los
valores de la variable entre el número de valores.
N
Media aritmética
x 
x 1  x 2  x 3  x 4  ...  x N  1  x N


N
N
Si conocemos la frecuencia de cada uno de los datos:
Media aritmética
x 
r
x1 .n1  x 2 .n 2  x 3 .n 3  ...  x r .n r
N
i 1


x i .n i
i 1
N
xi
Las calificaciones en la asignatura de historia de los 40 alumnos
de una clase viene dada por la tabla:
Calificaciones
1
2
3
4
5
6
7
8
9
Nº de alumnos
2
2
4
5
8
9
3
4
3
Hoja de cálculo
Se ha aplicado un test sobre satisfacción en el trabajo a 88
empleados de una fábrica, obteniéndose las resultados:
Puntuaciones
Núm. de trabajadores
[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)
7
8
15
25
18
9
6
Hoja de cálculo
Variables cuantitativas: Medidas de posición
Moda: Se llama moda de una variable estadística al valor de
dicha variable que presenta mayor frecuencia absoluta. Se
representa por Mo.
En el caso de datos agrupados en intervalos, es fácil determinar
la clase modal (clase con mayor frecuencia), pero el valor
dentro del intervalo se obtiene mediante la expresión:
M o  L i  c.
D1
D1  D 2
Li = Límite inferior de la clase modal
C = amplitud de los intervalos
D1 = Diferencia entre la frecuencia
absoluta de la clase modal y la
frecuencia absoluta de la clase
anterior.
D2 = Diferencia entre la frecuencia
absoluta de la clase modal y la
frecuencia absoluta de la clase
siguiente.
Cálculo de la moda
D2
D1
x

cx
D1
D2
x  D 2  c  D1  x  D1
x  ( D 2  D1 )  c  D1
Mo
Li
x
c-x
c
x  c
D1
D1  D 2
Variables cuantitativas: Medidas de posición
Mediana: Se llama mediana de una variable estadística a un
valor de la variable, tal que el número de observaciones
menores que él es igual al número de observaciones mayores
que él. Se representa por M.
Cálculo
de la mediana
Datos agrupados:
VariableSe
estadística
construyediscreta
la tabla de frecuencias acumuladas. La
mediana es el primer valor de la variable cuya
Datos simples:
frecuencia
acumulada
excede
a la mitad
de
Si
el nº de datos
es impar,
el valor
centraldel
de número
la variable
datos.
es
único.
Cuando
la mitad
delpar,
número
de dos
datos
coincida
con la
Si
el nº de
datos es
existen
términos
centrales.
frecuencia
acumulada
valor, la semisuma
mediana esdela
Se
toma como
valor dede
la un
mediana
semisuma
entre ese valor y el siguiente de la tabla.
estos
dos valores.
Ejemplos
Cálculo de la mediana (II)
Variable estadística continua o discreta con datos agrupados
en intervalos
Para determinar la clase mediana se procede del mismo modo
que en el caso de variables discretas con datos no agrupados en
intervalos.
Para determinar el valor concreto de la variable que deja a su
izquierda igual número de datos que a su derecha, aplicamos la
fórmula:
N
M  L i  c. 2
 Fi 1
fi
Li = Límite inferior de la clase modal
c = amplitud de los intervalos
N = Número total de datos
Fi-1 = Frecuencia absoluta acumulada
de la clase anterior a la clase
mediana.
Fi = frecuencia absoluta de la clase
mediana.
Test sobre satisfacción en el trabajo: N=88
Clases
fi
Fi
[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)
7
8
15
25
18
9
6
7
15
30 < 44
55 > 44
73
82
88
Aplicando la fórmula:
Li = 56
c=6
44  30
M  56  6 
N/2 = 44
25
Fi-1 = 30
fi = 25
Clase mediana:
[56-62)
25

14
6
x
25
14
x
56
 59 . 36
x  6
6
14
62
 3 . 36
25
M=56+3.36=59.36
Método gráfico para el cálculo de la mediana
1.
2.
Representamos el histograma de frecuencias acumuladas porcentuales
Trazamos el polígono de frecuencias acumuladas, uniendo los vértices superiores
derechos de los rectángulos del histograma.
Sobre el polígono determinamos el valor de la variable que corresponde a una frecuencia
acumulada del 50%.
3.
50
M
Variables cuantitativas: Medidas de posición
Cuantiles: La mediana divide los datos de la distribución en dos
partes iguales.
Podemos estudiar otros parámetros que dividan la distribución de
datos en otras proporciones.
Losdeciles
percentiles
son
yque
nueve
valores
dividende
lade
Los
son
nueve
valores
dividen
la distribución
datos
quintiles
son
cuatro
valores
que
dividen
laque
distribución
Los
cuartiles
tresnoventa
distribución
de datos
en 100
partes
iguales,
dejando
debajo
en
10 en
partes
iguales,
dejando
debajo
de ellos
el 10%,
el 20el
%,de
datos
iguales,
dejando
debajo
de
el
40
datos
en 54 partes
partes
iguales,
dejando
debajo
de ellos
ellos
el 20%,
25%,
el
50 %,
ellos
elel75
1%,
elde
2 los
%,
30%,
…,
y respectivamente.
el 99 % de los datos
30%,
…,
y%
el%
90
%
los respectivamente.
datos
60%
80
de
losde
datos
respectivamente.
%
y yel
datos
respectivamente.
Se
representan
K
KQ2
Ky3,….,
y K4D
. 9.
Se
representanpor
porD
Q1,
Q3.
1, D
2, D
Se representan por P1, P2, P3,…., P99.
100%
20%
60%
80%
0
40%
K1
K3
K4
K2
100%
75%
25%
0
50%
Q3
Q1
Q2
Las calificaciones en la asignatura de historia de los 40 alumnos
de una clase viene dada por la tabla:
Calificaciones
1
2
3
4
5
6
7
8
9
Nº de alumnos
2
2
4
5
8
9
3
4
3
Cálculo de Q1
Cálculo
de
P
Calcular los cuartiles
primero y tercero y los percentiles
de de Q3
Cálculo
70
N/4=10.
Cálculo
de P30
70.N/100=28
orden
30 y 70
3.N/4=30
30.N/100=12
Xi
fi
Fi
1
2
3
4
5
6
7
8
9
2
2
4
5
8
9
3
4
3
Total = 40
2
4
8
13
21
30
33
37
40
<12
<10
>10
>12
<28
=30
>28
Q
P30
=4
1=4
PQ70=6.5
=6
3
Se ha aplicado un test sobre satisfacción en el trabajo a 88
empleados de una fábrica, obteniéndose las resultados:
Calcular:
Puntuaciones
Núm. de trabajadores
[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)
7
8
15
25
18
9
6
a) Los cuartiles primero y tercero.
b) Los percentiles de orden 40 y 90
Test sobre satisfacción en el trabajo: N=88
Q1 deja la cuarta parte de la distribución a su izquierda :N/4=22
Clase del primer
Clases
fi
Fi
cuartil: [50-56)
[38-44)
7
7
[44-50)
8
15 <22
15
7

[50-56)
15
30 >22
6
x
[56-62)
25
55
[62-68)
[68-74)
[74-80)
18
9
6
73
82
88
Aplicando la fórmula:
Li = 50
c=6
22  15
M  50  6 
N/4 = 22
15
Fi-1 = 15
fi = 15
15
7
x
50
 52 . 8
x  6
6
7
56
 2 .8
15
M=50+2.8=52.8
Test sobre satisfacción en el trabajo: N=88
Q3 deja las tres cuartas partes de los datos a su izquierda :3.N/4=66
Clases
fi
Fi
[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)
7
8
15
25
18
9
6
7
15
30
55 <66
73 >66
82
88
Aplicando la fórmula:
Li = 62
c=6
66  55
M  62  6 
N/4 = 66
18
Fi-1 = 55
fi = 18
Clase del tercer
cuartil: [62-68)
18

11
6
x
18
11
x
62
 65 . 67
x  6
6
11
68
 3 . 67
18
M=62+3.67=65.67
Test sobre satisfacción en el trabajo: N=88
P40 deja el 40% de los datos a su izquierda :88.40/100=35.2
Clases
fi
Fi
[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)
7
8
15
25
18
9
6
7
15
30 < 35.2
55 > 35.2
73
82
88
Aplicando la fórmula:
Li = 56
c=6
35 . 2  30
M

56

6

40.N/100 = 35.2
25
Fi-1 = 30
fi = 25
Clase de P40:
[56-62)
25

5 .2
6
x
25
5.2
x
56
 57 . 25
x  6
6
5 .2
62
 1 . 25
25
M=56+1.25=57.25
Test sobre satisfacción en el trabajo: N=88
P90 deja el 90% de los datos a su izquierda :88.90/100=79.2
Clases
fi
Fi
[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)
7
8
15
25
18
9
6
7
15
30
55
73 < 79.2
82 > 79.2
88
Aplicando la fórmula:
Li = 68
c=6
79 . 2  73
M

68

6

90.N/100 = 79.2
9
Fi-1 = 73
fi = 9
Clase de P90:
[68-74)
9

6 .2
6
x
9
6.2
x
68
 72 . 13
x  6
6
6 .2
74
 4 . 13
9
M=68+4.13=72.13
Método gráfico para el cálculo de los cuantiles
3.
Representamos el histograma de frecuencias acumuladas porcentuales
Trazamos el polígono de frecuencias acumuladas, uniendo los vértices superiores
derechos de los rectángulos del histograma.
Sobre el polígono determinamos el valor de la variable que corresponde a una frecuencia
acumulada correspondiente al cuantil deseado
100,00
90,00
80,00
75%
70,00
Porcentajes
1.
2.
60,00
50,00
40,00
30,00
25%
20,00
10,00
0,00
41
47
Q1 P40
Q3
53
65
59
Putuaciones
71
77
Descargar

Variables cualitativas y cuantitativas