1
PROBABILIDAD
Unidad I Ordenamiento de la Información
2
Captura de datos muestrales
Conceptos básicos de la estadística
3




Población (o universo): Totalidad de elementos o
cosas bajo consideración
Muestra: Es una parte de la población seleccionada
para el análisis.
Parámetro: Es una medida numérica que describe
una característica de la población
Estadístico: Es la medida numérica que describe
alguna característica de la muestra
Tipos de Muestras
4
Tipos de
muestras
usadas
Muestras no
probabilísticas
Muestra de
juicio
Muestra de
cuota
Muestras de
probabilidad
De parte
Grande
Muestra
Aleatoria
simple
Muestra
sistemática
Muestra
estratificada
Muestra de
agrupación
Recolección de Datos
5




Proporcionados por una organización o un
individuo.
El diseño de un Experimento
Una encuesta
Un estudio observacional
Tipos de Datos
6
Tipo de Dato
Categórico
Tipo de Preguntas
¿Posee actualmente algunas acciones o bonos?
Respuestas
Si | No
Discreto
¿A cuántas revistas está
Suscrito actualmente?
______ Número
Continuo
¿Cuánto mide?
______ Metros
Numérico
Diseño del cuestionario
7


Propósito: Recabar información significativa que nos
ayude en el proceso de toma de decisiones.
Formular preguntas cortas, libres de
ambiguedades.
 ¿Fuma
Usted? ____ Si ____No
 ¿Cuántos Años tiene? ____ (en años)

Pruebas piloto
Elección de la muestra
8

Para seleccionar la muestra pueden usarse 2
métodos básicos:
 Con
remplazo
 Sin remplazo

Uso de tabla de números aleatorios
Organización de los datos numéricos
9

Arreglo Ordenado

Diagrama de tallo y hojas
Distribución de frecuencias
10

Es una tabla de resumen en la que los datos se
disponen en agrupamientos o categorías
convenientemente establecidas de clases ordenadas
numéricamente.
Tipos de frecuencias
11
Frecuencia absoluta
 La frecuencia absoluta es el número de veces que
aparece un determinado valor en un estudio
estadístico.
 Se representa por fi
 La suma de las frecuencias absolutas es igual al
número total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la
letra griega Σ (sigma mayúscula) que se lee suma o
sumatoria.
Tipos de frecuencias
12
Frecuencia relativa
 La frecuencia relativa es el cociente entre la
frecuencia absoluta de un determinado valor y el
número total de datos.
 Se puede expresar en tantos por ciento y se
representa por ni.

La suma de las frecuencias relativas es igual a 1.
Tipos de frecuencias
13
Frecuencia acumulada
 La frecuencia acumulada es la suma de las
frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado.
 Se representa por Fi.
Frecuencia relativa acumulada
 La frecuencia relativa acumulada es
el cociente entre la frecuencia acumulada de un
determinado valor y el número total de datos. Se
puede expresar en tantos por ciento.
Ejemplo
14

Durante el mes de julio, en una ciudad se han
registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29,
30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31,
34, 33, 33, 29, 29.
xi
Recuento
fi
Fi
ni
Ni
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31,
31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29
15
xi
Recuento fi
Fi
ni
Ni
27
28
29
30
31
32
33
34
I
II
IIIII I
IIIII II
IIIII III
III
III
I
1
3
9
16
24
27
30
31
0.032
0.065
0.194
0.226
0.258
0.097
0.097
0.032
1
0.032
0.097
0.290
0.0516
0.774
0.871
0.968
1
1
2
6
7
8
3
3
1
31
Este tipo de tablas de frecuencias se utiliza con variables discretas.
Distribución de frecuencias agrupadas
16


La distribución de frecuencias agrupadas o tabla
con datos agrupados se emplea si las variables
toman un número grande de valores o la variable
es continua.
Se agrupan los valores en intervalos que tengan
la misma amplitud denominados clases. A cada
clase se le asigna su frecuencia correspondiente.
17
Límites de la clase
 Cada clase está delimitada por el límite inferior de la
clase y el límite superior de la clase.
Amplitud de la clase
 La amplitud de la clase es la diferencia entre el límite
superior e inferior de la clase.
Marca de clase
 La marca de clase es el punto medio de cada intervalo y
es el valor que representa a todo elintervalo para
el cálculo de algunos parámetros.
Construcción de una tabla de
frecuencias agrupadas
18
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39,
44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15,
32, 13.
1º Se localizan los valores menor y mayor de la distribución. En este caso
son 3 y 48.
2º Se restan y se busca un número entero un poco mayor que la diferencia
y que sea divisible por el número de intervalos queramos establecer.
Es conveniente que el número de intervalos oscile entre 5 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50 / 5 = 10
intervalos.
Se forman los intervalos teniendo presente que el límite inferior de una
clase pertenece al intervalo, pero el límite superior no pertenece intervalo,
se cuenta en el siguiente intervalo.
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34,
36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35,
28, 38, 41, 48, 15, 32, 13.
19
ci
fi
Fi
ni
Ni
[0, 5)
2.5
1
1
0.025
0.025
[5, 10)
7.5
1
2
0.025
0.050
[10, 15)
12.5
3
5
0.075
0.125
[15, 20)
17.5
3
8
0.075
0.200
[20, 25)
22.5
3
11
0.075
0.2775
[25, 30)
27.5
6
17
0.150
0.425
[30, 35)
32.5
7
24
0.175
0.600
[35, 40)
37.5
10
34
0.250
0.850
[40, 45)
42.5
4
38
0.100
0.950
[45, 50)
47.5
2
40
0.050
1
40
1
Ejercicios
20
Las puntuaciones obtenidas por un grupo en una
prueba han sido:
 15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16,
20, 16, 15, 18, 16, 14, 13.
Construir la tabla de distribución de frecuencias
21
El número de estrellas de los hoteles de una ciudad
viene dado por la siguiente serie:
 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2,
2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.
Construir la tabla de distribución de frecuencia
22

Los pesos de 65 Empleados de una fabrica
Peso
[50, 60)
[60, 70)
[70, 80)
[80,90)
[90, 100)
[100,
110)
[110,
120)
fi
8
10
16
14
10
5
2
Definición de parámetro estadístico
23


Un parámetro estadístico es un número que se
obtiene a partir de los datos de una distribución
estadística.
Los parámetros estadísticos sirven para sintetizar
la información dada por una tabla o por una
gráfica.
Tipos de parámetros estadísticos
24

Hay tres tipos parámetros estadísticos:
 De
centralización.
 De posición
 De dispersión.
Medidas de Centralización
25


Nos indican en torno a qué valor (centro) se distribuyen
los datos.
Media aritmética


Mediana


La media es el valor promedio de la distribución.
La mediana es la puntación de la escala que separa la
mitad superior de la distribución y la inferior, es decir
divide la serie de datos en dos partes iguales.
Moda

La moda es el valor que más se repite en una distribución.
Medidas de posición
26
Las medidas de posición dividen un conjunto de datos en
grupos con el mismo número de individuos.
Para calcular las medidas de posición es necesario que
los datos estén ordenados de menor a mayor.
La medidas de posición son:
 Cuartiles


Deciles


Los cuartiles dividen la serie de datos en cuatro partes iguales.
Los deciles dividen la serie de datos en diez partes iguales.
Percentiles

Los percentiles dividen la serie de datos en cien partes iguales.
Medidas de dispersión
27

Rango o recorrido


Desviación media


La desviación media es la media aritmética de los valores
absolutos de las desviaciones respecto a la media.
Varianza


El rango es la diferencia entre el mayor y el menor de
los datos de una distribución estadística.
La varianza es la media aritmética del cuadrado de las
desviaciones respecto a la media.
Desviación típica

La desviación típica es la raíz cuadrada de la varianza.
Trabajo Parcial 1
28







Fecha de entrega: 10 Septiembre de 2010
Encuestar a 50 estudiantes de la escuela de sistemas
sobre Cultura y Deporte
Elaborar la Distribución de frecuencias para cada una
de las preguntas
Para Cada distribución calcular los parámetros
estadísticos de centralización y de dispersión
Graficar los resultados de las distribuciones.
Minimo de preguntas para la encuesta: 7
Incluir evidencias de encuesta!!!!!
Moda
29



La moda es el valor que tiene mayor frecuencia
absoluta.
Se representa por Mo.
Se puede hallar la moda para variables
cualitativas y cuantitativas.
 Hallar
la moda de la distribución:
 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Moda
30

Si en un grupo hay dos o varias puntuaciones con
la misma frecuencia y esa frecuencia es la máxima,
la distribución esbimodal o multimodal, es decir,
tiene varias modas.


Cuando todas las puntuaciones de un grupo tienen
la misma frecuencia, no hay moda.


1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia
máxima, la moda es el promedio de las dos
puntuaciones adyacentes.

0, 1, 3, 3, 5, 5, 7, 8Mo = 4
Moda (datos agrupados)
31





Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi-1 es la frecuencia absoluta inmediatamente
inferior a la clase modal.
fi+1 es la frecuencia absoluta inmediatamente
posterior a la clase modal.
ai es la amplitud de la clase.
Moda
32

También se utiliza otra fórmula de la moda que da
un valor aproximado de ésta:
Ejemplo (Moda)
33

Calcular la moda de una distribución estadística
que viene dada por la siguiente tabla:
Ejemplo (Moda)
34
Mediana
35



Es el valor que ocupa el lugar central de todos
los datos cuando éstos están ordenados de menor
a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables
cuantitativas.
Calculo de la Mediana
36





1 Ordenamos los datos de menor a mayor.
2 Si la serie tiene un número impar de
medidas la mediana es la puntuación central de
la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5
3 Si la serie tiene un número par de puntuaciones
la mediana es la media entre las
dos puntuaciones centrales.
7, 8, 9, 10, 11, 12Me= 9.5
Calculo para datos agrupados
37






La mediana se encuentra en el intervalo donde la frecuencia
acumulada llega hasta la mitad de la suma de las frecuencias
absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre .
Li es el límite inferior de la clase donde se encuentra la mediana.
fi es la frecuencia absoluta.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
Ejemplo (Mediana)
38
Media aritmética
39


La media aritmética es el valor obtenido
al sumar todos los datos y dividir el resultado
entre el número total de datos.
es el símbolo de la media aritmética.
Media aritmética para datos
agrupados
40

Si los datos vienen agrupados en una tabla de
frecuencias, la expresión de la media es:
Ejercicio (Media Aritmética)
41

En un test realizado a un grupo de 42 personas se
han obtenido las puntuaciones que muestra la
tabla. Calcula la puntuación media.
42
43

Los pesos de 65 Empleados de una fabrica
Peso
[50, 60)
[60, 70)
[70, 80)
[80,90)
[90, 100)
[100,
110)
[110,
120)
fi
8
10
16
14
10
5
2
Encontrar para datos agrupados Me, Mo , x
Cuartiles
44



Los cuartiles son los tres valores de la variable
que dividen a un conjunto de datos
ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores
correspondientes al 25%, al 50% y al 75% de
los datos.
Q2 coincide con la mediana.
Cálculo de los cuartiles
45


1 Ordenamos los datos de menor a mayor.
2 Buscamos el lugar que ocupa
cada cuartil mediante la expresión .
Cálculo de Cuartiles
46
Cuartiles para datos agrupados
47





En primer lugar buscamos la clase donde se
encuentra
, en la tabla de las frecuencias
acumuladas.
Li es el límite inferior de la clase donde se encuentra el
cuartil.
N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase del
cuartil.
ai es la amplitud de la clase
Ejercicio
48
49
50
Descargar

Diapositiva 1