REPUBLICA BOLIVARIANA DE VENEZUELA
MINISTERIO DEL PODER POPULAR PARA LA DEFENSA
UNIVERSIDAD NACIONAL EXPERIMENTAL DE LA FUERZA
ARMADA (UNEFA)
NUCLEO ZULIA
Integrantes
LERBY ARTEAGA
FREDDY ARENAS
CARLOS ARIZA
LUIS MORENO
Las pruebas de bondad de ajuste tienen por objetivo determinar
si los datos se ajustan a una determinada distribución, esta
distribución puede estar completamente especificada (hipótesis
simple) o perteneciente a una clase paramétrica (hipótesis
compuesta).
La prueba de bondad de ajuste se aplica en diseños de
investigación en los que se estudia a un único grupo.
La prueba compara la distribución de frecuencias observada (Fo)
de una variable usualmente cualitativa, pero que también puede
ser cuantitativa, con la distribución de frecuencias de la misma
variable medida en un grupo de referencia.
Prueba para la Bondad de ajuste


Hipótesis estadística nula: Ho: Fo = Fe
Hipótesis estadística alterna: Ha: Fo ≠ Fe
El procedimiento de la prueba incluye el cálculo de la medida
de resumen llamada Chi cuadrada. El rechazo del Ho ocurre
cuando el valor calculado con los datos resulta mayor que el
valor crítico de dicha medida contenido en una tabla llamada
Valores Críticos de Chi cuadrada.
Prueba para la Bondad de ajuste
En el caso de que el valor de Chi cuadrada calculada sea igual
o menor al de Chi cuadrada crítica se dice que no se rechaza al
Ho y, por tanto, se concluye que la Fo es semejante a la Fe. En
otras palabras, se dice que ambas distribuciones se ajustan
bien; de ahí el nombre de la prueba: bondad de ajuste.
Se propone que el número de defectos en las tarjetas de
circuito impreso sigue una distribución Poisson.
Se reúne una muestra aleatoria de 60 tarjetas de circuito
impreso y se observa el número de defectos. Los resultados
obtenidos son los siguientes:
Prueba para la Bondad de
ajuste
Una moneda fue lanzada al aire 1000 series, de 5 veces cada serie y se
observó el número de caras de cada serie. El número de series en los que se
presentaron 0, 1, 1, 3, 4 y 5 caras se muestra en la siguiente tabla.
Número
de
caras
Número de series
(frecuencia
observada)
0
38
1
144
2
342
3
287
4
164
5
25
Total
1000
Prueba para la Bondad de
ajuste
Prueba para la Bondad de ajuste
Número de
defectos
0
Frecuencia
observada
1
15
2
9
3 ó más
4
32
Prueba para la Bondad de
ajuste
Validación de modelos
Validación es el proceso de comprobar que los resultados
aportados por el modelo para las variables de salida y de
estado no son muy diferentes a los medidos en la realidad.
Existen diferentes índices que permiten cuantificar el grado
de ajuste entre los datos medidos y los resultados del
modelo. Coeficiente de determinación r2, es decir el
cuadrado del Coeficiente de correlación
El problema estadístico se convierte en que dado un conjunto
de datos hipotéticamente relacionados entre sí ¿cómo
evidenciar esa relación?
Desarrollar un modelo que permita ser posible validar con
determinada certeza el valor de una variable dependiente con
respecto a otra relacionada
Y=f(x)
Diagrama de Dispersión
Es la representación gráfica de las observaciones de las
variables aparente o hipotéticamente relacionadas, con el
objeto de evidenciar tal relación.
Por ejemplo
El ajuste de la curva es el procedimiento de hallar una
curva que represente lo más eficazmente posible la
distribución de los datos
El objeto es determinar la ecuación de la curva que
represente la menos desviación posible del conjunto de
datos considerado.
A estos efectos el procedimiento de mínimos cuadrados,
es la técnica matemática de análisis numérico que
permite encontrar la función que mejor se aproxime al
conjunto de datos siguiendo el criterio del menor error
cuadrático. Se trata de minimizar la suma de los
cuadrados entre los puntos generados por la función y
los correspondientes en los datos
Regresión y regresión lineal simple
Se llama Regresión a la media de la distribución de una variable
(dependiente) con respecto a un valor determinado de otra
(independiente).
Es el proceso de ajustar una recta a un conjunto de datos cuya
dispersión sugiere este tipo de síntesis matemática.
El modelo puede representarse como:
Donde:
Yᵢ= variable dependiente
β0=intersección con el eje de las ordenadas
β1=pendiente real de la población
Xᵢ=la variable independiente
ἑᵢ=error aleatorio en Y para la observación ᵢ
El método de mínimos cuadrados nos permite determinar, dentro de
estas premisas, la ecuación bajo el siguiente modelo general:
Las ecuaciones normales de la regresión lineal
Resolviendo el sistema se obtiene
Donde ambas medias son las correspondientes al conjunto de
datos dado.
Si obtenemos la razón de la variación explicada a la variación
total podremos calcular el porcentaje de la variación explicada por
el modelo de regresión y por tanto una medida de cuán confiable
es el modelo. Esta medida se define como:
La variación explicada representa la diferencia entre la media de Y y
Yest;. La variación no explicada representa la parte de la variación no
explicada por la regresión y está basada en la diferencia entre el valor
observado Yi y el valor de Yest; el valor predicho por la recta de regresión
para un Xi dado. Es claro que:
•Vtotal=Vexp - Vnexp
• Vtotal=variación total
Considerando:
• Vexp=Variación explicada
•Vnexp=Variación no explicada
Expresadas matemáticamente con los siguientes
ecuaciones
Variación total
Variación no explicada
Variación explicada
Ejercicio I
A partir de esta data, se
construye un gráfico de
dispersión con el objeto
de determinar a grandes
rasgos si su hipótesis es
válida:
Área de la
parcela (mts)2
1
2
3
4
5
6
7
8
9
10
11
12
500
700
1000
1000
1200
2000
2200
1500
3000
4000
1200
1500
Costo
construcción
(bs)
31,60
32,40
41,70
50,20
46,20
58,50
59,30
48,40
63,70
85,30
53,40
54,50
Ejercicio I

El contador de costos de una empresa de
construcción tiene el problema de estimar los costos
de construcción para viviendas unifamiliares en el
próximo año, para asignar los posibles precios. Tiene
a mano los registros de todas las viviendas
construidas en el último año. Por experiencia supone
como razonable la hipótesis que el costo de la
construcción está relacionado con el tamaño de la
parcela: (Y) decide tomar una muestra aleatoria de
12 casas, según tabla a continuación:
El gráfico demuestra que la hipótesis es más que
razonablemente valida, por lo proceda a construir una
recta de regresión y obtener así su modelo.
1
2
3
4
5
6
7
8
9
10
11
12
∑
Área de la
parcela
(mts)2
500
700
1.000
1.000
1.200
2.000
2.200
1.500
3.000
4.000
1.200
1.500
19.800
Costo
construcción
(bs)
31,6
32,4
41,7
50,2
46,2
58,5
59,3
48,4
63,7
85,3
53,4
54,5
625,20
X.Y
X2
Y2
15.800
22.680
41.700
50.200
55.440
117.000
130.460
72.600
191.100
341.200
64.080
81.750
1.184.010
250.000
490.000
1.000.000
1.000.000
1.440.000
4.000.000
4.840.000
2.250.000
9.000.000
16.000.000
1.440.000
2.250.000
43.960.000
998,56
1.049,76
1.738,89
2.520,04
2.134,44
3.422,25
3.516,49
2.342,56
4.057,69
7.276,09
2.851,56
2.970,25
34.878,58
Ya que aplicando esta formula obtenemos b1
b1=0,90
b0=50.610
Ya aplicada esta formula se obtiene los
siguiente resultados


b1=0,90
b0=50.610
Ya habiendo obtenido b1 y b0 procedemos a buscar a Y estimada
utilizando la siguiente formula
i= b0+ b1* X i
Ῡ i=50.6+(0.90*500)=500.6
Ῡ i=50.6+(0.90*700)=680.6
Ῡ i=50.6+(0.901000)=950.6
Ῡ i=50.6+(0.90*1000)=950.6
Ῡ i=50.6+(0.90*1200)=1130.6
Ῡ i=50.6+(0.90*2000)=1850.6
Ῡ i=50.6+(0.90*2200)=2030.6
Ῡ i=50.6+(0.90*1500)=1400.6
Ῡ i=50.6+(0.90*3000)=2750.6
Ῡ i=50.6+(0.90*4000)=3650.6
Ῡ i=50.6+(0.90*1200)=1130.6
Ῡ i=50.6+(0.90*1500)=1400.6
Aria de la
parcela(mts)2
Costo
Construcción
2
X.Y
X
2
Y
1
500
31.60
15.800
250.000
998,56
2
700
32.4
22.680
490.000
1.049,76
680.6
-648.2
3
1000
41.7
41.700
1.000.000
1.738,89
950.6
-908.9
4
1000
50.2
50.200
1.000.000
2.520,04
950.6
-900.4
5
1200
46.2
55.440
1.440.000
2.134,44
1130.6
-1084.4
6
2000
58.5
117.000
4.000.000
3.422,25
1850.6
-1792.1
7
2200
59.3
130.460
4.840.000
3.516,49
2030.6
-1971.3
8
1500
48.4
72.600
2.250.000
2.342,56
1400.6
-1352.2
9
3000
63.7
191.100
9.000.000
4.057,69
2750.6
-2686.9
10
4000
85.3
341.200
16.000.000
7.276,09
3650.6
-3565.3
11
1200
53.4
64.080
1.440.000
2.851,56
1130.6
-1077.2
12
1500
54.5
81.750
2.250.000
2.970,25
1400.6
-1346.1
sumatoria
19.800
625.2
1.184.01
43.960.000
34.878,58
22927.2
-22302
Yest
Y-Yest
5000.6
-4969
Variación total
Vtotal = 2305.66
Variación no explicada
Ojo: Esta no se hace solo nos piden r2 =
Vexp/Vtotal
Variación explicada
Vexp = - 30944.63
= r2=
- 30944.63
2305.66
= - 13.42 r2 = - 13.42
Ejercicio II

Se desea estimar los costos
para la construcción de un
apartamento, para
determinar los posibles
precios, tomando en cuenta
la relación costo-tamaño se
decide tomar una muestra
aleatoria de 7 expresada
según la tabla a
continuación
Área de la Costo construcción
terreno
(bs)
(mts)2
1
2000
41.20
2
1500
45.50
3
4000
54.10
4
3000
50,05
5
5000
63.40
6
2500
90.40
7
4500
85.70
Ejercicio II

El gráfico demuestra que la hipótesis es más
que razonablemente valida, por lo proceda a
construir una recta de regresión y obtener así
su modelo.

Luego se obtienen los valores de la tabla de
acuerdo a cada uno de ellos
Ejercicio II
Área del
terreno
(mts)2
Costo
construc
ción (bs)
X.Y
X2
Y2
Yest
Y-Yest
1
2000
41.20
82.400
4.000.000
1.697,44
55.4
-14.2
2
1500
45.50
68.250
2.250.000
2.070,25
54.0
-8.5
3
4000
54.10
216.400
16.000.000
2.926,81
56.0
-1.9
4
3000
50.05
150.150
9.000.000
2.505,0025
56.2
-6.6
5
5000
63.40
317.000
25.000.000
4.019,56
57.8
5.6
6
2500
90.40
226.000
6.250.000
8.172,16
55.8
34.6
7
4500
85.70
385.650
20.250.000
7.344,49
57.4
28.3
∑
22.500
430.35
1445.850
82750.000
27673.096
392.6
37.3
Ejercicio II
Ojo: No da el resultado hubo un
error en la media se toma con N=7
Al momento de aplicar la formula se obtiene los siguiente resultados:
b1=0.0008
b0=53.79
Ya habiendo obtenido b1 y b0 procedemos a buscar a Y estimada
utilizando la siguiente formula
Ejercicio II
Ya habiendo obtenido b1 y b0 procedemos a buscar a Y estimada
utilizando la siguiente formula:
Ῡ i= b0+ b1* X I
Ῡ i=53.79+(0.0008*2000)=55.4
Ῡ i=53.79+(0.0008*1500)=54.0
Ῡ i=53.79+(0.0008*4000)=56.0
Ῡ i=53.79+(0.0008*3000)=56.2
Ῡ i=53.79+(0.0008*5000)=57.8
Ῡ i=53.79+(0.0008*2500)=55.8
Ῡ i=53.79+(0.0008*4500)=57.4
Ejercicio II
Igualmente puede observarse que en la estimación la mitad de los datos
calculados están muy cercanos al dato observado
Datos original
Estimación
Área de la terreno
(mts)2
Costo construcción
(bs)
Yest
Y-Yest
1
2000
41.20
55.4
-14.1
2
1500
45.50
54.0
-8.5
3
4000
54.10
56.0
-1.9
4
3000
50.05
56.2
-6.6
5
5000
63.40
57.8
5.6
6
2500
90.40
55.8
34.6
7
4500
85.70
57.4
28.3
Ejercicio II
Vtotal=143013.223
Vnexp=30920.61
Vexp= 90264.91
90264 . 91
= r2 =
143013 . 23
=0.631
r2=0.631
Gracias
Descargar

Prueba para la Bondad de ajuste Validación de Modelo