Prueba de Hipótesis
Subtítulo
La estadística inferencial
Una de las aplicaciones de la estadística
es extraer inferencias en poblaciones a
partir del estudio de muestras. Este
proceso recibe el nombre de Estadística
Inferencial y sus estudios pretenden
deducir
(inferir)
propiedades
o
características de una población a partir
de una muestra representativa.
La estadística inferencial y la prueba de
hipótesis
Para realizar el proceso inferencial se suele partir de
hipótesis, es decir, de unas suposiciones cuya validez
cabe confirmar o rechazar.
es una técnica estadística que se sigue para decidir si
rechazamos o no una hipótesis estadística con base en
la información de una muestra.
“Es una verdad muy cierta que, cuando no esté a
nuestro alcance determinar
lo que es verdad, deberemos buscar lo que es más
probable.”
Descartes, en su Discurso del Método
PASO 1
Formaliza las hipótesis:
Hipótesis nula Vs. Hipótesis alternativa
PASO 2
Elige el test adecuado:
Paramétrico Vs. No paramétrico
PASO 3
Determinar si la prueba de significancia tendrá
dos direcciones o una sola
PASO 4
Especifica el nivel de significación
PASO 5
Calcula el valor del test
NO
La probabilidad teórica de obtener las diferencias
observadas es menor o igual que el nivel de significación?
Aceptar la hipótesis nula: las diferencias observadas se deben
simplemente a errores de muestreo
SI
Rechaza la hipótesis nula: las diferencias entre
los grupos son significativas
Paso 1
Formaliza las hipótesis:
Hipótesis nula Vs. Hipótesis alternativa
Formaliza las hipótesis:
Hipótesis nula Vs. Hipótesis alternativa
Un contraste de hipótesis estadístico se plantea como una decisión entre dos
hipótesis.
Hipótesis
Hipótesis Nula
Hipótesis de
Investigación
indica que NO hay diferencias
significativas entre dos medias
muestrales y afirma que la diferencia
entre dos medias muestrales es debida
al azar, a la suerte, al error de
muestreo
asume que SI hay diferencias
significativas entre dos medias
muestrales y que esa diferencia se
debe al empleo de un método
(medicamento, tratamiento,etc.) que
es más efectivo que otro
En estadística, un resultado se
denomina
estadísticamente
significativo
cuando
no
es
probable que haya sido debido al
azar.
El propósito del experimento
es decidir si la prueba tiende
a apoyar o a refutar la
Hipótesis Nula.
Veamos un ejemplo
El efecto "Mozart vs. Reggaeton” :
Se sospecha que los individuos rinden más en un
test de inteligencia tras escuchar música de Mozart
que cuando han escuchado Reggaeton
Hipótesis científica: Escuchar la música de Mozart tiene un efecto sobre el CI diferente al
Reggaeton.
Experimento: De la población venezolana seleccionamos 20 niños al azar en dos grupos de 10.
Un grupo escuchará Mozart antes de hacer el test de CI. El otro escuchará Reggaeton. Después
de realizar el test, se calculan las medias en cada uno de los dos grupos.
Supongamos que la media del CI del grupo de Mozart fue 110, mientras que la media del grupo
de Reggaeton fue de 102 . Entonces: ¿Podemos decir que hay diferencias a nivel poblacional
entre ambos grupos?. Para tomar tal decisión necesitaremos plantear DOS hipótesis:
Hipótesis:
Hipótesis nula. Es la que proporciona la solución "más sencilla". En nuestro ejemplo sería que la
media de ambos grupos es la misma. (Es decir, que no hay un efecto de la música sobre el CI.)
H0: μ1 = μ2
Hipótesis de Investigación. Es la hipótesis complementaria (y "más compleja"). En nuestro caso sería
que la media de ambos grupos es diferente. (Es decir, que hay un efecto de la música sobre el
CI.)
H1: μ1 ≠ μ2
La pregunta del investigador entonces es:…se acepta o
no se acepta la hipótesis nula
Hay cuatro posibilidades:
La hipótesis nula es cierta y el investigador concluye que lo es…una decisión correcta
La hipótesis nula es falsa y el investigador concluye que lo es…una decision correcta
La hipótesis nula es cierta pero el investigador concluye que es falsa…una decision incorrecta
La hipótesis nula es falsa pero el investigador concluye que es cierta…una decision incorrecta
TIPOS DE ERROR
Decisiones
Verdadera
Aceptar Ho
Decisión
Correcta
Falsa
Error Tipo II
Aceptar la Hipótesis
Nula cuando ha
debido rechazarse))
(β)
Error Tipo I (α)
Rechazar Ho
Un falso positivo.
Rechazar la Ho (H.
Nula) cuando ha
debido Aceptarse
Decisión
Correcta
Ho: El sujeto es inocente
Hi: el sujeto es culpable
Obviamente interesa minimizar ambos
errores, aunque en Estadística se da
prioridad al error de tipo I, es decir se
intenta evitar los falsos positivos, ya que
es mejor dejar libre a un culpable que
condenar a un inocente.
La única manera de disminuir ambos es
aumentar el tamaño de muestra.
Reducir
ambos
errores a cero es
imposible y, además,
al disminuir uno se
aumenta el otro, por
lo que hay que elegir
bien el test empleado
para llegar al mejor
balance posible entre
el error de tipo I y el
error de tipo II.
PASO 2
Elige el test adecuado:
Paramétrico Vs. No paramétrico
Pruebas paramétricas y NO paramétricas
para contrastar la veracidad o falsedad de las hipótesis enunciadas aplicamos unas pruebas
estadísticas que se clasifican en pruebas paramétricas y pruebas no paramétricas.
Cuál elegir?
Pruebas
paramétricas
Son las mas
potentes
Requiere que se
cumplan una serie
de supuestos
paramétricos
Pruebas NO
paramétricas
Son las mas potentes
Son más flexibles
porque NO Requiere
que se cumplan una
serie de supuestos
paramétricos
Con respecto a la potencia
Las pruebas paramétricas son más
potentes que las NO paramétricas
Potencia
Error Tipo II
1.0
Si hay un efecto será
detectado
es la probabilidad de que la hipótesis
nula sea rechazada cuando la
hipótesis alternativa es verdadera (es
decir, la probabilidad de NO cometer
un error del tipo II)
0.8
Si hay un efecto será
detectado el 80% de las veces
0.5
Si hay un efecto será
detectado el 50% de las veces
0.2
Si hay un efecto será
detectado el 20% de las veces
Las pruebas paramétricas tienen
menos posibilidades de cometer un
error tipo II.
0.0
Si hay un efecto nunca será
detectado
Qué es la potencia
la potencia de un test estadístico
aumenta cuando lo hace el tamaño de la
muestra; de esta forma, para conseguir la
misma potencia que tiene un prueba
paramétrica con una No paramétrica,
necesitaremos aumentar el tamaño de la
muestra
Por ejemplo, la U de Mann-Whitney tiene
una potencia relativa del 95% con respecto
a la prueba paramétrica t de Student
(significa que con una muestra de 100
sujetos, se consigue la misma potencia con
la U de Mann-Whitney que con 95 sujetos
para la t de Student).
U de Mann-Whitney
t de Student
100 sujetos
95 sujetos
Igual potencia
Con respecto a los supuestos paramétricos
Supuestos que
subyacen a la
utilización de
pruebas
paramétricas
Normalidad
La VD debe ser
medida en una
escala de intervalo
o razón
Homocedasticidad
o igualdad de
varianza
Una muestra igual o
superior a los 30
sujetos
Descripción
Normalidad
La VD debe ser
medida en una
escala de intervalo
o razón
Homocedasticidad
o igualdad de
varianza
Una muestra igual o
superior a los 30
sujetos
La población al estar constituida por un número grande de casos tiende a tener una
distribución normal. Como las pruebas paramétricas estiman los parámetros de la
población a partir de muestras estadísticas, se parte del supuesto que estas muestras
también tienen una distribución normal
Los métodos estadísticos paramétricos requieren del empleo de datos medidos en una
escala de intervalo o de razón.
En estos niveles de medición tienen sentido las operaciones aritméticas como el análisis de
medias, desviación estándar y varianzas .
Las varianzas de la variable dependiente en los grupos que se comparan deben ser
aproximadamente iguales.
Existen varias pruebas que permiten comprobar la igualdad de varianzas, una de las más
conocidas es la prueba de Levene
Dado que las pruebas paramétricas realizan estimación de parámetros de la población a
partir de muestras estadísticas, es lógico pensar que cuanto más grande sea la muestra,
más exacta será la estimación; en cambio, cuanto más pequeña, más distorsionada será la
media de las muestras por los valores raros extremos.
Criterio paramétrico: Normalidad
distribución normal o distribución de Gauss o es
la distribuciones de probabilidad de variable
continua que con más frecuencia aparece
aproximada en fenómenos reales.
La importancia de esta distribución radica en
que permite modelar numerosos fenómenos
naturales, sociales y psicológicos.
La población de cualquier fenómeno, al estar
constituida por un número grande de casos
tiende a tener una distribución normal.
Una observación es NORMAL cuando su
comportamiento es Frecuente de acuerdo con
un modelo matemático teórico que diferencia
lo Frecuente de lo Raro
Como las pruebas paramétricas estiman los
parámetros de la población a partir de muestras
estadísticas, se parte del supuesto que estas muestras
también tienen una distribución normal a partir de la
cual se hará una estimación adecuada
Sin embargo, algunos autores han señalado que en
ocasiones en el campo de las ciencias sociales puede
resultar poco frecuente encontrar variables que se
ajusten a este tipo de comportamiento.
Debido a esto es preciso comprobar si la distribución
de nuestro estudio sigue esta estructura teórica. Una
de las pruebas más usada para verificarlo es la prueba
de Kolmogorov Smirnov
En estos niveles de medición
tienen sentido las operaciones
aritméticas como el análisis de
medias, desviación estándar y
varianzas .
Mas cualitativas
Los
métodos
estadísticos
paramétricos
requieren
del
empleo de datos medidos en
una escala de intervalo o de
razón.
Mas cuantitativas
Criterio paramétrico: La VD debe ser medida en una
escala de intervalo o razón
razón
Pruebas
paramétricas
intervalo
ordinal
Pruebas NO
paramétricas
Nominal
Criterio paramétrico: Homocedasticidad
La homocedasticidad o igualdad de la varianza, significa que todos los grupos a analizar
poseen la misma varianza
El dibujo de caja y bigote nos muestra “la media”
en la línea central, el limite inferior es el Q1 y el
límite superior es el Q3 y de esta forma se abarca el
95% de los casos
Cuando compramos 2 grupos y proyectamos la
línea media de un grupo sobre el otro y esta
proyección cae dentro de la caja, concluimos que
los dos grupos son iguales. Pero si la proyección de
la línea media de un grupo sobre el otro cae fuera
de la caja, entonces los grupos son diferentes.
Por supuesto estos grupos tienen que tener una
distribución normal. Las cajas tienen que tener las
cajas del mismo tamaño (la misma varianza)
Si las varianzas son distintas (aunque se
mantenga la simetría para el grupo
comparativo) , ya no podemos usar el
principio de proyectar la línea media
de un grupo hacia otro para observar si
cae dentro o fuera de la caja y así
decidir si son iguales o distintos, puesto
que ya las proyecciones NO son
equivalentes
Para poder comparar grupos, la
variabilidad tiene que ser equivalente
Criterio paramétrico: N > 30
Dado que las pruebas paramétricas
realizan estimación de parámetros
de la población a partir de muestras
estadísticas, es lógico pensar que
cuanto más grande sea la muestra,
más exacta será la estimación; en
cambio, cuanto más pequeña, más
distorsionada será la media de las
muestras por los valores raros
extremos.
dos
Más de
dos
SI
NO
Use prueba
paramétrica
Use prueba
NO
paramétrica
Indep.
Relac.
una
Cumplimiento de
Supuestos
Paramétricos
Dos muestras
Número de
muestras
Pruebas estadísticas que se aplican
Pruebas Paramétricas
Pruebas No
Paramétricas
nominal
X2
ordinal
Z de
KolmogorovSmirnov
T de Student para
muestras
independientes
nominal
Fisher
ordinal
Mediana y
U de Mann
Whitney
T de Student para
muestras relacionadas
Nominal
Mc Nemar
ordinal
Signos y
Wilcoxon
1 VI: ANOVA
de 1 factor
Nominal
Chi
Cuadrado
2 VI: ANOVA
factorial
Ordinal
kruskal Wallis
nominal
Q de
Cochran
ordinal
Friedman
Prueba t de Student
para una muestra
Más de dos
muestras
Relac.
Indep.
Tipo de prueba a
elegir depende de
Una
muestra
Número
de
muestras
s
ANOVA
ANOVA de una via
(intragrupos)
PASO 3
Determinar si la prueba de significancia tendrá
dos direcciones o una sola
• Si la hipótesis alternativa se formula simplemente como “la
hipótesis nula no es cierta”, el contraste es bilateral o de dos
colas.
• Por el contrario cuando se indica el sentido de la diferencia, el
contraste es unilateral o de una sola cola
Contraste de dos colas
Una prueba es de dos colas cuando no se establece una dirección específica de la hipótesis de investigación :
H0: el ingreso medio de las mujeres es igual al ingreso medio de los hombres.
H1 : el ingreso medio de las mujeres no es igual al ingreso medio de los hombres.
- /2= 0.025
área de rechazo de Ho
Área de no
rechazo de
Ho
/2= 0.025
área de rechazo de Ho
Z
prueba de dos colas, nivel de
significancia de 0.05
t
F
x2
Estadísticos
de prueba
Contraste de una cola
Una prueba es de una cola cuando la hipótesis de investigación establece una dirección, como:
H0 : el ingreso medio de las mujeres es igual al ingreso medio de los hombres.
H1 : el ingreso medio de las mujeres es mayor que el de los hombres.
Significación
= 0.05
Area de no
rechazo de
Ho
área de rechazo de
Ho
Z
prueba de una cola, nivel
de significancia de .05
t
F
x2
Estadísticos
de prueba
Paso 4
Especifica el nivel de significación
El nivel de significación de un test es un concepto estadístico asociado a la verificación de
una hipótesis. En pocas palabras, se define como la probabilidad de tomar la decisión de
rechazar la hipótesis nula (H0) cuando ésta es verdadera.
Esta probabilidad (denotada como
α) se suele especificar antes de
tomar la muestra, de manera que
los resultados obtenidos no influyan
en la decisión
Los valores más comunes de significancia son de
0.05, 0.01, 0.001, estos valores dependen de la
rigurosidad que establezca el investigador para su
análisis.
Probabilidad
del 95%
1-α = 0.95
α = 0.05
Probabilidad
del 90%
1-α = 0.90
α = 0.10
Probabilidad
del 99%
1-α = 0.99
α = 0.01
Cuando se define un a: 0.05 se está diciendo que se está dispuesto a cometer el error tipo I
como máximo el 5% de las veces; o sea que de cada 100 veces que a partir de los datos se
concluya a favor de la hipótesis alterna, se tolera equivocarse como máximo, en cinco de
esas 100 veces.
p < 0.05
A≠B
p ≥ 0.05 A = B
Se rechaza la hipótesis nula
Se acepta la hipótesis nula
No parece que el azar pueda
explicarlo todo
No se puede descartar que el azar
lo explique todo
Hay diferencias estadísticamente
significativas
NO hay diferencias
estadísticamente significativas
Existen evidencias a favor de la
Hipótesis de investigación
No existen evidencias a favor de
la Hipótesis de investigación
La decisión se toma a menudo utilizando el valor P (o p-valor): si el valor P es inferior al nivel de
significación, entonces la hipótesis nula es rechazada. Cuanto mayor sea la p (p > 0,05) más
fuerte y segura será la evidencia a favor de la hipótesis nula (igualdad).
Paso 5
Calcular el valor del test
Este paso se hará en cada una de las presentaciones al comparar la media de un
grupo, de dos grupos y de más de dos grupos.
Sin embargo, debemos aclarar algo sobre este paso final en el contraste de hipótesis:
Hay 2 maneras de hacer una prueba de hipótesis
Método Tradicional
Estamos estudiando el efecto del estrés sobre la presión arterial.
Nuestra hipótesis es que la presión sistólica media en varones
jóvenes estresados es mayor que 18 cm de Hg. Estudiamos una
muestra de 36 sujetos y encontramos:
X  18 . 5
S  3 .6
1. Se trata de un contraste sobre medias. La hipótesis nula (lo que
queremos rechazar) es:
H o    18
2. la hipótesis alternativa
H a    18
es un contraste lateral derecho.
3. Fijamos "a priori" el nivel de significación en 0,05 .
4. El estadístico para el contraste es
T 
X  0
s
N
• Y la región crítica T > t
• Si el contraste hubiera sido lateral izquierdo, la región crítica sería T<t1-
• si hubiera sido bilateral T <
t1- /2 o T > t /2
T 
18 . 5  18
3 .6
 0 . 833
36
En este ejemplo t(35)0,05=1,69.
5. Calculamos el valor de t en la muestra no está en la región crítica (no es mayor que 1,69), por
tanto no rechazamos H0.
Método moderno: usando software
Otra manera equivalente de hacer lo mismo (lo que hacen los paquetes estadísticos) es
buscar en las tablas el "valor p" que corresponde a T=0,833, que para 35 g.l. es
aproximadamente 0,20.
dicho de otra manera la probabilidad de equivocarnos si rechazamos H0 es 0,20, como la
frontera se establece en 0,05 No rechazamos Ho
Descargar

tropicalialasurrealista.files.wordpress.com