Correlación
Biol 2153: Bioestadistica
¿Qué es correlación?
Es el método estadístico utilizado para determinar
si existe relación entre las variables.
Biol 2153: Bioestadistica
¿Qué es Regresión?
Es el método estadístico utilizado para describir la
naturaleza de la relación entre las variables:
positiva o negativa, lineal o no-lineal.
Biol 2153: Bioestadistica
Preguntas estadísticas que contesta un análisis
de correlación y regresión
1. ¿Están dos o más variables relacionadas?
2. Si las variables están relacionadas, ¿Qué tan fuerte es
su relación?
3. ¿Qué clase de relación existe?
4. ¿Qué clase de predicción puede ser realizada usando
esta relación?
Biol 2153: Bioestadistica
Diagrama de dispersión
• Es útil cuando deseamos conocer la relación que puede
existir entre dos variables; es decir, conocer qué sucede
con una variable si la otra aumenta o disminuye.
• Luego de ver la tendencia del diagrama de dispersión, se
procede a realizar una regresión.
• Típicamente la primera regresión intentada es la lineal. La
mediada estadística utilizada para validar la relación entre
las variables se conoce como el coeficiente de correlación.
Biol 2153: Bioestadistica
Ejemplos de diagramas de dispersión
Biol 2153: Bioestadistica
Coeficiente de Correlación de Pearson
• Es computado utilizando los valores de ambas variables,
para determinar la fortaleza y dirección de la relación
lineal.
• El rango del coeficiente es de -1 a 1. Cuando el valor
absoluto del coeficiente es 1, indica que existe una
correlación fuerte entre las variables.
• El signo determina si la correlación es positiva o negativa.
r 
Biol 2153: Bioestadistica
n   xy     x   y 
n   x     x  n   y     y  
2
2
2
2
Ejemplos de diagramas de dispersión
Biol 2153: Bioestadistica
Ejemplos de diagramas de dispersión
Biol 2153: Bioestadistica
Ejemplos de diagramas de dispersión
Biol 2153: Bioestadistica
Ejemplo-1
• Un investigador le interesa saber si existe una correlación
entre la edad de los adultos y su presión sanguínea,
particularmente la sistólica. Realice un diagrama de
dispersión y calcule el coeficiente de correlación.
Sujeto
A
B
C
D
E
F
Biol 2153: Bioestadistica
Presión
128
120
135
143
141
152
Edad
43
48
56
61
67
70
Ejemplo-1-Gráfico y Coeficiente de Correlación
Sujeto
A
B
C
D
E
F
Biol 2153: Bioestadistica
Presión
128
120
135
143
141
152
Edad
43
48
56
61
67
70
Significancia del coeficiente de correlación lineal
• El coeficiente de correlación de una muestra es identificado
por la letra r y el de una población por la letra griega .
• Para evaluar la significancia se utilizan los pasos
tradicionales de prueba de hipótesis: establecer la hipótesis
nula, encontrar los valores críticos, compute el valor de la
prueba, tome decisión y concluya.
• La formula para calcular el valor “t-Test”, para el coeficiente
de correlación:
n2
t r
Biol 2153: Bioestadistica
1 r
2
n-2, son los gados de libertad
Coeficiente de Determinación y
No-determinación
• El coeficiente de determinación es la razón de la variación
explicada entre la variación total y es representada por r2.
Es la medida de la variación de la variable dependiente,
explicada por la regresión lineal.
r 
2
Variación _ exp licada
Variación _ total
• El coeficiente no-determinación es la variación no
explicada por la regresión. Al ser excluyente estos
coeficientes, el coeficiente de no-determinación queda
definido por:
1 . 00  r
Biol 2153: Bioestadistica
2
Ejemplo 1- Significancia del Coeficiente de
Correlación
Sujeto
A
B
C
D
E
F
Biol 2153: Bioestadistica
Presión
128
120
135
143
141
152
Edad
43
48
56
61
67
70
Análisis de Varianza (Anova)
Biol 2153: Bioestadistica
ANOVA
• Es la técnica estadística, normalmente utilizada para
analizar resultados en la investigación con diseños
experimentales y cuasi experimentales.
• Ideal para comparar tres o más distribuciones, que
corresponden a variaciones de una misma variable
dependiente, afectada por una o más variables
independientes.
Biol 2153: Bioestadistica
Prueba de Hipótesis
• Para aplicar esta prueba se tienen que cumplir los mismos
supuestos que para la prueba “t-Test”.
• La hipótesis nula de la prueba es
H      ...  
0
Biol 2153: Bioestadistica
1
2
n
Ejemplo-2-ANOVA
• Un investigador desea probar la efectividad de diferentes
técnicas para bajar la presión sanguínea a individuos
diagnosticados con alta presión. Los sujetos fueron
asignados aleatoriamente en tres grupos: Medicamentos,
Ejercicios, Dieta. En la siguiente tabla se presenta la
reducción en la presión de cada sujeto.
Medicamentos
10
12
9
15
13
Biol 2153: Bioestadistica
Ejercicios
6
8
3
0
2
Dieta
5
9
12
8
4
Ejemplo-2-ANOVA-Resultado
Medicamentos
10
12
9
15
13
Biol 2153: Bioestadistica
Ejercicios
6
8
3
0
2
Dieta
5
9
12
8
4
Descargar

Slide 1