Epidemiología y demografía sanitaria
Bloque de epidemiología
Tema 15
Validez de los estudios
epidemiológicos. Sesgos
Dr. Esteve Fernández
¿Qué queremos aprender?
1. Los conceptos de validez interna y externa en los
estudios epidemiológicos
2. La aplicación de los conceptos de validez y
fiabilidad a los estudios epidemiológicos.
3. El concepto de sesgo o error sistemático.
4. La diferencia entre sesgo y error aleatorio.
5. Los principales tipos de sesgos: de selección e
información (malaclasificación).
Estructura de la sesión
1. Validez interna y externa.
2. Erros sistemático y error aleatorio.
3. Validez y fiabilidad de los estudios epidemiológicos.
4. Sesgos.
5. Sesgo de selección.
6. Sesgo de información.
Materiales para el aprendizaje
0. (Diapositivas de la lección)
1. Lectura recomendada
•
Capítulo 13 libro Piédrola Gil y capítulo 4 libro
Szklo & Nieto
2. Lecturas complementarias
•
Artículos Aula Global
3. Seminarios nº 5, 6, 7 y 8
Validez interna y externa
Validez de un estudio
• Validez interna
• Validez externa o generalización
Validez interna (“validez”)
Grado en el que los resultados de un estudio
son correctos para los sujetos estudiados.
Condiciones:
- ausencia de errores sistemáticos
- minimización de errores aleatorios
Validez externa (generalización)
La capacidad de extrapolación o traslación
de los resultados del estudio a una
población diferente o más extensa que la
estudiada o a un nivel más abstracto de
conocimiento científico.
Condiciones:
- representatividad estadística
- alta validez interna
Error sistemático y aleatorio
Tipos de errores
• errores aleatorios
• errores sistemáticos
Ejemplo
Una persona que se nota febril …..
…. se toma 5 veces seguidas la temperatura
con un termómetro digital y obtiene los
valores: 37,8º ; 38,0º ; 37,6º ; 37,5º ; 38,1º
e inmediatamente…
…. se toma 5 veces seguidas la temperatura
con un termómetro de mercurio y obtiene los
valores: 39,0º ; 38,8º ; 38,9º ; 39,2º ; 39,1º
digital
Hg.
39º
Temp. media
Temp. media
38º
37º
Analogía de la diana: validez y reproducibilidad
válido y
preciso
no válido,
preciso
válido e
impreciso
no válido e
impreciso
Error aleatorio (azar)
Diferencia debida al azar entre la estimación
obtenida en el estudio y el parámetro que se
pretende estudiar.
Variabilidad debida al muestreo o del
proceso de medición.
Imprecisión de medida = dispersión aleatoria
Mayor tamaño muestral  mayor precisión
Error sistemático (sesgo)
Desviación sistemática y no debida al azar
de la medida o de los resultados de un
estudio.
Mayor tamaño muestral  igual sesgo
Relación entre el error sistemático y el error
aleatorio con el tamaño del estudio
Error
Error aleatorio
Error sistemático
Tamaño del estudio
Fuente: Rothman 2002
Validez y fiabilidad
Validez / exactitud
Grado en que unaestudio
variableproporciona
representa realmente
resultados
lo corresponden
que se supone que
representarreales
que se
con debe
los resultados
Grado de ausencia
de error sistemático o de sesgo
[validity, accuracy]
Reproducibilidad / Fiabilidad / Precisión
un estudio
Grado en en que una
variable proporciona
tiene casi el
mismo valor
cuandocuando
se mideserepetidamente
resultados
similares
hace varias veces
Grado de ausencia
de errores aleatorios
[reliability, reproducibility]
Ante un estudio nos tenemos que
preguntar:
1) Son correctos los resultados?
2) Pueden ser atribuidos al azar?
3) Son aplicables a otros contextos?
Ante un estudio nos tenemos que
preguntar:
1) Son correctos los resultados?
2) Pueden ser atribuidos al azar?
3) Son aplicables a otros contextos?
Sesgos
Sesgo
Cualquier hecho en el diseño o
ejecución de un estudio que hace
que los resultados del estudio de
desvíen o se aparten de la realidad.
[bias]
Siempre potencialmente presente…
 es necesario preverlo, anticiparlo
 es necesario identificarlo
sesgo = distorsión sistemática
≠
azar = distorsión sistemática
Clasificación de los sesgos
• sesgos de selección
Distorsión del efecto medido debida a los
procedimientos usados para seleccionar a los
sujetos
Los resultados obtenidos se pueden
explicar por cómo se seleccionaron los
sujetos
• sesgos de información
Distorsión del efecto medido debida a los
procedimientos usados para obtener la información y
clasificar a los sujetos (exposición y evento)
Los resultados obtenidos se pueden
explicar por cómo se clasifica los sujetos
Sesgo de selección
Sesgo de selección
Población de referencia
Enfermos
Expuestos
Sanos
Expuestos
Enfermos
No expuestos
Sanos
No expuestos
La muestra
no representa
a la población
diana
Muestra del estudio
Fuente: Szklo y Nieto 2000
Sesgos de selección
en la formación de la base del estudio
• mala definición de la población de estudio
• problemas en obtención de la muestra
• uso inapropiado de pruebas diagnósticas
- sesgos en la selección de controles en
estudios de casos y controles
Por alteraciones en la recogida de información
• pérdidas durante el seguimiento
• la ausencia de información condiciona la
no inclusión en el análisis
• sesgo de autoselección
Smoky Atomic Test
Seguidos
(76%)
4 casos
(14%)
Contactan espontáneamente
(62%)
Seguidos por los investigadores
No seguidos
(24%)
4 casos
?? casos
Fuente: Rothman 1998
• sesgo de no respuesta
¿Son diferenteslos participantes de los no
participantes?
¿La no participación está relacionada con la
exposición o con el desenlace estudiado?
Ej.: Encuesta de consumo de tabaco en médicos
de un hospital
• prevalencia “anormalmente” baja
• ¿hubo una mayor no respuesta entre los
fumadores?
• sesgo de Berkson
En muestras hospitalarias puede observarse una
asociación espuria entre dos factores que influyen en la
probabilidad de asociación.
Descrito en 1946 (“falacia de Berkson”):
• asociación inversa entre TBC y cáncer de pulmón
• casos: pacientes con cáncer
• controles: otros pacientes ingresados
Explicación: la probabilidad de estar ingresado y tener
las dos enfermedades es más baja que la probabilidad
de estar ingresado con sólo una enfermedad
• sesgo de Neymann
(o de incidencia-prevalencia o de supervivencia)
Cuando la exposición de interés se encuentra
asociada al pronóstico, el estudio de casos
prevalentes puede producir asociaciones espurias
 En estudios de prevalencia o de casos y
controles prevalentes.
Accidente Vascular
Cerebral
HTA
Ctrl
Total
No
mortal
Mortal
NO AVC
Sí
50
250
700
1000
No
80
20
900
1000
ORAVC no mortal = 0,80
OR AVC mortal = 16,10
• sesgo del trabajador sano
Cuando se compara la incidencia de
enfermedad en una población “seleccionada”
de origen laboral con la población general.
 en estudios de cohortes (laborales)
Sesgo de información
Población de referencia
Enfermos
Expuestos
Sanos
Expuestos
Enfermos
No expuestos
Sanos
No expuestos
Casos
Controles
Exp.
Los datos en la
muestra y en la
población diana
difieren
No Exp.
Muestra del estudio
Fuente: Szklo y Nieto 2000
Distorsión del efecto medido debida a los
procedimientos usados para obtener la
información y clasificar (errores en la
medida) a los sujetos (exposición y
evento)
Los resultados obtenidos se pueden explicar
por cómo se clasifica los sujetos
• sesgos en la medición/identificación
de la exposición
- Sesgo de recuerdo o de memoria
- ej.: recuerdo consumo fármacos
¿cómo prevenirlo?
- verificación respuestas
- uso de marcadores objetivos de exposición
- uso de diseños de cohortes
- Sesgo del entrevistador u observador
Ej.: aplicación diferente del cuestionario (caso/ctrl)
Ej.: asignación de un diagnóstico condicionado al
conocimiento de la exposición
¿cómo prevenirlo?
- protocolo de encuesta
- cegamiento
- entrenamiento
- Sesgo del entrevistado o participante
(de agrado, de colaboracionismo)
- Sesgo del entrevistado
Variable dependiente (enfermedad) asignada según
respuesta subjetiva o no validada del participante
Ej.: HTA en encuesta de salud sin examen
¿cómo prevenirlo?
- medida objetiva
- cuestionario validado
En los estudios epidemiológicos,
los sesgos de información
conducen a la malaclasificación*
de la exposición o del resultado
* del inglés misclassification, se le puede llamar
error de clasificación o clasificación errónea
La clasificación errónea de un
individuo, un valor, o un
atributo en una categoría
diferente de la que debería ser
asignado.
La probabilidad de
malaclasificación puede ser la
misma en todos los grupos de
estudio (malaclasificación no
diferencial) o puede variar entre
grupos (malaclasificación
diferencial).
¿En qué estudios puede haber
malaclasificación?
Cohortes
Casos y controles
Exposición
Desenlace
x
x
xxx
x
Malaclasificación no diferencial
Ocurre cuando el grado de error en la clasificación
de la exposición no depende del desenlace (ser
caso o control)
SIN
MALACLASIFICACIÓN
casos
controles
Expuestos
50
20
No expuestos
50
80
OR=4
MALACLASIFICACIÓN
de la exposición del 30% en cada grupo
Casos
50 - 15=35
50 + 15=65
casos
Controles
20 - 6=14
80 + 6=86
controles
Expuestos
35
50
14
20
No expuestos
65
50
86
80
OR=3,3
La malaclasificación no diferencial tiene a
sesgar la asociación hacia la hipótesis nula
La malaclasificación puede ocurrir en los dos
sentidos:
• de Exp a noExp
• de noExp a Exp
La malaclasificación se puede estudiar en
términos de correcta clasificación
– de los expuestos (sensibilidad)
– de los no expuestos (especificidad)
SENSIBILIDAD: Capacidad de una prueba de identificar correctamente
aquellos que tienen la característica o enfermedad de
interés.
ESPECIFICIDAD: Capacidad de la prueba de identificar correctamente
aquellos que NO tienen la característica o
enfermedad de interés.
La malaclasificación se puede estudiar en términos de
correcta clasificación
– de los expuestos (sensibilidad)
– de los no expuestos (especificidad)
Habrá malaclasificación no diferencial cuando la S y
la E de la clasificación de la exposición sea la misma
para casos y controles, pero <100%
Gold Standard (lo verdadero)
+
Nuestra “realidad”, +
lo que observamos
-
a
b
c
d
Efecto de la MALACLASIFICACIÓN NO DIFERENCIAL en la OR
Sensibilidad=0.90 y Especificidad=0.80
OR
casos
Distribución
verdadera
Exp No Exp
50
Exp No Exp
50
Distribución observada
en el estudio
45 10
Expuestos
verdadera
controles
20
casos
55
OR = 4,0
80
ctroles OR malclasif.
18
16
34
OR = 2,4
No expuestos
5
40
S=0.9 E=0.8
45
2
64
S=0.9 E=0.8
66
Malaclasificación diferencial
Ocurre cuando el grado de error en la
clasificación de la exposición depende del
desenlace (ser caso o control)
La malaclasificación diferencial puede sesgar
la asociación en cualquier dirección
Habrá malaclasificación diferencial
cuando la S y la E de la clasificación de
la exposición sean diferentes para los
casos y los controles
Efecto de la MALACLASIFICACIÓN DIFERENCIAL en la OR
Sensibilidad=0.96 en EXP y 0.70 en NO EXP; Especificidad=1.0
casos
Distribución
verdadera
2
Exp No Exp
50
Distribución observada
en el estudio
48
0
Expuestos
No expuestos
controles
Exp No Exp
50
50
S=0.96 E=1.0
OR
verdadera
20
50/50 = 4,0
20/80
80
OR malclasif.
48
14
52
6
0
14
80
86
S=0.70 E=1.0
48/52 = 5,7
14/86
Regresión a la media
Fenómeno por el cual una variable con un valor
extremo tiende a tener valores más cercanos a los
valores centrales de su distribución en sucesivas
mediciones
Ej.: en evaluación de intervenciones en individuos
con parámetros anormalmente altos
(hipercolesterolemia) necesario un grupo control,
realizar varias mediciones
Sesgo o falacia ecológica
Recordatorio
Cuando se hacen inferencias a nivel individual a partir de
información procedente del nivel ecológico,
debido a que existe heterogeneidad en la exposición y los
efectos entre los individuos que forman el grupo.
R2=0,97
Tasa de suicidio
30
15
·
·
·
·
0
0
0,5
1
% de protestantes
Tasa Suicidio
Prot.
?
Catól.
?
SESGO…
Siempre potencialmente presente…
 es necesario preverlo, anticiparlo
 diseño y ejecución del estudio
 es necesario identificarlo
análisis del estudio
 A veces se puede controlar
 análisis del estudio
Recapitulación
1. Validez interna y externa
Validez interna
Grado en el que los resultados de un estudio son
correctos para los sujetos estudiados.
Validez externa
La capacidad de extrapolación o traslación de los
resultados del estudio a una población diferente.
Recapitulación
Error aleatorio (azar)
Diferencia debida al azar
entre la estimación
obtenida en el estudio y el
parámetro que se pretende
estudiar.
Error
2. Error aleatorio y sistemático
Error
aleatorio
Error sistemático
Tamaño del estudio
Error sistemático (sesgo)
Desviación sistemática y no debida al azar de
la medida o de los resultados de un estudio.
Recapitulación
3. Validez y fiabilidad
Validez
Grado de ausencia de error sistemático o
de sesgo
Fiabilidad
Grado de ausencia de errores aleatorios
Recapitulación
4. Sesgos
Cualquier hecho en el diseño o ejecución de un estudio
que hace que los resultados del estudio de desvíen o
se aparten de la realidad.
Sesgos de
selección
Distorsión del efecto medido debida a los
procedimientos usados para seleccionar a
los sujetos.
Sesgos de
información
Distorsión del efecto medido debida a los
procedimientos usados para obtener la
información y clasificar a los sujetos.
Recapitulación
5. Sesgo de selección
• autoselección
• no respuesta
• Berkson
• Neymann
• trabajador sano
Población de referencia
Enfermos
Expuestos
Sanos
Expuestos
Enfermos
No expuestos
Sanos
No expuestos
La muestra
no representa
a la población
diana
Muestra del estudio
Recapitulación
6. Sesgo de información
Sesgo debido a errores de
medición de la exposición
• recuerdo
• entrevistador
• entrevistado
Sesgo por regresión a la media
Falacia ecológica
Malaclasificación
 no diferencial
 diferencial
Epidemiología y demografía sanitaria
Bloque de epidemiología
Tema 15
Validez de los estudios
epidemiológicos. Sesgos
Dr. Esteve Fernández