Predeterminación del tamaño
muestral
Iñaki Pérez
Estadístico
Unidad de Desarrollo Clínico
J. Uriach y Compañía S.A.
Metodologia Estadistica Aplicada a la Investigacion Clinica
Sumario
2
 ¿Por
qué?
 Procedimiento
 Software
 Ejemplos
Metodologia Estadistica Aplicada a la Investigacion Clinica
Necesidad del cálculo de tamaño muestral
3

Ensayo Clínico

Estudio Epidemiológico

Estudio Observacional

Encuesta
Metodologia Estadistica Aplicada a la Investigacion Clinica
Necesidad del cálculo de tamaño muestral
4

Ensayo Clínico

Estudio Epidemiológico

Estudio Observacional

Encuesta
Metodologia Estadistica Aplicada a la Investigacion Clinica
Sumario
5
Metodologia Estadistica Aplicada a la Investigacion Clinica
Muestra de la población
6
Muestra
Población en estudio
Población diana
Metodologia Estadistica Aplicada a la Investigacion Clinica
Muestra de la población
7
Metodologia Estadistica Aplicada a la Investigacion Clinica
Tamaño muestral: ¿Por qué?
8

El principio general que justifica trabajar con
muestras es que resulta más barato, más rápido y
más fácil que hacerlo con poblaciones completas
Éticos
Económicos
Científicos
El número de pacientes
necesario para contestar
adecuadamente las
preguntas
Suficiente para detectar
las diferencias si existen
realmente
Incrementar pacientes incrementa
proporcionalmente el coste
del estudio
Metodologia Estadistica Aplicada a la Investigacion Clinica
Tipos de muestreo
9
Muestreo aleatorio simple
• Cada sujeto tiene la misma probabilidad de ser incluido en la muestra
• El más utilizado
• Evita sesgos
Muestreo estratificado
• Se clasifica a los individuos según variables conocidas de interés (sexo,
grupos etarios,…)
• Muestreo simple dentro de cada estrato
• Mayor precisión pero análisis más complicado
Muestreo por conglomerados
• Se clasifica a los individuos según grupos (familías, escuelas, barrios,…)
• Selección de los grupo y de todos los individuos que lo componen
Metodologia Estadistica Aplicada a la Investigacion Clinica
El tamaño de la muestra depende de...
10

Las características, objetivos y diseño del estudio

La(s) variable(s) principal(es) y distribución de referencia

La magnitud del efecto del tratamiento ( ó ) a detectar

La variabilidad de la medida o imprecisión

Contraste de hipótesis (pruebas de hipótesis)

Los errores de Tipo I y II y el poder (,  y 1-)

La tasa de retiradas del estudio y pérdidas de seguimiento
Metodologia Estadistica Aplicada a la Investigacion Clinica
Características, objetivos y diseño
11
Estimación de parámetros
poblacionales
Prevalencia de migraña en la
población
Promedio de las cifras de
colesterol en la población infantil
Riesgo relativo de padecer
retinopatia en los diabéticos tipo I
frente a los de tipo II
Contraste de hipótesis
Podría un programa de
vacunación reducir la mortalidad
infantil en más de un 15%
Es diferente la eficacia analgésica
de A en relación a B
Está asociada la
microalbuminuria con las cifras de
TA
Metodologia Estadistica Aplicada a la Investigacion Clinica
Estimación por intervalos de confianza
12
Información de la muestra
Características de la población
Estadísticos
X s p OR
Parámetros
μσπω
Metodologia Estadistica Aplicada a la Investigacion Clinica
Estimación de parámetros (población infinita)
13
Queremos estimar una proporción en una población de origen
¿Qué tamaño de la muestra deberíamos tomar?
k p1 (1  p1 )
2
n
w
2
 K: Factor relacionado con la confianza
 p1: previsión del resultado
 w: Imprecisión (error) admisible en la estimación
Metodologia Estadistica Aplicada a la Investigacion Clinica
Estimación de parámetros (población finita)
14
Queremos estimar una proporción en una población de origen
¿Qué tamaño de la muestra deberíamos tomar?
k p1 (1  p1 ) N
2
n




w ( N  1)  K p1 (1  p1 )
2
Muestra representa más de 5% del total de la población
K: Factor relacionado con la confianza
p1: previsión del resultado
w: Imprecisión (error) admisible en la estimación
Metodologia Estadistica Aplicada a la Investigacion Clinica
Distribución del estadístico p1 en el muestro
15
 
p1 (1  p 1 )
n
π
-w
w  Kn  k
p1 (1  p1 )
n
p1
+w
k p1 (1  p1 )
2
n
w
2
Metodologia Estadistica Aplicada a la Investigacion Clinica
Valores de K y niveles de confianza
16
K
Nivel de confianza
3.29
0.999
2.8
0.995
2.58
0.99
2.32
0.98
2.24
0.97
1.96
0.95
1.64
0.90
1.28
0.80
1.03
0.70
0.84
0.60
0.67
0.50
0.52
0.40
0.38
0.30
0.25
0.20
Metodologia Estadistica Aplicada a la Investigacion Clinica
Ejemplo 1: Estimación de proporciones
17
¿ Cual es el número de niños en edad escolar que es necesario
analizar para estimar la prevalencia de la dislexia ?
 K: nivel de confianza de 95% =1.96
 p1: previsión del resultado = 10%
 w: imprecisión (error) admisible en la estimación = 3%
k p1 (1  p1 )
2
n
w
2
2

1 . 96 * 0 . 10 * 0 . 90
0 . 03
2
 385 niños
Metodologia Estadistica Aplicada a la Investigacion Clinica
Ejemplo 2: Y si la realidad es diferente…
18
Disléxicos (n=385)
Prevalencia
Imprecisión
4
0.01
0.01
19
0.05
0.02
39
0.1
0.03
77
0.2
0.04
116
0.3
0.05
La imprecisión aumenta con resultados hacia el 50%
Metodologia Estadistica Aplicada a la Investigacion Clinica
Ejemplo 3: Estimación de proporciones (finita)
19
¿ Cual es el número de niños en edad escolar que es necesario
analizar para estimar la prevalencia de la dislexia ?
 K: nivel de confianza de 95% =1.96
 p1 : previsión del resultado = 10%
 w: imprecisión (error) admisible en la estimación = 3%
k p1 (1  p1 ) N
2
n
w ( N  1)  K p1 (1  p1 )
2
 202
Metodologia Estadistica Aplicada a la Investigacion Clinica
Ejemplo 4: Estimación de medias
20
¿ Cuál es el número de casos que es necesario analizar para
estimar la media de la densidad en mujeres postmenopausicas
(<55 años) ?
 K: nivel de confianza de 95% =1.96
 X : media esperada = 1050 mg/ml
 σ : desviación típica se asume que es 100 mg/ml
 w: imprecisión máxima aceptable es +- 25 mg/ml
n
z
2
1  / 2
w
2

2
2

1.96 *100
25
2
2
 62
Metodologia Estadistica Aplicada a la Investigacion Clinica
Ejemplo 5: Estimación de OR
21
¿ Qué tamaño de muestra se necesitaría en cada uno de los
grupos de un estudio de casos-controles para estimar el OR con
un IC de 0.95 ?





z
: nivel de confianza de 95% =1.96
OR esperado = 2
p1 : proporción de expuestos en los controles = 0.30
p2 : proporción de expuestos en los casos = 0.46
w: imprecisión máxima aceptable es +- 0.50
1  / 2
lim inf (O R )  2  0.5  1.5
w  L nO R  L n ( O R / lim inf O R )  0.2876
2
 z 1  / 2   1
1
1
1 
n



  409
 
p2 1  p2 
 w
  p1 1  p1
Metodologia Estadistica Aplicada a la Investigacion Clinica
Estimación de RR
22
2
 z 1   / 2   1  p1 1  p 2 
n


 
p2 
 w
  p1
w  L nR R  L n ( R R / lim inf R R
Metodologia Estadistica Aplicada a la Investigacion Clinica
Características, objetivos y diseño
23
Estimación de parámetros
poblacionales
Prevalencia de migraña en la
población
Promedio de las cifras de
colesterol en la población infantil
Riesgo relativo de padecer
retinopatia en los diabéticos tipo I
frente a los de tipo II
Contraste de hipótesis
Podría un programa de
vacunación reducir la mortalidad
infantil en más de un 15%
Es diferente la eficacia analgésica
de A en relación a B
Está asociada la
microalbuminuria con las cifras de
TA
Metodologia Estadistica Aplicada a la Investigacion Clinica
Fórmula intuitiva
24
N=
K
A (Variabilidad)
B (Tamaño del efecto)
25
ALTURA
300
200
100
Fre cu e n cia
Metodologia Estadistica Aplicada a la Investigacion Clinica
Ejemplo : Pigmeos vs jugadores de basket (1)
Desv. típ. = 25.54
Media = 16 5.1
0
N = 20 00.0 0
12 12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20
2. 7. 2. 7. 2. 7. 2. 7. 2. 7. 2. 7. 2. 7. 2. 7. 2.
5
5 5
5
5 5
5
5
5 5
5
5 5
5
5 5
5
ALTURA
Pigmeos
140(5)
Jugadores Basket
190(5)
300
200
Fre cu e n cia
100
Desv. típ. = 26.94
Media = 16 5.0
N = 20 00.0 0
0
0.
22
0
0
0
0
0
0.
21
0.
17
0
0
0.
16
0
0.
20
0.
15
0
0
0.
14
0
0.
19
0.
13
0
0.
18
0.
12
26
ALTURA
0.
11
Metodologia Estadistica Aplicada a la Investigacion Clinica
Ejemplo : Pigmeos vs jugadores de basket (2)
ALTURA
Pigmeos
140(10)
Jugadores Basket
190(10)
27
ALTURA
Fórmula intuitiva
120
100
N=
80
60
Fre cu e n cia
40
Desv. típ. = 32.27
20
Media = 16 5.1
N = 20 00.0 0
0
0
0.
2 5 .0
0
2 4 .0
0
2 3 .0
0
2 2 .0
0
2 1 .0
0
2 0 .0
0
1 9 .0
0
1 8 .0
0
1 7 .0
0
1 6 .0
0
1 5 .0
0
1 4 .0
0
1 3 .0
0
1 2 .0
0
1 1 .0
0
10
.0
90
.0
80
Metodologia Estadistica Aplicada a la Investigacion Clinica
Ejemplo : Pigmeos vs jugadores de basket (3)
ALTURA
Pigmeos
140(20)
Jugadores Basket
190(20)
K
A
B
Metodologia Estadistica Aplicada a la Investigacion Clinica
El tamaño de la muestra depende de...
28

Las características, objetivos y diseño del estudio

La(s) variable(s) principal(es) y distribución de referencia

La magnitud del efecto del tratamiento ( ó ) a detectar

La variabilidad de la medida o imprecisión

Contraste de hipótesis (pruebas de hipótesis)

Los errores de Tipo I y II y el poder (,  y 1-)

La tasa de retiradas del estudio y pérdidas de seguimiento

Metodologia Estadistica Aplicada a la Investigacion Clinica
Objetivos
29

Eficacia (superioridad/no inferioridad) y/o Seguridad y
tolerabilidad

Determinación del perfil farmacocinético

Biodisponibilidad relativa /bioequivalencia / Interacción
con alimentos

Búsqueda de dosis

Eficacia y/o Seguridad en determinadas poblaciones (por
edades, sexos, etc.)

Dos parametros bioquímicos están asociados
Metodologia Estadistica Aplicada a la Investigacion Clinica
Diseño (1)
30
a) Paralelo randomizado
P la c e b o (P L ) y / o F R
A

R
N
D
B
C
D
FR: Fármaco de referencia
Metodologia Estadistica Aplicada a la Investigacion Clinica
Diseño (2)
31
b) Cruzado randomizado
P e rio d o s

R
N
D
S e cu e n cia
1
2
3
4
I
A
B
PL
C
II
B
C
A
PL
III
C
PL
B
A
IV
PL
A
C
B
Metodologia Estadistica Aplicada a la Investigacion Clinica
Diseño (3) : Efecto diseño
32
Diseño paralelo versus cruzado
Diseño

DE
2.64
0.2
1.74
2.64
0.1
1.74
Dif.
2
1
Paralelo
28
109
Cruzado
16
57
2
13
8
1
49
26
2
38
20
1
146
75
2
17
10
1
64
34
Procedimiento
Características, objetivos y diseño del estudio
Metodologia Estadistica Aplicada a la Investigacion Clinica
Diseño (4). Tipos de comparación entre tratamientos
33

Superioridad

E
Equivalencia
C

C
No-inferioridad
E
C
E
Metodologia Estadistica Aplicada a la Investigacion Clinica
Variable principal
34



La hipótesis de trabajo se centra en una variable de interés que
puede ser categórica o continua
El teorema central del límite permite aproximar las distribución de
la proporción o de las medias de todas las muestras posibles
mediante la distribución normal cuando n> 30 sujetos
En caso contrario se deben contemplar distribuciones como
binomial exacta, la de Poisson, la de Student, etc
Procedimiento
Variable Principal de eficacia
Metodologia Estadistica Aplicada a la Investigacion Clinica
Variable principal: Ejemplos
35

Porcentaje de pacientes que experimentan como mínimo un
acontecimiento cardíaco: muerte por cualquier causa o infarto de
miocardio agudo o revascularización

Porcentaje de pacientes que experimentan una mejoría del dolor
de cabeza a las dos horas de la administración del fármaco

Valoración del dolor por el paciente mediante una Escala
Analógica Visual (EAV) en mm; 0 = sin dolor, 100 = máximo dolor

Presión arterial diastólica en mm de Hg
Metodologia Estadistica Aplicada a la Investigacion Clinica
La magnitud del efecto del tratamiento
a detectar y variabilidad de los datos
36
 Magnitud del efecto del tratamiento a detectar ( ó ):
 ó  =  E - C 
donde, E es el efecto del tratamiento experimental y C es el
efecto del tratamiento control o estándar
 Variabilidad de los datos (variabilidad = 2):
 2 =  2E +  2C
Si desconocemos la 2E, entonces 2 = 2C
Metodologia Estadistica Aplicada a la Investigacion Clinica
La magnitud del efecto del tratamiento
a detectar : Efecto lupa
37
Diferencias
reales
Diferencias reales
diminutas
Diferencias reales
gandes
Metodologia Estadistica Aplicada a la Investigacion Clinica
Contraste de hipótesis: clases
38
Bilateral (dos colas)
Ho: E - C = 0
H1: E - C  0
Unilateral (una cola)
Ho: E - C = 0
H1: E - C > 0 ó H1: E - C < 0
Metodologia Estadistica Aplicada a la Investigacion Clinica
Los errores de Tipo I, II y el poder
39
Realidad
Bilateral (dos colas)
Ho: E - C = 0
H1: E - C  0
Ttos. Iguales
Conclusión
Ttos. Diferentes




Ttos. Iguales
Ttos. Diferentes
Acierto
Error tipo II
()
Error tipo I
()
Acierto
Error tipo I (): La probabilidad de rechazar la hipótesis nula siendo
verdadera
El valor del error tipo I ó  es igual o inferior a 0.05 (5%)
Error tipo II (): La probabilidad de aceptar la hipótesis nula
siendo falsa
El valor del error tipo II ó  es igual o inferior a 0.20 (20%)
Metodologia Estadistica Aplicada a la Investigacion Clinica
Tasa de pérdidas de seguimiento
40
 La tasa de pérdidas de seguimiento es el porcentaje de sujetos que
abandonan el estudio
 La relación entre el tamaño de la muestra ajustado (n’) y la tasa de
abandonos (d) es la siguiente:
n’ =
n
1 - d
donde n es el tamaño de la muestra estimado
Metodologia Estadistica Aplicada a la Investigacion Clinica
Tamaño de la muestra
41
¿Qué información se necesita para la estimación del tamaño de la
muestra ?




Magnitud del efecto del tratamiento a detectar ()
Variabilidad de las observaciones (2 )
Errores Tipo I y II ( y )
Relación:
Tamaño de la muestra =
C  2
()2
donde C es una función de  y : f(, )
Metodologia Estadistica Aplicada a la Investigacion Clinica
Fórmulas : parámetros a decidir
42
 =(E-C) es la diferencia clínicamente relevante entre tratamientos
que se quiere detectar
 s2 es, normalmente, desconocida y es estimada en el momento del
análisis. Sin embargo, debe ser estimada antes del inicio del
estudio
 Los valores de  ( 0.05),  ( 0.20) y el poder (1-) ( 0.80)
Metodologia Estadistica Aplicada a la Investigacion Clinica
Valores de f(, )
43
f(, ) = (U  + U )2
 (1 cola)
0.050
0.025
0.005
 (2 colas)
0.100
0.050
0.010
0.200
6.183
7.849
11.679
0.100
8.564
10.507
14.879
0.050
10.822
12.995
17.814
 (1 cola)
Metodologia Estadistica Aplicada a la Investigacion Clinica
Fórmulas
44
 Comparación de medias :
n
2s
2
(X E  XC )
2
f ( ,  )
 Comparación proporciones :
n=
pE (1 - pE) + pC (1 - pC)
(pE - pC
)2
f(, )
n = número de sujetos por grupo de tratamiento
Metodologia Estadistica Aplicada a la Investigacion Clinica
Fórmulas : distribución normal
45









2
Tratamiento experimental: E
2s
n 
f ( ,  )
2
Tratamiento control: C
(X E  XC )
E es la verdadera media de E
X E es la estimación de E
c es la verdadera media de C
X C es la estimación de C
  ( X E  X C )es una estimación de (E - C)
(X E  XC~
) N ((E - C), 2 2/n)
s2 es la estimación de la verdadera varianza (variabilidad) entre
pacientes en un mismo tratamiento (2) :
S  SC  S E
2
2
2
Metodologia Estadistica Aplicada a la Investigacion Clinica
Ejemplo 6: Comparación de medias (dist. Normal)
46
Queremos comparar el cambio de la presión arterial de un nuevo fármaco
frente a placebo. Esperamos encontrar una diferencia de 5 mmHg, con una
desviación estándard de 10 mmHg ¿cuántos pacientes son necesarios para un
ensayo con =0.05 bilateral y un poder de 1-=0.9?
 = 0.05 de dos colas
XE
XC
¿
¿
Bilateral (dos colas)
H o:  E -  C = 0
H1:  E -  C  0
Poder = (1 -  ) = 0.90 f( , )=10.507
s
10
  (X E  XC )
5
n grupo 
2s
2
(X E  XC )
n g ru p o 
2 (1 0 )
(5)
2
n por grupo
84
2
f ( ,  )
2
1 0 .5 0 7  8 4
Metodologia Estadistica Aplicada a la Investigacion Clinica
Fórmulas : datos binarios (porcentajes)
47
n=
pE (1 - PE) + pC (1 - PC)
f(, )
 Tratamiento experimental: E
(pE - pC)2
 Tratamiento control: C
 PE es la verdadera proporción de sujetos que presentan un
determinado evento en E
 En la fórmulas, pE es la estimación de PE
 PC es la verdadera proporción de sujetos que presentan un
determinado evento en C
 En la fórmulas, pC es la estimación de PC
 = (pE - pC) es una estimación de (PE - PC)
 s2 es la estimación de la verdadera varianza (variabilidad) entre
pacientes en un mismo tratamiento (2) :
S  pC (1  pC )  pE (1  pE )
2
Metodologia Estadistica Aplicada a la Investigacion Clinica
Ejemplo 7: Comparación de proporciones
48
Se está planteando un ensayo con estimulación eléctrica transcutánea (EET)
para el alivio de dolor en pacientes con osteoartritis en base a resultados
preliminares que obtuvieron un 25% de respuesta con placebo y un 65% con
EET ¿cuántos pacientes son necesarios para un ensayo con =0.05 bilateral y
un poder de 1-=0.9?
 = 0.05 de dos colas
pE
65
Poder = (1 -  ) = 0.90
pC
25
Bilateral (dos colas)
H o:  E -  C = 0
H 1:  E -  C  0
n=
n=
90 f( , )=10.507
(%)
40
n por grupo
30
pE (1 - PE) + pC (1 - PC)
(pE - PC
)2
f(, )
0.65 (1 – 0.65) + 0.25 (1 – 0.25)
(0.65 –
0.25)2
10.507
Metodologia Estadistica Aplicada a la Investigacion Clinica
Ejemplo : magnitud del efecto
49
El tamaño de la muestra depende del valor de la magnitud del efecto  =E - C y 2 :
 = 0.05 de dos colas
XE
20
30
20
30
Poder = (1 -  ) = 0.90 f( , )=10.507
XC
  (X E  XC )
10
20
10
20
10
10
10
10
 = 0.05 de dos colas
pE
20
30
40
50
pC
10
20
30
40
s
25
25
30
30
Poder = (1 -  ) = 0.90
(%)
10
10
10
10
n por grupo
133
133
191
191
f( , )=10.507
n por grupo
266
392
477
519
Metodologia Estadistica Aplicada a la Investigacion Clinica
Ejemplo : Tasa de pérdidas de seguimiento
50
Terapia
estándar (%)
Terapia
experimental (%)
10
9.0
8.5
8.0
7.5
Reducción (%)
10
15
20
25
(%)
No. de pacientes
(2 tratamientos)
Poder
1.0
1.5
2.0
2.5
0.80
26990
11712
6426
4010
Si la tasa de pérdidas esperada es del 25%:
n’ =
26990
1 - 0.25
= 35987 pacientes
0.85
30874
13396
7352
4586
Metodologia Estadistica Aplicada a la Investigacion Clinica
K> 2 grupos a comparar (1)
51
 ¿Y si tenemos más de dos grupos comparar ?
 Existen varios métodos para el cálculo de la N
 NQuery 4.0 realiza cálculos de N para más de un grupo en
determinados casos:
 Comparación de Medias
 Comparación de Proporciones
 NO realiza cálculos para Supervivencia, Asociación o
Regresión
Metodologia Estadistica Aplicada a la Investigacion Clinica
K> 2 grupos a comparar (2)
52

Habitualmente Bonferroni:
 

Pero en realidad es:

n
  1  (1   )

Pero tranquilos, no hay grandes diferencias!!!!
n
Metodologia Estadistica Aplicada a la Investigacion Clinica
Software
53



nQuery Advisor 4.0
Statistical Solutions
www.statsol.ie/nquery/nquery.htm
Se puede descargar un versión “Demo”
Granmo
IMIM
http://www.imim.es/software/cat
Libre utilización
ENE
http://www.e-biometria.com/ene-ctm/index.htm
Servicios y Productos Bioestadísticos de GSK en España
Descargar

Tamaño de la muestra