Bioestadística en investigación
experimental con animales
Manuel André Virú Loza
Tesista de pregrado – Medicina Humana UNMSM
Puntos a tratar
• Conceptos básicos
– Experimental units, sample units
– Replications, subsamples, repetitions
– Error experimental (experimental error)
• Mean square residuals
– Accuracy, precision
• Cantidad de información (Amount of information: I)
– Control del error experimental: Eficiencia relativa (ER)
• Número requerido de replicaciones
• Modelos y la respectiva lógica de su estadística asociada.
Experimental units and replications
Experimental Units
Una unidad de material a la que se aplica el tratamiento.
Independientes entre ellas
Sample Units
El efecto del tratamiento es medida en una «unidad muestral»
Replications
Varias unidades experimentales tratadas de la misma manera
Subsamples
En algunos experimentos es necesario seleccionar «submuestras» de la unidad experimental
Dependientes entre ellas
Repetitions
Mediciones repetidas en la misma unidad experimental
Error experimental
Unexplained effect (in experimental terms): Experimental error
Ejemplo.: Varianza, Mean square residuals
Varianza
Error experimental
• Sistemático
– Conjunto de efectos consistentes que cambian las medidas
bajo estudio y pueden ser asignados a una fuente causal.
– Afectan los resultados en formas sistemáticas pero no
conocidas.
– Corregibles.
• Aleatorio
– Efectos debidos a fenómenos al azar, impredecibles.
Producen una variabilidad que no puede explicarse.
– No pueden corregirse (a menos que se plantee una posible teoría
causal).
Error experimental
• En la regresión o el one-way ANOVA una medida de
error experimental es el residual mean square
(
).
– Esta es una medida de la variabilidad inexplicada entre
las unidades experimentales luego de tener en cuenta la
variabilidad explicada (la regresión o el efecto de
tratamiento).
– Recordar que es un estimador de la varianza poblacional.
En diseños más complejos el mean square para el error
experimental puede ser denotado como
.
Precisión del diseño experimental
• Si es posible, todas las fuentes potenciales de
variabilidad deben tomarse en cuenta para el
diseño y el análisis.
• El diseño debe proveer suficientes unidades
experimentales para un error experimental
adecuado.
• Para determinar el tamaño apropiado del
experimento, se deben obtener estimados
preliminares de variabilidad.
Precisión del diseño experimental
Amount of information
Número de observaciones en un grupo de tratamiento
Varianza entre unidades en la población
Mean square error (
Standard error of the mean
)
Control del error experimental
• La eficiencia de 2 diseños experimentales puede compararse
calculando la eficiencia relativa (RE) del diseño 2 sobre el
diseño 1 (siendo el diseño 2 el que se espera sea el mejor).
y
: mean squares del error experimental para los diseños 1 y 2
y
: grados de libertad del error para los diseños 1 y 2
Required number of replications
(Sample size)
• Requisitos:
– Estimación de la varianza
– El effect size de importancia práctica y que debe ser
estadísticamente significativo.
– La potencia del test (1-β) o probabilidad de obtener significancia
para un efecto de determinado tamaño (effect size).
– El nivel de significancia (α), la probabilidad de error tipo I
– El tipo de prueba estadística.
Blocking
Diseño de bloques completo aleatorizado
• Tabla de ANOVA
Blocking
Diseño de bloques completo aleatorizado: dos o más unidades por tratamiento y
bloque
• Tabla de ANOVA
Se necesita mínimo 2 unidades experimentales para evaluar la interacción
(en este caso tratamiento x bloque)
Diseño Change-over o Cross-over
• Dos o más tratamientos asignados al mismo animal,
pero en diferentes periodos.
• El orden de asignación de tratamientos es aleatorio.
• Cada animal es utilizado como un bloque (block),
denominado generalmente sujeto de estudio.
• Dependiendo del tratamiento, puede ser bueno dar un
periodo de descanso.
• El número de tratamientos puede ser más grande que el
número de periodos, por lo que diferentes animales
reciben diferentes sets de tratamiento (entonces el
animal es un incomplete block).
Diseño Change-over simple
• Notar que una unidad experimental no es el sujeto o
animal, sino una medición realizada en el sujeto.
• Los sujetos pueden ser considerados como bloques, y el
modelo es similar a un modelo de bloques aleatorio.
• Tabla de ANOVA
Diseño Change-over con los efectos
de periodo y orden
• Tabla de ANOVA
Diseño Latin square
• Tabla de ANOVA para resultados
Diseño Change-over planteado como
varios latin squares
• Partición de las fuentes de variabilidad y sus
correspondientes grados de libertad:
Experimentos factoriales
El experimento factorial de dos factores
Experimentos factoriales
El experimento factorial de dos factores: Interacción entre factores
• Tabla de ANOVA para resultados
El diseño jerárquico o anidado
Hierarchical or nested design: El diseño jerárquico con 2 factores
• Tabla de ANOVA para resultados
Within B es un efecto no explicado o residual.
Análisis de covarianza
Ejemplo:
Análisis de covarianza
Análisis de covarianza
Diferencia entre las curvas de regresión
Mediciones repetidas
• El problema de las mediciones repetidas en el
mismo sujeto es que puede haber una correlación
entre las mediciones repetidas.
• Los modelos que se utilizan pueden tener los efectos
del periodo (tiempo) definido como variables
categóricas o continuas. También pueden incluir
varianzas y covarianzas homogéneas o heterogéneas
y covarianzas al definir estructuras de covarianza
apropiadas o funciones de covarianza.
Varianzas homogéneas y covarianzas
entre mediciones repetidas
• Abordaje de las varianzas
– Esta estructura de varianza – covarianza se denomina: Compound symmetry
Varianza «dentro de» los sujetos
Covarianza entre mediciones «dentro de» los sujetos = varianza entre sujetos
Varianza entre observaciones
• Otro ejemplo:
Varianzas heterogéneas y covarianzas
entre mediciones repetidas
• Abordaje de las varianzas
– Esta estructura de varianza – covarianza se denomina: Unstructured model (es el
modelo más general)
Varianza de medidas en el periodo i
Covarianza «dentro de» los sujetos entre las mediciones en los periodos i y j
Varianzas heterogéneas y covarianzas
entre mediciones repetidas
• Abordaje de las varianzas
– Esta estructura de varianza – covarianza se denomina: Modelo autorregresivo (este
asume que cuanto más grande la distancia entre periodos, las correlaciones son
más pequeñas)
– La correlación es
, donde t es el número de periodos entre mediciones.
Varianza «dentro de» los sujetos
Correlación «dentro de» los sujetos entre mediciones tomadas entre periodos t
0,1,2,3
Varianzas heterogéneas y covarianzas
entre mediciones repetidas
• Abordaje de las varianzas
– Esta estructura de varianza – covarianza se denomina: Toeplitz structure.
– En este modelo las correlaciones entre las mediciones también dependen del
número de periodos. Las medidas tomadas en intervalos de un periodo tienen la
misma covarianza , las medidas en intervalos de dos periodos tienen la misma
covarianza pero diferente a la primera.
– Ejemplo.:
;
Varianza «dentro de» los sujetos
Covarianzas entre medidas «dentro de»
los sujetos
• ¿Qué modelo escoger?. Ejemplo:
AIC: Akaike information criteria
BIC: Swarz Bayesian information criteria (BIC)
Varianzas heterogéneas y covarianzas
entre mediciones repetidas
• Abordaje alternativo y el más flexible para las varianzas:
Regresión de coeficientes aleatorios (Random
coefficient regression).
• Asume que cada sujeto tiene su propia regresión
definida sobre el tiempo, por lo tanto se asume que los
coeficientes de regresión son una muestra aleatoria de
alguna población.
• La principal ventaja es que no es necesario que sea igual
el tiempo o la distancia entre mediciones, y el número
de observaciones por sujeto puede ser diferente.
Análisis de niveles de tratamiento
numéricos
Análisis de niveles de tratamiento
numéricos: Lack of Fit
Si el impacto del Lack of Fit es significativo, el modelo de regresión lineal simple no es el correcto
Análisis de niveles de tratamiento
numéricos: Lack of Fit
• Ejemplo:
Análisis de niveles de tratamiento
numéricos: Lack of Fit
Valor crítico
4,38
3,24
Análisis de niveles de tratamiento
numéricos: Polynomial Orthogonal Contrasts
• Del ejemplo anterior:
Análisis de niveles de tratamiento
numéricos: Polynomial Orthogonal Contrasts
Variables dependientes discretas
• Modelos Logit, regresión logística.
• Modelo Probit
– Conversión de la variable dependiente cuantitativa a
variable binomial
• Modelos Log-linear
– La variable es un número de unidades en alguna área o
volumen (usualmente no tiene una distribución normal y
la varianza no es homogénea).
– En estos casos se puede utilizar el modelo log-linear y la
distribución de Poisson.
Variables dependientes discretas
Modelos log-linear: la distribución de Poisson
• La distribución de Poisson es un modelo para la
frecuencia relativa de eventos raros y datos definidos
como conteos y frecuentemente es utilizada para la
determinación de la probabilidad de que algún evento
ocurra en un tiempo, volumen o área específica.
• POR EJEMPLO:
– El número de microorganismos en un campo de
microscopio.
– El número de mutaciones.
– Distribución de animales de algún terreno.
• Si sabemos que cada evento único ocurre con la misma
probabilidad, es decir, la probabilidad de que un evento
ocurrirá es igual en cualquier parte del tiempo, volumen o
área, y el número esperado de eventos es , luego la función
de probabilidad está definida como:
Número promedio de éxito en un tiempo, volumen o área
Base del logaritmo natural
• Una característica de la variable de Poisson es que tanto la
expectancia como la varianza son iguales al parámetro .
Bibliografía
• Kaps, M; Lamberson, W. Biostatistics for Animal
Science. CABI Publishing. Oxfordshire UK 2004.
Disponible en:
http://www.4shared.com/office/sakX6Pwl/file.html
Descargar

para ver las diapositivas