SUPUESTOS DEL
ANALISIS DE VARIANZA
Mario Briones L.
MV, MSc
2005
Principales supuestos
Los términos del error son aleatoria,
independiente y normalmente
distribuidos.
 Las varianzas de los diferentes
grupos son homogéneas.
 Las varianzas y los promedios de los
grupos no están correlacionados.
 Los efectos principales son aditivos.

Normalidad
Las desviaciones de la normalidad
no afectan seriamente la validez del
análisis.
 Independencia significa que no hay
relación entre el tamaño de los
términos de error y el grupo al cual
pertenecen.

Homogeneidad de las
varianzas
El análisis de varianza utiliza un
cuadrado medio de error combinado,
para obtener la mejor estimación de
una varianza común a todos los
grupos.
 Si las varianzas entre los grupos son
diferentes no hay justificación para
combinarlas.

Homogeneidad de las
varianzas

Ejemplo
Varianzas iguales
m
Hipótesis nula
verdadera
m1 m2 m3 m4
Hipótesis nula
falsa
No existen problemas si las varianzas son iguales
entre los grupos.
Homogeneidad de las
varianzas

Ejemplo
Varianzas diferentes
m
Hipótesis nula
verdadera
m1 m2 m3
m4
Hipótesis nula
falsa
No existen problemas si las varianzas son iguales
entre los grupos.
Ejemplo
A
3
1
5
4
2
PROMEDIO
S2
3
2.5
tratamientos
B
C
6
12
8
6
7
9
4
3
5
15
6
2.5
9
22.5
D
20
14
11
17
8
14
22.5
Tabla de Análisis de
Varianza
ANÁLISIS DE VARIANZA
FV
SC
Entre grupos
330
Dentro de los grupos 200
Total
530
GL
CM
3
16
F
110
12.5
Probabilidad
8.8 0.00111862
19
LSD (diferencia mínima significativa, la menor
diferencia entre dos grupos que será estadísticamente
significativa.
LSD  t CM
ERROR
 1
1 
1 1


 n  n  LSD  2 . 12 12 . 5  5  5   4 . 74


2 
 1
Conclusión
La diferencia mínima significativa es
razonable para la diferencia entre
los promedios de C y D pero no lo es
para los promedios Ay B.
 La solución es analizar los grupos AB
y CD por separado.

ANÁLISIS DE VARIANZA entre A y B
FV
SC
gl
Entre grupos
22.5
1
Dentro de los grupos
20
8
Total
42.5
242.5
F
22.5
2.5
Probabilidad
9 0.01707168
9
ANÁLISIS DE VARIANZA entre C y D
FV
SC
gl
Entre grupos
62.5
1
Dentro de los grupos 180
8
Total
CM
9
CM
F
Probabilidad
62.5 2.77777778 0.13414064
22.5
Independencia de medias y
varianzas
A veces existe una relación definida
entre las muestras y sus varianzas.
 Generalmente invloucra mayor
varianza para las muestras que
tienen mayor promedio.

Independencia de medias y
varianzas

Ej. Aplicación de insecticidas para el
control de garrapata en el perro



Dos tratamientos poco efectivos: 305 y 315
garrapatas sobrevivientes
Dos tratamientos efectivos: 5 y 15 garrapatas
sobrevivientes.
Si las varianzas son homogéneas y no
relacionadas con las medias, ambas
diferencias tienen la misma importancia dado
que tienen la misma magnitud.
Independencia de medias y
varianzas
Otro ejemplo: un investigador desea
probar el efecto de una nueva
vitamina sobre el peso de animales
y desea incluir varias especies para
darle amplitud a sus inferencias.
 Las magnitudes de las diferencias de
interés en las diferentes especies
son completamente diferentes.

Supuesto de Aditividad





Cada diseño experimental tiene un
modelo matemático denominado modelo
lineal aditivo.
Ej. En un análisis con un factor como
causa de variación:
Yij= m+Ai+eij
En un análisis con dos factores (ej.
Tratamiento y bloque:
Yijk= m+ Ai+Bj+eijk

Modelo lineal aditivo significa que la
varianza de una observación
individual (Y), perteneciente a una
estructura clasificada de datos, es
función de la media poblacional m,
MAS los efectos de las diferentes
clasificaciones y el error residual
asociado a las observaciones ya
clasificadas

Por ejemplo, en un diseño en bloque
al azar, la linearidad implica que el
efecto de un tratamiento es el
mismo en todos los bloques y que el
efecto de bloque es el mismo para
todos los tratamientos.
Prueba de Bartlett para
homogeneidad de varianzas

El test de Bartlett tiene distribución
de Chi cuadrado con un grado de
libertad y es igual a
X
2
0
 2 . 3026
q
c
Estadístico de Bartlett:
a
q  ( N  a ) log
S P   ( n i  1) log
2
10
2
10
i 1
Si
 a
1
1 
c  1
  ( n i  1)  ( N  a ) 
3 ( a  1)  i 1

1
a
SP 
i

( n i  1) S i
2
i 1
N a
N= total de observaciones
a= número de grupos
S2 = varianza muestreal del i ésimo grupo
En Internet:
home.ubalt.edu/ntsbarsh/Business-stat/otherapplets/BartletTest.htm
Realiza comparación de homogeneidad de varianzas
hasta en 14 grupos.
Se ingresa el número de observaciones por grupo y la
varianza
Transformaciones

Transformaciones de escala de los
datos permiten corregir muchas de
las violaciones de los supuestos
Transformación logarítmica
Cada vez que las desviaciones
estándares (NO LAS VARIANZAS
sean proporcionales a los
promedios, la transformación más
apropiada será la logarítmica.
 También en casos que exista
evidencia de efectos multiplicativos
en lugar de aditivos.

Transformación logarítmica




Cualquier logaritmo sirve, base 10 es el
más utilizado.
Cuando existen ceros, reemplazan por 1.
Si hay muchos ceros no es conveniente
utilizar esta metodología.
Antes de la transformación es posible
multiplicar todos los datos por una
constante.
Transformación de raíz
cuadrada

Normalmente se aplica cuando se trata de
números que registran acontecimientos
poco comunes.



Observaciones de animales en transectos.
Animales muertos en diferentes grupos.
Se calcula directamente la raíz cuadrada y se
hace el ANDEVA o bien se utiliza la siguiente
expresión para valores menores a 10
X ´
X 
1
2
Transformación angular o
de Bliss

Se efectúa para analizar datos de
porcentajes, en los cuales, de modo
natural, la varianza no es
homogenea.
Se saca raiz de la proporción (no del
porcentaje).
 Se saca seno inverso del resultado.

Transformación angular o
de Bliss
porcentajes proporción
30
0.3
32
0.32
45
0.45
65
0.65
47
0.47
50
0.5
raiz cuadrad seno inverso
0.54772256
33.21
0.56568542
34.45
0.67082039
42.13
0.80622577
53.73
0.68556546
43.28
0.70710678
45.00
Formula del seno inverso= ASENO(X)*180/PI()
Descargar

SUPUESTOS DEL ANALISIS DE VARIANZA