Ecología Molecular – Clase 4
Flujo génico en
poblaciones estructuradas
Diversidad genética
Cromosoma
DNA
…
…
G
A
TC
Individuo
CT
AG
C
G
G
C
Alelo a
un locus
Población
Diversidad genética
Cromosoma
DNA
…
…
G
A
CT
AG
C
G
G
C
Estructura
Alelo a
un locus
Población
inferencia
TC
Individuo
50 km
La diferenciación genética
1. Mecanismo
2. Detección
Las fuerzas evolutivas
Factores que cambian las frecuencias génicas en las poblaciones
Selección
natural
Deriva
genética
Pool génico
Mutaciones
Flujo
genético
Deriva genética
población
t
N
pt = 0.5
Binomial sampling (N, pt)

p = 0.5
Pool
alélico
población
t+1
N
pt+1 = 0.6
Cambios en frecuencias alélicas
p
(
1

p
)
t
t
Var(
Np
)

Np
(
1

p
)

Var(
p
)

t

1
t
t
t

1
N
2N = 18
2N = 36
Diferenciación: cambios aleatorios independientes en distintas poblaciones
La diferenciación genética
1. Mecanismo
2. Detección
- Distribución de los alelos entre poblaciones
- Calculo de un índice de diferenciación
A
a
p1 q1
n2
n1
?
A
a
p2 q2
A
a
Pob1
n1p1
n1q1
n1
Pob2
n2p2
n2q2
n2
Σ
Σ
A
a
30
0,3 0,7 20
?
A
a
0,6 0,4
A
a
Pob1
6
14
20
Pob2
18
12
30
24
26
(obs

esp
)
 
esp
2
2
6
14
20
9,6
10,4
20
18
12
30
14,4
15,6
30
24
26
24
26
Critical values of chi-square for df= 3
[.050]
[.025]
[.010]
[.005]
[.001]
7.81
9.35
11.35
12.84
16.27
  3,21
2
P  0,0732
Fisher´s Exact test
20
0
20
19
1
20
0
20
20
4
26
30
5
25
30
24
6
30
24
26
24
26
24
26
P1
P2
P21
Calculo de la probabilidad de cada tabla asumiendo una
distribución aleatoria de los alelos
20
0
20
19
1
20
0
20
20
4
26
30
5
25
30
24
6
30
24
26
24
26
24
26
P  0,0475
Generalización
Tabla de contingencia r x k
r poblaciones
k alelos
A
a
0,3 0,7 20
p

i
30
?
A
a
0,6 0,4
(p

p
)

i
2
(
0
,3

0
,6
)
p


0
,45
i
2

i
i
V

p
i
i
FST 
Vp
p(1p)
FST  0,091

0
,
0225
FST 
Vp
p(1p)
p = 0.5, Vp = 0, FST = 0
p = 0.5 , Vp = 0.25, FST = 1
A
a
30
0,3 0,7 20
A
a
0,6 0,4
FST  0,091
¿Y qué?
Permutaciones de los alelos y construcción de la
distribución de probabilidad de Fst
A a
p1 q1
A
a
p2 q2
n subpoblaciones
1. Conjunto
2. Por pares
A a
p3 q3
Análisis de la Varianza Molecular
(AMOVA)
Excoffier L., Smouse P.E. and Quattro J.M., 1992. Analysis of molecular variance inferred from metric distances
among DNA haplotypes: Application to human mitochondrial DNA restriction data. Genetics 131: 479-491
A
a
A
p2 q2
a
p5 q5
A a
A a
p1
q1
p4
q4
R
1
R
2
A a
A a
p3
q3
p6
q6
pR1
0
p1
pR1+R
2
p2 p3
pR2
p4
R1
p5
R2
R1 + R2
p6
1
6
(p
p
)

i
R
1

R
2
i
1
V

R
1

R
2
6
2
pR1+R
2
0
p1
p2 p3
p4
R1
p5
R2
R1 + R2
p6
1
6
3
(p

i p
R
2)
(p

i p
R
1)
2
2
V
i1
R
1
V
i4
R
2
3
pR1
0
p1
3
pR2
p2 p3
p4
R1
p5
R2
R1 + R2
p6
1
2
(p

p
)

Ri
R
1

R
2
i
1
V

R
1
/R
2
2
2
pR1
pR1+R
2
pR2
0
1
R1
R2
R1 + R2
A
a
3
(p

i p
R
1)
i
1
V

R
1
3
2
p2 q2
A a
p1 q1
6
(p

i p
R
2)
i
4
V

R
2
3
2
R1
A a
p3 q3
A
a
p5 q5
6
(p
p
)

i
R
1

R
2
i
1
V

R
1

R
2
6
2
A a
p4 q4
2
(p

p
)

Ri
R
1

R
2
R2
2
i
1
V

R
1
/R
2
2
A a
p6 q6
V
R
1
/R
2
F
(
R
1
/
R
2
)

ST
V
R
1

R
2
Proporción de la varianza total en las frecuencias alélicas,
debida a la subdivisión en 2 regiones.
V

V

V
V
R
1
/
R
2
R
1
R
2
R
1

R
2
F
(
R
1

R
2
)


ST
p
(
1

p
)
p
(
1

p
)
Índice de estructuración de la población total en regiones y
en sub-poblaciones dentro de regiones
Secuencias
π1/2
π1
π2
πT
πT = πinter + πintra
interintra
ST
total
 ST  1
 ST  0
Estructura genética vs filogeográfica
Frecuencias vs número de diferencias
FST : alto
FST : alto
ST : bajo
 ST : alto
Mya arenaria
AA Aa aa
p22 2p2q2 q22
p1,q1
p2,q2
AA Aa aa
p12 2p1q1 q12
p2,q2
AA Aa aa
p32 2p3q3 q32
Diploides
p1,q1
p2,q2
AA Aa aa
AA Aa aa
p12 2p1q1 q12
p22 2p2q2 q22
p3,q3
AA Aa aa
p32 2p3q3 q32
Tres poblaciones, cada una en equilibrio de HW
Pop1
Pop2
Pop2
Genotipo
A
AA
Aa
aa
Pop1
0,2
0,04
0,32
0,64
Pop2
0,6
0,36
0,48
0,16
Pop3
1
1
0
0
Pop1
Pop2
Pop2
Genotipo
A
AA
Aa
aa
Pop1
0,2
0,04
0,32
0,64
Pop2
0,6
0,36
0,48
0,16
Pop3
1
1
0
0
Juntas
0,6
0,47
0,27
0,26
H0 = 0,27
Freq A
AA
Aa
aa
Pop1
0,2
0,04
0,32
0,64
Pop2
0,6
0,36
0,48
0,16
Pop3
1
1
0
0
Total
0,6
0,47
0,27
0,26
Esperad
o (HW)
0,6
0,36
0,48
0,16
H0 = 0,27
He = 0,48
Déficit en Heterocigotos
En cada población i, observamos (bajo HW)
pi² individuos AA, 2piqi Aa, qi² aa.
Sobre el conjunto:
1n
p

E
(
p

p
i)
i

1i
n
H

2
p
(
1

p
)
e
n
n
1
2
2
H
2
p
(
1

p
)

(
p

p
)

o 
i
i
i
i
n
n
i

1
i

1
n
n
2
2
2
2
H

p

p

2
p

2
p


o
i
i
n
n
i

1
i

1
Pero:
n
1
2
2 2
Var
(
p
)

(
p

p
)

p

p

i
i
n
i

1
H

2
p

2
var(
p
)

2
p

2
p
(
1

p
)

2
v
p
)
o
2
Sabemos que:
H

2
p
(
1

p
)
e
Entonces:
H

H

2
var(
p
)
o
e
H

H


2
var(
p
)
o
e
Déficit en Heterocigotos
H

H

2
var(
p
)
o
e
va
p
)
H

2
p
(
1

p
)

2
var(
p
)

2
p
(
1

p
)(
1
 )
o
p
(
1

p
)
Var
(p)
F
st 
p(1p)
Ho = 2pq (1 – FST)
H
H
e
o
F
st 
H
e
Estructura genotípica observada (Hardy-Weinberg
generalizado a una metapoblación con cada población
panmictica):
(AA) = p² + pq FST
(Aa) = 2pq (1 – FST)
(aa) = q² + pq FST
Efecto Wahlund: observamos un déficit en heterocigotos
cuando muestreamos una población estructurada (que creímos
panmictica).
Fis se transforma en un Fst
Freq A
AA
Aa
aa
Pop1
0,2
0,04
0,32
0,64
Pop2
0,6
0,36
0,48
0,16
Pop3
1
1
0
0
Total
0,6
0,47
0,27
0,26
Esperad
o (HW)
0,6
0,36
0,48
0,16
2pq(1-Fst) = 0,48
Fst = 0.44
Déficit en Heterocigotos
Efecto Wahlund: observamos un déficit en heterocigotos
cuando muestreamos una población estructurada (que creímos
panmictica).
Fis se transforma en un Fst
¿Cómo interpretar un Fis
estadísticamente significativo?
•
•
•
•
Sistema de reproducción
Efecto Wahlund
Selección
Alelos nulos
Las fuerzas evolutivas
Factores que cambian las frecuencias génicas en las poblaciones
Selección
natural
Deriva
genética
Pool génico
Flujo génico
Mutaciones
Modelo de Wright – Fisher
2 poblaciones
J : Probabilidad de que dos haplotipos sean
idénticos por descendencia
Tiempo
JwJB
Fst

1JB
J?
J t 1 
2 de la misma población
1 de cada población
2 de la otra población

1
2
2
(
1

m
)
(
1

)
(
J

(
1

J
)
)
w
w
t
t
N

1
2
m
(
1

m
)(
1

)
(
J

(
1

J
)
)
w
w
t
t
N

1
2
2
m
(
1

)
(
J

(
1

J
)
)
w
w
t
t
N
Con J = F
¡Muy complicado!
Modelo infinito de Islas
Poblaciones Wright-Fisher
Poblaciones de mismo tamaño N
Misma tasa de migración entre islas
Deriva genética + mutaciones + migraciones
Tasa de mutación u
Tasa de migración m
m
1- u
Equilibrio migración-deriva
<=>
Equilibrio mutación-deriva
Generaciones
Deriva genética + mutaciones + migraciones

1
J

(
1

m
)
(
1

)
(
J

(
1

J
))
t

1
t
N
2
2
t

1
1
J

(
1

2
m
)(
1

2
)[

J
(
1

)]
t

1
t
N N
Equilibrio:
J

Jt1 Jt 
2
N
(μm
)
e
H

2
N
(μm
)
1
e
1
2
N
(
m


)
1
H
N

e
2
(
μ

m
)(
1

H
)
JwJB
Fst

1JB
En el modelo infinito de Islas:
JB  0
1

Fst

J

w
2
N
(
m

)

1

1
Fst

2
N
(
m


)
1
Si μ <<m
1
Fst

2
Nm

1
Con Nem : Número de inmigrantes
efectivos por generaciones
1Fst
N
m

e
2
Fst
FST
1
0,9
0,8
0,7
0,6
Después de la separación,
Fst aumenta con el tiempo
N=100
0,5
0,4
0,3
0,2
Generaciones
0,1
0
0
200
400
600
800
1000
Nm
60
50
Flujo génico fantasma…
40
30
20
10
0
0
20
40
60
80
100
AA Aa aa
p2 2pq q2
1 Locus, 2 alelos A(p) y a(q = 1-p)
AA Aa aa
p2 2pq q2
p,q
p,q
AA Aa aa
p2 2pq q2
AA Aa aa
p2 2pq q2
p,q
AA Aa aa
p2 2pq q2
p,q
p,q
AA Aa aa
p2 2pq q2
AA Aa aa
p2 2pq q2
p,q
T=0
1Fst
N
m

e
2
Fst
Fst = 0  Nm = 
¿Conclusiones?
Tiempo esperado para fijación
(
1

p
)
log(
1

p
)
0
0
t

2
N
p
0
N
m
N/2
N/2
?
Deriva con m = 0
Deriva con m = 0.01
Deriva con m = 0.1
N
T
N
e
1Fst
Modelos de dispersión
Modelo n-Islas
Modelo 2-Islas
Modelo Continente-Isla
Modelo Continente-Isla
N muy grande
k muy grande
P
Cada inmigrante lleva un alelo nuevo
p

P

(p

P
)(
1

m
)
t
0
t
pt
pt = Frecuencia después de t generaciones
p0 = Frecuencia inicial
P = Frecuencia del alelo en el continente
m = Tasa de migración por generación
Aplicaciones
Ese tipo de modelo suele aplicarse cuando la migración se produce principalmente de un
grupo hacia un otro.
Ejemplo: Flujo génico de la población blanca hacia la población negra en EstadosUnidos (los mulatos siendo considerado como perteneciente a la población negra).
El alelo Fya del locus Duffy es casi inexistente en África Oeste, lugar de originen de los
Afro-americanos, pero esta bien representado en la población blanca.
Estudio de Adams et Ward (1973, Science 180:1137) en Georgia
PFya(blanca) = 0.422
PFya(negra) = 0.045
t = 10 generaciones
p

P

(p

P
)(
1

m
)
t
0
t
0
.
045

0
.
422

(
0

0
.
422
)(
1

m
)
10
m0.011
Es decir un flujo génico promedio de 1 % en cada genéración.
Flujo génico desde la variedad cultivada (y transgénica)
hacia la variedad silvestre
Beta vulgaris
Beta vulgaris ssp maritima
Arnaud et al. 2003
Proc. R. Soc. Lond. B 270:1565–1571
Modelo Infinito de Islas
- Cada poblacion (isla) cumple el modelo de Wright-Fisher
- Cada poblacion tiene la misma probabilidad de recibir un inmigrante
- Cada inmigrante tiene la misma probabilidad de llegar desde cualquier
poblacion
1
F

ST
2
N
(μ
m
)
1
Modelo Q-Islas
Q = numero de poblaciones
Con mutacion:…
Modelo 2-Islas
Aislamiento por distancia
Modelo Stepping-stone
(migración paso a paso)
Stepping-stone circular
Stepping-stone a 2 dimensiones
Modelo continuo
Incremento de la diferenciación genética con la
distancia entre poblaciones
FST / (1-FST)
Stepping-stone model
(isolation by distance)
Island model
Test de Mantel
Distancia geografica
ó
Log (Distancia)
Pendiente es inversamente proporcional a la distancia promedia de dispersion
Rousset 1997 Genetics 145:1219-1228
Distancia genética
¿Cuando estimar un flujo genético?
Distancia geográfica
Distancia genética
Distancia genética
Distancia geográfica
Distancia geográfica
El ejemplo de la anchoveta
Engraulis ringens
Perú
Centro-Norte
Perú Sur
Chile Norte
Chile
Centro-Sur
n = 31
n = 47
n = 48
126 individuos (secuencias)
S = 31
K = 43
Comparación de las
frecuencias haplotípicas
43 haplotipos (o alelos)
0,40
0,30
0,20
0,10
0,00
H1
H3
H5
H11
H7
H10 H31 H12 H14 H16 H18 H20 H22 H25 H27 H29 H32 H34 H36 H39 H41 H43
Talcahuano
Iquique
Perú
Estructura genética
de la anchoveta
Aislamiento por distancia
- Distribución continua
- Diferenciación aumenta con la distancia
geográfica
0,0028
0,0027
Distancia genética
(Jukes & Cantor)
0,0026
0,0025
0,0024
0,0023
0,0022
0,0021
0,0020
1
1,5
2
2,5
Distancia geográfica (miles de km)
3
3,5
Modelo de flujo génico
Datos captura - recaptura
Presente estudio
Informe FIP 1998
200 km
400 km
Metapoblaciones
Metapoblaciones
Distintos tamaños poblacionales
=> intensidad de la deriva variable
Distintas tasas de migración
=> acción homogeneisante variable
Extincciones
=> pérdida de diversidad globalmente
Recolonisaciones
=> efectos fundadores
Metapoblaciones
Como estudiar la estructura
genética de una metapoblación?
Necesidad de integrar la información destacada por el análisis
de la estructura genética (diferenciación global y
diferenciación por par de poblaciones) con informaciones
acerca de la dinámica de esta metapoblación
Promedio histórico
Para esto se ha desarrollado nuevos análisis
Responden
diferentes preguntas
Instantáneo
Instantáneo:
Estadística bayesiana (ej. BAYESASS)
- basados en análisis de asignación individual
Ind
1
2
3
4
Loc1
1212
1418
1216
1216
Loc2 Loc2
3234 6868
3236 6874
3234 6060
3636 6670
A
Ind
1
2
3
4
Loc1
1223
1416
1216
1212
Loc2 Loc2
3436 6468
3636 6272
3234 6060
3436 6870
B
Calcula parametros
independientes para A
y B (Fi, M, etc) a
partir de MCMC
A
B
Positivo: permite estimar migración asimétrica
Negativo: no es muy eficiente cuando A y B son muy cercanas
Histórico:
- Basados en coalescencia (utiliza una tasa de mutación)
- Los supuestos son menos estrictas
Infiere parámetros poblacionales utilizando máximo de verosimilitud basado en la
teoría de coalescencia
Verosimilitud de los datos D
Según la genealogía G
Probabilidad de una genealogía G
Datos las variables P
Incluye:
Tamaño poblacional
Crecimiento poblacional
Tasa de migración
Tasa de recombinación
Rabidosa rabida
Descargar

AA - Cursos Ciencias