Agenda
•
•
•
•
•
•
Introducción
Señales de Voz
Sistema Monoacústico
Sistema Estéreo
Sistema Híbrido Mono/Estéreo
Detectores de doble Conversación
Introducción
• Objetivos
– Exponer los conceptos básicos de un problema actual
• Características inherentes a la voz humana
• Características inherentes a la percepción humana
• Casos de estudio en la generación de eco
– Aplicación de las herramientas de tratamiento
estadístico de señales
– Aspectos reales a tener en cuenta en el modelo teórico
Introducción
• Referencia histórica
– Problema clásico del procesamiento de señales
– Nuevo impulso en la década del 90
• Retardos de Sistemas Digitales
• Nuevas aplicaciones
• Manos Libres
• Teleconferencias
• Telefonía IP
• Localización Espacial
Señales de Voz
• Principales aspectos a considerar
–
–
–
–
Ancho de banda
Concentración de la energía
Estacionalidad
Percepción humana
Espectro de la señal de voz
•
•
Espectro de Potencia de la señal de voz
Análisis Tiempo-Frecuencia
Generación de eco en las redes
• Red Telefónica tradicional
– Desbalance intrínseco del sistema a dos hilos
– Significa problema en transmisiones con retardos mayores a 45ms
• Redes de Paquetes
Generación de eco en las redes
•
Redes de Paquetes
– Nuevas aplicaciones de voz
– Retardos en el procesamiento
• Necesidad de Buffers
– Paquetización
– Retardos variables: Jitter
Requisitos del Cancelador de Eco
•
De acuerdo a las recomendaciones de ITU-T G.168
– Rápida Convergencia Inicial
– Bajo nivel de eco de retorno en conversación simple
– Baja divergencia en doble conversación
– Detección de doble conversación
– Operación en transmisiones fax/modem
Criterios de Optimización
•
•
Queremos obtener una réplica de la respuesta al impulso h
El camino para esto es encontrar un filtro que haga mínimo
el error en términos de:
2


ˆ
ˆ
J
(
h
)

E
d
(
n
)

d
(
n
)


– Media Cuadrática


- Mínimos Cuadrados Ponderados
n
J ( n)   
l 1
n l
d (l )  dˆ (l )
2
10
Escenarios de Estudio
•
•
—
—
Sistemas Mono-Acústicos
Sistemas Multicanal
Principales características
Diferencias fundamentales
Canceladores de Eco Mono-Acústico
Máxima Atenuación
•
•
•
Estimamos la señal de eco mediante un filtro de orden N
El valor de N se elige de acuerdo al tiempo de reverberación
Si los valores de filtro se ajustan perfectamente a los primeros N
coeficientes de la respuesta al impulso,
2
N 1
 
 
E   hi (k ) x(k  i )   hi (k ) x(k  i )  
2
2
ˆ
i 0
 i 0
 
E eN ( k ) E ( d ( k )  d N ( k )


2
E d 2 (k )
E d 2 (k )
 
 
E   hi (k )x(k  i )  
 i 0
 







2
 
 
E   hi (k ) x(k  i )  
 i  N
 
 

2
 

 
E   hi (k )x(k  i )  
 i 0
 


h
(k )
h
(k )
i N

i 0
2
i
2
i
Atenuación Según N
•
•
Para obtener una atenuación de 45dB N1600
Se requiere alta potencia de cómputo
Algoritmos
• Entre los algoritmos más utilizados encontramos:
– NLMS (Normalized Least Mean Square)
• Baja Complejidad
• Convergencia lenta
– APA (Affine Projection Algorithm)
• Solución intermedia respecto a complejidad y
velocidad de convergencia
– RLS (Recursive Least Square)
• Alta complejidad y requerimiento de cálculo
• Convergencia rápida
• Problemas de estabilidad
Algoritmos: comparación
-3
3
Curvas de Aprendizaje
x 10
NLMS
APA
RLS
2.5
Amplitud
2
1.5
1
0.5
0
0
0.01
0.02
0.03
0.04
Tiempo(s)
0.05
0.06
0.07
0.08
Algoritmo NLMS
•
•
•
•
Frecuentemente elegido por la baja complejidad
(2L operaciones por iteración)
Método de máxima pendiente
Estimación del gradiente muy ruidosa
Paso de adaptación  Convergencia Vs Precisión
Algoritmo NLMS
Formulación del filtro adaptivo:
Estimamos el valor del gradiente en cada iteración
por medio de los valores instantáneos
dˆ (k )  hˆT (k ) x(k )
e(k )  d (k )  dˆ (k )
x(k )e(k )
hˆ(k  1)  hˆ(k )   (k ) T
x (k ) x(k )
Algoritmo RLS
•
•
•
Orden del filtro O(L^2)
Optimización respecto a cada realización
Ecuación normal determinística
hˆ1, L (n) 
  r (n)
R ( n) 
ˆ
h 2, L (n)
n
R ( n)   
n l
l 1
n
r ( n)   
l 1

 x1, L (l )  T
T

 x1, L (l ) x 2, L (l )
 x 2, L (l )
n l

 x 1, L (l ) 
y (l ) 

x
(
l
)
 2, L 
19
Algoritmo RLS
•
Formulación del filtro adaptivo:
– Ecuación de Actualización
T
e(n)  y (n)  hˆ (n  1) x(n),
1
hˆ(n)  hˆ(n  1)  R (n) x(n)e(n)
R
1
se calcula en forma recursiva
20
Algoritmo APA
•
Se definen error a priori y error a posteriori,
respectivamente como:
T
e(n)  y(n)  X (n)hˆ(n  1)
T
e a (n)  y(n)  X (n)hˆ(n)
X (n)  x(n) x(n 1)  x(n  p  1)
y(n) y e(n) son vectores que contienen las p
últimas muestras de y(n) y e(n)
21
Algoritmo APA
•
Aplicando la restricción: ea (n)  0px1
Obtenemos la formulación del algoritmo


hˆ(n)  hˆ(n  1)  X (n)X X  e(n)
T
X (n) hˆ(n)  hˆ(n  1)  e(n)
T
•
•
1
Método de error forzado a cero (Zero Forcing Algorithm)
Orden del filtro O(L)
22
Simulaciones: Algoritmo NLMS
Señal de Entrada
0.6
0.4
Amplitud
0.2
0
Respuesta al Impulso
0.5
-0.2
-0.4
-0.8
0
0.5
1
1.5
2
2.5
Tiempo (s)
Amplitud
-0.6
0
Señal Estimada
0.6
0.4
-0.5
Amplitud
0.2
0
-0.2
-0.4
-0.6
-0.8
0
0.5
1
1.5
Tiempo(s)
2
2.5
0
0.05
0.1
0.15
0.2
Tiempo(s)
0.25
0.3
0.35
0.4
Algoritmo NLMS
Señal Estimada
0.6
0.4
Amplitud
0.2
0
Error Residual
-0.2
0.4
-0.4
-0.6
-0.8
0
0.5
1
1.5
Tiempo(s)
Señal de Eco
2
2.5
Amplitud
0.2
0
-0.2
-0.4
0.6
-0.6
0.4
-0.8
0.2
0
0.5
1
1.5
Amplitud
Tiempo(s)
0
-0.2
-0.4
-0.6
-0.8
0
0.5
1
1.5
Tiempo(s)
2
2.5
2
2.5
Algoritmo NLMS: Performance
Comportamiento del Filtro
Estimacion
Eco
Entrada
0.4
0.2
0
-0.2
-0.4
-0.6
4620
4630
4640
4650
4660
4670
4680
4690
Comportamiento del Filtro
0.4
Filtro
Resp. Impulso
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
-0.4
20
40
60
80
100
120
Canceladores de Eco Multicanal
• Sistema Estéreo
– Sistemas con requerimientos de localización espacial
• Problemas Fundamentales
– Unicidad de la solución
• La solución a la ecuación normal puede estar indefinida
• Correlación cruzada entre canales
• La matriz de correlación con número de condición alto
– Seguimiento de caminos de eco
• La aplicación de técnicas del caso monofónico no dan
buenos resultados
Cancelador de Eco de dos Canales
•
•
Requiere de alta velocidad de convergencia ante:
– Cambios en el recinto de recepción
– Cambios de locutor en el lugar de transmisión
x1(n) y x2(n) fuertemente correlacionadas
Unicidad de la Solución
Las dos señales de entrada del filtro
están vinculadas por:
x1,M (n) g 2,M  x 2,M (n) g 1,M
T
T
Siendo la estimación de los filtros reales:


T
ˆ
ˆ
ˆ
ˆ
h i , L (n)  hi ,0 (n) hi ,1 (n)  hi , L1 (n)
La minimización de J(n) resulta en
la ecuación normal:
hˆ1, L (n) 
  r (n)
R ( n) 
hˆ 2, L (n)
Unicidad de la Solución
M = Largo de la respuesta al impulso en el lugar de transmisción
N = Largo de la respuesta al impulso en el lugar de recepción
L = Largo del filtro utilizado


 x1, L (n)  T
  R11 (n) R12 (n) 
T
R ( n)  E  
x
(
n
)
x
(
n
)
2, L

 1, L

x
(
n
)
2
,
L


  R 21 (n) R 22 (n)
x1, L (n)

r (n)  E 
y(n)

x 2, L (n)

Si considero L> M y el vector:

u  g 2, M 0  0  g 1, M 0  0
T
T

T
Se puede ver que es un vector propio de R con valor propio
nulo, y por lo tanto no tenemos solución única a la ecuación
normal
Consecuencias de la no unicidad de la solución




T
hˆ 2, L (n)  h 2, L    g 1,M 0  0
T
hˆ1, L (n)  h1, L   g 2,M 0  0
•
•
•
T
T
La solución a la que llegue el sistema depende de los
parámetros del lugar de transmisión
No se considera una solución adecuada
Si cambia la persona que está hablando debe reconverger
Desajustes
•
•
•
En los casos reales vamos a tener L < M
La inversa de la matriz de correlación existe pero va a estar
mal condicionada
Definiendo el desajuste como la relación entre la solución
buscada y la obtenida:
  h  hˆ / h

2
2
min


T

T
(n)   h i , L  hˆ i , L (n) h i , L  hˆ i , L (n) h h
i 1
 h t Q ( n) h t h h
T
•
T
La solución es única pero el desajuste va a ser importante
debido a la correlación cruzada entre las señales de entrada
Efecto Tail
•
•
•
•
•
Se refiere al efecto que produce modelar los filtros con L<N
Es equivalente a truncar la respuesta al impulso del sistema
a estimar
El residuo hace posible que se tenga solución única
Potencialmente se tiene gran desajuste aunque sea posible
tener buena cancelación de eco
Degradación de la cancelación ante cambios en la
transmisión
Efecto Tail
• Reducción del desajuste
– Aumentando el largo de los filtros
• Costoso en términos de memoria y
procesamiento
• Procesamiento lento
– Aplicando técnicas de reducción de la
correlación cruzada
• Transformaciones no-lineales
• Factorización apropiada
Correlación Cruzada
•
Función de Coherencia:
(f) 
•
S x1x2 ( f )
S x1x1 ( f ) S x2 x2 ( f )
Los valores propios de la matriz de correlación
son de la forma:

A2  B  1   ( f )
•
•
2
 0
Si  ( f )  1 , la matriz R es singular
Esto ocurre cuando las señales están
relacionadas en forma lineal
Método de Transformación no-lineal
•
Rectificador de media onda
– Es preferido por su baja complejidad y por que da buenos
resultados
– Se debe cumplir que la distorsión no sea perceptible por el
oído humano
– Buenos resultados para valores de  menores a 0.5
x1 (n)  x1 (n)  
x1 (n)  x1 (n)
x2 (n)  x2 (n)  
2
x2 (n)  x2 (n)
2
35
Diseño de Filtros Adaptivos
•
Para el caso multicanal deben tener en cuenta la correlación
intercanal
– Transformación no-lineal
– Procesos de inter-innovación
Método de Transformación no-lineal
Sin aplicación
0.4
Filtro
Resp. Impulso
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
-0.4
20
Con aplicación
30
40
50
60
70
Filtro
Resp. Impulso
0.4
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
37
-0.4
20
30
40
50
60
70
Sistema Híbrido Mono/Estéreo
•
•
•
Es un caso particular de procesamiento en sub-bandas
Reducción del peso de cómputo al sub-muestrear
Aplicación de distintas técnicas según la banda de
frecuencia
– El efecto estereofónico es predominante en frecuencias
por debajo de 1KHz
– La concentración de la energía de la voz está en las
frecuencias bajas
Sistema Híbrido Mono/Estéreo
39
Detectores de doble Conversación
•
•
Es un elemento importante que aparece en los sistemas de
cancelación de Eco
Se utiliza como protección contra divergencias de los
filtros adaptivos
– Señales de audio en el lugar de recepción
– Ruidos distorsionantes
•
La alta convergencia de los algoritmos adaptivos es
acompañada de alta divergencia ante doble-conversación
Detector de Geigel (Geigel DTD)
Condición de doble
conversación
yn   maxxn , xn1 , , xnL1 
•
•
•
Es un sistema de aplicación comercial
Se comparan las señales de transmisión y recepción
Si se detecta doble-conversación los coeficientes del
filtro quedan “congelados”
– Tiempo de hangover es el tiempo mínimo en que el
algoritmo está inhibido
41
Comentarios y conclusiones
•
•
•
•
La cancelación de Eco es un requisito en muchas
aplicaciones actuales
Las técnicas a utilizar varían según el campo de
aplicación y el costo de la solución
En sistemas multi-canal la correlación entre las
señales de entrada juega un rol central
Otros desarrollos de interés
– Filtros adaptivos en sub-bandas
– Filtrado en el dominio de frecuencias
Descargar

CANCELACION DE ECO