Sonido
• Son compresiones y descompresiones
alternativas que se propagan a través de un
medio elástico (por ejemplo el aire).
Sonido
• El espectro de frecuencias audibles por el
ser humano oscila entre 20 Hz y 20 KHz.
• El lenguaje humano utiliza el rango de 4
KHz
Sonido
• El lenguaje humano utiliza el rango de 4
KHz
Sonido
• O decibeles constituye el sonido de menor
intensidad audible por el ser humano y 120
decibeles es el máximo sonido tolerable.
Sonido
Codificación Perceptual
El sonido se produce por la interacción de un objeto
que vibra, un medio de transmisión y un receptor. Para
que el sonido sea percibido por el ser humano, el
objeto debe vibrar con una frecuencia de entre 20 Hz.
y 20 KHz.
La vibración produce una compresión y rarefacción
alternativa del aire que se transmite en forma de
ondas sonoras. Estas ondas llegan al oído, donde se
producen unos estímulos eléctricos que el cerebro
interpreta como sonidos. Las ondas sonoras se
atenúan con la distancia y pueden ser absorbidas o
reflejadas por los obstáculos que encuentran a su
paso.
Características del sonido
Un sonido se puede describir mediante su tono,
timbre, intensidad y duración.
El tono de un sonido está directamente relacionado
con la frecuencia, aunque no son sinónimos. La
frecuencia es una magnitud física asociada a todo
sonido, mientras que el tono (agudo o grave) es una
característica perceptiva que solo captamos en los
sonidos periódicos: los que tienen una frecuencia más
o menos constante.
Codificación Perceptual
La percepción acústica humana tiene lugar en dos
dimensiones: frecuencia e intensidad.
En el dominio de la frecuencia, el oído humano es
capaz de percibir frecuencias en el rango de los 20
hasta los 20.000 Hz
En cuanto a la intensidad, los humanos perciben un
rango dinámico en torno a los 120 dB. Sonidos de
intensidad superior a los 90 dB. pueden provocar
daños irreversibles.
Características del sonido
Desde el punto de vista musical, al duplicar la
frecuencia de un sonido, se pasa a la octava siguiente.
Por ejemplo, el La de la octava central del piano tiene
una frecuencia de 440 Hz., y el La de la siguiente
octava (más agudo), 880 Hz. En la música occidental,
la octava se divide en 12 semitonos (las doce teclas
que hay en cada octava de un piano). Para obtener la
frecuencia de un semitono a partir de la frecuencia del
anterior, hay que multiplicar por raíz doceava de 2, o lo
que es lo mismo: 1,05946.
Características del sonido
El timbre es la “personalidad” de un sonido y permite
distinguir, por ejemplo, el sonido de un piano y de una
trompeta con igual duración, intensidad y tono.
Gráficamente, el timbre se caracteriza por la forma de
la onda. Las ondas sinusoidales puras sólo se
obtienen electrónicamente, pero en la naturaleza, los
sonidos son más complejos. La frecuencia de
vibración más grave (frecuencia base) es la que
determina el periodo y la amplitud. Las restantes
frecuencias, que suelen ser múltiplos de la frecuencia
base, son los armónicos.
Características del sonido
La intensidad de un sonido depende de la amplitud
de onda. Las intensidades de los sonidos que
podemos percibir tienen un rango de más de 15
órdenes de magnitud por lo que para su medición se
usa una escala logarítmica (decibelios)
donde a es la amplitud de onda del sonido que se está
midiendo, y aref es la amplitud de referencia (la del
sonido con el cual se compara).
Características del sonido
Así los decibelios son una relación entre dos
amplitudes de onda. Si se toma como amplitud de
referencia el umbral de audición, la siguiente tabla
muestra la intensidad en dB de algunos sonidos
representativos:
Características del sonido
Descripción
Nivel (dB)
Intensidad
Umbral de audición
0
1
Estudio de grabación
20
10^2
Iglesia vacía
30
10^3
Casa en la ciudad
40
10^4
Restaurante concurrido
50
10^5
Conversación normal
60
10^6
Tráfico de vehículos
70
10^7
Martillazos sobre metal
110
10^11
Concierto heavy metal
120
10^12
Umbral del dolor
130
10^13
Características del sonido
Relacionado con la intensidad está el concepto de
rango dinámico, que es la diferencia en decibelios
entre el sonido más fuerte y más débil que un sistema
puede producir. En un aparato de sonido, este valor
indica la diferencia entre el volumen máximo y el ruido
de fondo que se emite cuando no hay señal. En los
equipos de sonido de cierta calidad el rango dinámico
oscila entre los 80 dB y los 95 dB
Formato de archivos
• AU. Formato audio estándar de Sun. Poca calidad
pero son muy comunes en Internet.
• AIFF (Audio Interchange File Format), comunes en
Mac. Hay una versión con muestras
comprimidas, AIFF-C.
• QuickTime también tiene formato de audio,
sincronizable e integrable con otros medios.
• WAV (Waveform) es el formato de Windows.
• MP3
MP3
Las siglas MP3 responden a una abreviación de
MPEG 1 layer 3. Es un algoritmo de codificación
perceptual desarrollado por el consorcio MPEG
(Moving Picture Expert Group) junto con el Instituto
Tecnológico Fraunhofer que finalmente se ha
estandarizado como norma ISO-MPEG Audio Layer 3
(IS 11172-3 y IS 13818-3) y que viene a ser un avance
importante sobre los anteriores desarrollos (Layer 1 y
Layer 2).
MP3
Dentro de los estándares de vídeo MPEG hay también
creados estándares de compresión de audio. Como se
permiten distintas calidades existen tres "capas" con
distintos esquemas de compresión: la capa 1, la 2 y la
3 (de forma que la complejidad es progresiva, un
decodificador de capa 3 funciona también con las
capas anteriores), y esta última se conoce por MP3 o
MPEG Audio Layer-3.
MP3
El MP3 permite comprimir en un factor aproximado de
12 la información original muestreada (unos 128 Kbits
por segundo, es decir, más o menos 1 Mb por minuto)
sin perder calidad de sonido de forma apreciable (por
un oído no entrenado... y de hecho los estudios de
percepción de calidad de mp3 se han hecho con
oyentes humanos opinando sobre las diferencias).
El formato mp3 utiliza unos cuantos trucos para
comprimir el sonido, fundamentalmente técnicas de
codificación de percepción que aprovechan la manera
en la que el oído humano percibe el sonido. Algunas
de las claves son:
MP3 Umbral mínimo de audición
El umbral mínimo de audición humano (minimal
audition threshold) no es lineal. Cualquier sonido
situado fuera de unos ciertos límites y niveles puede
no codificarse, ya que no será percibido de cualquier
modo.
MP3 Efecto máscara
Hay una serie de propiedades de ocultación (masking
effect) del oído humano. De la misma forma que al
mirar a un objeto muy brillante se anula la percepción
de otros objetos que puedan cruzarlo, en audio los
sonidos fuertes no dejan oír a los débiles.
Para conseguir aprovechar esta característica mp3
usa un modelo psicoacústico del comportamiento del
oído humano, que filtra los sonidos más débiles
cuando hay sonidos muy fuertes a la vez.
MP3 Efecto máscara
Oído externo
• Compuesto por el pabellón auricular y el conducto
auditivo externo.
• La superficie corrugada de la oreja permite
capturar el sonido y dirigirlo hacia el conducto
auditivo externo.
Oído medio
• La cadena de huesecillos (martillo, yunque
y estribo) se extienden desde el tímpano
hasta la ventana oval.
• Permite transmitir y amplificar el sonido.
Oído interno:
La transducción del sonido
Cóclea
• Transforma la energía
sonora (onda mecánica) en
señales eléctricas.
• Es capaz de discriminar la
frecuencia e intensidad de
los tonos que constituyen
el espectro audible.
• Constituye el primer paso
en el proceso de
discriminación auditiva.
Cóclea
• La cóclea es un tubo
enrollado
helicoidalmente,
adoptando la forma de
un caracol.
• En su interior tiene tres
subdivisiones,
denominados de arriba
hacia abajo:
– Rampa vestibular
– Conducto coclear
– Rampa timpánica
Cóclea
• La membrana
vestibular separa la
rampa vestibular del
conducto coclear.
• La membrana
vestibular separa la
rampa timpánica del
conducto coclear.
• La rampa vestibular y
timpánica se unen en el
ápex de la cóclea
(helicotrema).
Cóclea
• El estribo actúa como un
pistón que desplaza la
membrana oval y genera
ondas de presión hidráulica.
• Las ondas de presión viajan a
través de la rampa vestibular y
en el helicotrema pasan hacia
la rampa timpánica.
• La presión es eliminada a
través de la ventana redonda.
Cóclea
• Al pasar por la membrana
basilar estimula los receptores
auditivos en el órgano de
Corti.
• Las propiedades elásticas de
la membrana basilar cambian
a lo largo de su trayecto. Por
esa razón, cada frecuencia del
espectro audible genera una
zona circunscrita de máxima
oscilación.
• Dicha propiedad permite
determinar el tono del sonido.
Órgano de Corti
• Es el transductor que
transforma las ondas
mecánicas en señales
eléctricas.
• Las unidades sensoriales
están representadas por las
células pilosas, cuyo extremo
apical (estereocilios) entra en
contacto con la membrana
tectoria.
• Cuando la membrana basilar
vibra arrastra consigo el
órgano de Corti y la
membrana tectoria.
Órgano de Corti
• Los movimientos
descritos producen
deflexión de los
estereocilios.
• Dicha deflexión evoca
un potencial eléctrico en
la célula pilosa.
• Cada célula pilosa está
sintonizada con un rango
estrecho de frecuencias
sonoras.
Células pilosas
• Poseen una superficie apical
donde se destacan los
estereocilios (estructuras
rígidas que contienen
filamentos de actina y
fibrina).
• La superficie basal entra en
contacto con el axón
proximal de las neuronas del
ganglio espiral.
Células pilosas
• La deflexión de las estereocilias abre canales iónicos
mecanosensibles.
• A través de ellos penetran iones K+ (el catión más abundante de
la endolinfa), que despolarizan la célula.
• Así son activados canales de calcio dependientes de voltaje. La
entrada de este ión permite la exocitosis de neurotransmisores.
Células pilosas
• La configuración específica de las estereocilias
(variación en longitud y viscosidad), les permite
responder de manera selectiva a determinado tono
sonoro (tal como lo haría un diapasón).
• Podrían existir también resonadores eléctricos.
• Esto explica en parte los mapas tonotópicos de la
cóclea (la otra explicación radica en las propiedades
mecánicas de la membrana basilar)
Vías centrales y
periféricas
Ganglio espiral
• Las neuronas sensitivas
presentes en el ganglio
espiral establecen
contacto principalmente
con las células pilosas
internas.
• Cada axón inerva una
sola célula pilosa.
• A cada célula pilosa
llegan aproximadamente
10 axones.
Nervio coclear
• El nervio coclear
envía información
codificada de tono e
intensidad hacia el
cerebro.
• Cada axón presente
en el nervio coclear
responde a un tono y
volumen específico
(sistema de canales
paralelos).
Núcleos
cocleares
• Están tonotópicamente
organizados.
• Las células localizadas
en el núcleo coclear
dorsal ayudan a
discriminar la fuente de
origen del estímulo
sonoro en sentido
vertical.
• Las neuronas cocleares
permiten suprimir el
efecto de eco.
Vías ascendentes
• Las células del grupo
ventral anterior envía
proyecciones hacia el
complejo olivar superior
por medio del cuerpo
trapezoide.
• En este sitio se realiza la
discriminación de la
fuente sonora en sentido
horizontal (basado en
latencia e intensidad).
Integración central
• Las neuronas del cuerpo
geniculado medial envían
fibras a la región superior
y dorsal del lóbulo
temporal (giro transverso
de Heschl, primer giro
temporal), que
constituyen la corteza
auditiva primaria.
• La corteza auditiva
primaria está organizada
en microcolumnas de
distribución tonotópica.
Corteza cerebral
• Discrimina los
sonidos en todas sus
cualidades.
• Permite
descomponer
sonidos complejos
como los del
lenguaje o la
música.
Corteza cerebral
• Discrimina los
sonidos en todas sus
cualidades.
• Permite
descomponer
sonidos complejos
como los del
lenguaje o la
música.
Gracias
Descargar

Audición