Toda la información de este capítulo ha sido extraída de: http://www.diac.upm.es/asignaturas/sistaudio/TFC Ignacio/index.html Página no disponible actualmente.    

3.1-Audición y frecuencia.

3.2-Timbre.

3.3-Enmascaramiento.

3.4-Localización espacial de fuentes.

 

3.1- AUDICIÓN Y FRECUENCIA.

 

El umbral de audición, para la media de los humanos, se fija en 20 µPa (20 micro pascales = 0.000002 pascales), para frecuencias entre 2KHz y 4KHz. Por encima y por debajo de estas frecuencias, la presión requerida para excitar el oído es mayor. Esto significa que nuestro oído no responde igual a todas las frecuencias (tiene una respuesta en frecuencia desigual). Un tono puro, a la frecuencia de 125 Hz y con 15 dB de nivel, sería prácticamente inaudible, mientras que si aumentamos la frecuencia, hasta 500 Hz, sin variar el nivel de presión, se obtendría un tono claramente audible.

Las líneas discontinuas marcan los niveles de presión necesarios a cada frecuencia, para que el oído detecte (subjetivamente) la misma sonoridad en todas. Esto quiere decir que si reproducimos un tono de 31.5 Hz a 100 dB (NPS), luego otro de 63 Hz a 90 dB y otro de 125 Hz a 80 dB, el oyente dirá que todos sonaban al mismo volumen.

En 2 KHz el umbral de audición se fija en 0 dB y a 4 KHz es incluso menor de 0 dB, ya que a 3600 Hz se encuentra la frecuencia de resonancia del oído humano.

Por debajo de 2000 Hz y según se va bajando en frecuencia, el oído se vuelve menos sensible. Los umbrales de audición para frecuencias menores de 2 KHz son: 5 dB a 1 KHz, 7 dB a 500 Hz, 11 dB a 250 Hz, 21 dB a 125 Hz, 35 dB a 63 Hz, 55 dB a 31 Hz. Recuerda que estos dB’s son de nivel de presión sonora (NPS o SPL).

Por encima de los 4 KHz, el oído es menos sensible, pero no tanto como en bajas frecuencias. Sin embargo, se producen fluctuaciones a frecuencias cercanas, debido a las perturbaciones que produce la cabeza del oyente en el campo sonoro. Los umbrales de audición son: 15 dB a 8 KHz y 20 dB a 16 KHz

Todos los receptores de sonido, tienen un comportamiento que varía con la frecuencia. En el caso del oído humano, sucede lo mismo, ya que se trata el receptor más complicado y (aunque parezca extraño) más eficiente que existe.

El umbral de audición define la mínima presión requerida para excitar el oído. El límite del nivel de presión sonora se sitúa generalmente alrededor de 130 dB, coincidiendo con el umbral del dolor (molestias en el oído). La pérdida de audición de manera súbita, por daños mecánicos (en el oído medio) se produce a niveles mucho mayores. La exposición suficientemente prolongada a niveles superiores a 130 dB produce pérdida de audición permanente y otros daños graves.

En acústica, las frecuencias siempre se tratan de manera logarítmica: representaciones, gráficas y demás. El motivo principal es que el oído humano interpreta las frecuencias de manera casi logarítmica. En el eje de frecuencias de cualquier gráfica de las vistas hasta ahora, las marcas pasan de una frecuencia (p. ej. 1000 Hz) al doble (2000 Hz). La apreciación subjetiva de un oyente será que hay la misma distancia entre un tono de 200 Hz y otro de 400, que entre uno de 1000 Hz y otro de 2000 Hz. Sin embargo la «distancia» en frecuencia en el primer caso es de 200 Hz y en el segundo de 1000 Hz.

 

3.2- TIMBRE.

El oído humano percibe el timbre en función de las frecuencias que componen la señal escuchada. Los humanos tenemos buena agudeza auditiva cuando se trata de distinguir frecuencias. En cambio, tenemos una agudeza pobre para localizar la fuente del sonido. Se pueden diferenciar dos tonos, uno de 100 Hz de otro de 101 Hz, pero no uno de 1000 Hz de otro de 1001 Hz. Sin embargo sí se percibe la diferencia entre de uno de 1000 Hz y otro de 1010 Hz; esto es debido a la audición logarítmica. La agudeza frecuencial del oído se sitúa en torno al 1%, puede distinguir tonos cuyas frecuencias varían en sólo un 1%.

El oído humano se comporta, en lo que a sonoridad se refiere, como un conjunto de 24 filtros de 1/3 de octava. Este hecho se puso de manifiesto al hacer medidas de sonoridad y comparar las sonoridades de ruidos de banda estrecha, manteniendo constante la presión media total, pero aumentando el ancho de banda por pasos. Se descubrió que para distintos anchos de banda menores de 1/3 de octava, todas las señales se percibieron con igual sonoridad. Cuando se superaba el ancho de banda de 1/3 de octava, la sonoridad percibida aumentaba. Esto es debido a que se comienzan a excitar los nervios de las zonas filtrantes vecinas, en el oído interno. Por este motivo las representaciones en tercio de octava son tan usadas y útiles.

 

3.3- ENMASCARAMIENTO.

 

El enmascaramiento de un tono o de un ruido de banda estrecha sobre otro, es una experiencia diaria. Cuando se encuentra dificultad o imposibilidad para escuchar algún sonido (música, habla…) porque otro sonido (considerado ruido) está presente en el mismo momento, estamos sufriendo enmascaramiento.

Los procesos de enmascaramiento cumplen siempre:

a) Una banda estrecha de ruido, produce más enmascaramiento que un tono puro de igual frecuencia central y misma intensidad.

b) Cuando el ruido es de bajo nivel, el enmascaramiento se produce en una banda de frecuencia estrecha alrededor de la frecuencia central del ruido.

c) El efecto de enmascaramiento no es simétrico en torno a la frecuencia central del ruido enmascarante. Las frecuencias superiores sufren más los efectos de enmascaramiento.

En la gráfica que se muestra a continuación, se pueden ver los efectos b) y c). La línea curva inferior delimita el umbral medio de audición.

La gráfica muestra las zonas que estarían bajo los efectos del enmascaramiento, con un ruido de banda estrecha centrado en 1200 Hz, y para distintos niveles de presión sonora del ruido. Para el caso más extremo, el ruido de 110 dB (la curva más alta), obtenemos la mayor zona enmascarada. Por ejemplo, en este caso, el oyente no detectaría un tono de 8 KHz y 50 dB de nivel de presión; tampoco detectaría un sonido de 4 KHz y 70 dB de nivel de presión…

 

3.4- LOCALIZACIÓN ESPACIAL DE FUENTES.

En el caso más general, en campo abierto, el cerebro localiza la fuente de sonido, basándose en la diferencia de nivel entre un oído y otro, y en la diferencia de tiempo (retardo) entre un oído y otro. Como se había dicho, el sonido viaja a una velocidad de 343 m/s y la separación entre oídos es de unos 20 cm, los posibles retardos llegan hasta 600 µs (1 microsegundo = 0.000001 segundo). La diferencia de nivel entre los oídos, es debido principalmente a la «sombra» de la cabeza, este efecto se acusa más en altas frecuencias. Las altas frecuencias se localizan principalmente por diferencia de nivel, y las bajas por diferencia de fase (retardo). Para acabar de localizar la fuente del sonido, está el movimiento de la cabeza, que es algo instintivo y colabora de forma determinante a la ubicación de la fuente.

En este apartado, nos centraremos en un caso concreto de los posibles: dos fuentes sonoras emitiendo señales coherentes. Se elige este caso porque es el más general. Los dos altavoces de un sistema estéreo emiten, en su mayor parte señal coherente, es decir, la misma señal.

La posición estéreo por definición, es cuando los altavoces y el oyente forman un triángulo equilátero de tres metros de lado. Además se suelen elevar los altavoces unos pocos grados sobre el plano de audición.

Para simular los distintos efectos se suelen añadir retardos entre los dos altavoces, mediante la electrónica. Se puede añadir retardo a toda la señal, o sólo a unas frecuencias para crear distintos ambientes. Si el oyente se sitúa a la misma distancia de los dos altavoces, los escucharía al mismo nivel, suponiendo que la señal que entra ambos altavoces es la misma, sólo con posibles retardos. Variando  solamente el retardo entre altavoces, tendríamos los siguientes casos:

a) Retardos entre 0 y 630 µs: el oyente identifica que hay una única fuente de sonido cuya posición depende del retardo entre las dos señales. El cerebro «suma» las señales de los dos oídos para determinar la posición de la fuente. Este efecto se denomina «Localización Suma« y es la base de los efectos estereofónicos con dos altavoces.

b) Retardos entre 1 ms y 40-50 ms (1 milisegundo = 0.001 segundos): el oyente identifica una única fuente sonora que sitúa en la posición del altavoz cuya señal está llegando primero a sus oídos (el que no está retardado). Las componentes de señal que llegan a los oídos en primer lugar son tomadas en consideración y las últimas son suprimidas en el proceso de cálculo. Este es el llamado efecto del «Primer Frente de Onda«, muy importante a la hora de diseñar sistemas de refuerzo sonoro mediante varios altavoces, por ejemplo en salas de cine.

c) Retardos superiores a 50 ms: el oyente identifica dos fuentes de sonido, cada una en la posición de un altavoz. La segunda fuente de sonido será denominada eco de la primera.

Los límites de los márgenes de los retardos no son invariables, ya que dependen también de las condiciones ambientales del experimento y también de la percepción subjetiva de cada individuo. Por ejemplo, para retardos entre 630 µs y 1 ms, se tendrá «Localización Suma««Ley del Primer Frente de Onda« en función del sujeto y de las condiciones del experimento.