Saltearse al contenido

Análisis espectral y herramientas complementarias al audio

Cuando hablamos de herramientas complementarias, nos referimos precisamente a instrumentos de medición, que nos mostrara en forma objetiva un análisis detallado de diversos aspectos, tales como el espectro, precedencia del sonido en la imagen estéreo, posibles cancelaciones en la suma L+R, entre otros.

Estas herramientas pueden ser de gran utilidad, especialmente si no tenemos un buen conocimiento del monitoreo que estamos utilizando o si el mismo posee limitaciones tales como: respuesta en frecuencia despareja e incompleta, o bien, nuestra sala no permite una buena imagen estéreo, e infinidad de otros factores. Sin embargo, su utilización no debe condicionar nuestro oído, ya que muchas veces terminamos viendo lo que en realidad deberíamos estar escuchando.

En el campo del audio digital, el máximo nivel o pico que podemos alcanzar es 0dB. Es común ver en muchos procesadores 0dBFS (FS: Full Escale, a fondo de escala), la cual significa que efectivamente 0dB es el nivel máximo. Si excediéremos este nivel, tanto sea en la entrada de un conversor A/D (Analógico/Digital), o en un proceso digital propiamente dicho, la señal que supere el nivel máximo permitido de 0dB, esta se perderá, produciendo sobre modulaciones.

El nivel de pico es entonces, el valor de amplitud más alto registrado en ese instante. Sin embargo, no necesariamente el valor de pico coincide con la intensidad sonora (es más, no coincide). Esta última es la densidad del material de audio (el famoso nivel de RMS, también llamado Loudness en varias plataformas), que se aproxima mucho al nivel sonoro percibido por el oído (aunque cada persona distingue la intensidad sonora de manera distinta). Siempre obtendremos valores de RMS mucho menores que los de pico, y estos valores pueden variar según el medidor utilizado, ya que el tiempo de integración de los dispositivos no está estandarizados.

El nivel RMS (Root Mean Square) corresponde al valor cuadrático medio, el cual es una medida estadística. Hay dos formas de calcularlo, tanto para valores discretos, como para una función de variable continua:

* RMS para N valores:

* RMS para una función continua f(t), para el intervalo [T1, T2]:

Cuanto mayor sea el intervalo de integración, más lento fluctuará el valor RMS y viceversa.

Es de gran utilidad contar con ambos medidores en forma conjunta, ya que nos darán una visión global tanto de los picos máximos como de amplitud y su verdadera intensidad sonora. La falta de dinámica es claramente delatada cuando los valores de RMS no difieren mucho de los de pico. En la figura ubicada en la siguiente página podemos observar ambos medidores de nivel en forma conjunta. Es importante aclarar que el valor de intensidad sonora indicado sólo tiene sentido si el nivel de pico se encuentra normalizado (cercano al 0dB).

Descripción de tu imagen
Medidor de Pico y RMS conjuntos

Un sistema propuesto por el ingeniero Bob Katz, el cual combina un sistema de medición estandarizado con la calibración del monitoreo a utilizar. Básicamente, consiste en ubicar el 0dB de la escala por debajo del cero (o fondo de escala) real del vúmetro. Esto permite mayor headroom y espacio para transitorios y picos.

El 0dB corresponde al nivel de presión sonora de 83dBc (8dBc al sweet spot con ambos parlantes), calibrado con ruido rosa mono y medio con sonómetro normalizado en ponderación C y respuesta lenta (es importante recalcar el ruido rosa si o si en mono para el par estéreo), luego, en base a este 0dB normalizado, se definen 3 escalas posibles:

  • K-System 20: El 0dB está 20dB por debajo del 0dBfs real.
  • K-System 14: El 0dB está 14dB por debajo del 0dBfs real.
  • K-System 12: El 0dB está 12dB por debajo del 0dBfs real.
Descripción de tu imagen

La aplicación de este método radica en el poder combinar el medidor de picos con el de nivel RMS en este sistema, y así poder contrastar fácilmente la diferencia entre ambos. Dado que estos sistemas proponen un nivel de sonoridad de escucha en 83dBc, el K20 será ideal para masterizar o mezclar música clásica, ya que requiere un gran rango dinámico. Asimismo, el K14 será de gran utilidad para músicas más comprimidas, y el K12 para rock, pop y demás estilos que requieran un volumen acorde a las exigencias de la industria. En la que se observa a continuación es el clásico 40-A de Dorrough, este es un vúmetro de precisión cuya escala coincide con el K-System 14. El nivel de RMS corresponde a la barra de leds llena y el de pico al led de mayor nivel.

Descripción de tu imagen
Dorrough 40-a Loudness Meter

Cabe aclarar que en la actualidad los rangos dinámicos con los que habituamos trabajar están muy por debajo de los propuestos por estas escalas.

Luego de haber estudiado la FFT, que es el motor de los analizadores de espectro, estamos en condiciones de poder entender los resultados que ellos nos devuelven. En primer lugar, vamos a dar una rápida clasificación de los mismos, ya que hay tres familias importantes: FFT Analizers (propiamente dichos) y analizadores por bandas o fracciones de octava. Los tres tipos de analizadores cumplen una misma función, pero difieren en la forma de devolver los resultados obtenidos.

Los Espectrogramas nos dan una imagen de la densidad espectral de una señal en el tiempo, pero no utilizando números, sino colores.

Descripción de tu imagen
Figura 1 - Tabla de intensidad sonora

En los espectrogramas, a medida que transcurre el tiempo, va quedando un colorido gráfico, donde para cada rango de frecuencia y según su correspondiente intensidad, se tiñe según la tabla de la Figura 1. A continuación podemos observar en la Figura 2 el espectrograma de un tema musical de rock, donde se ven claramente en la zona de bajas frecuencias los golpes de bombo (63Hz) con un rojo intenso, que denotan su alta presencia en la mezcla.

Descripción de tu imagen
Figura 2 - Espectrograma de 5 segundos de un tema de Rock

Los Espectrogramas nos permiten conocer el espectro de una señal a medida que pasa el tiempo, y poder comparar distintos instantes en un mismo gráfico.

A diferencia de los Espectrogramas, sólo nos muestran la composición espectral del instante en que estamos observando. Son herramientas muy útiles y precisas a altas frecuencias, ya que permiten hacer una partición del espectro, en bandas equidistantes y considerando que para nuestra comodidad utilizaremos la escala logarítmica, podremos conseguir resoluciones de centésimas de octava en el orden de los 20KHz. Por el contrario, para bajas frecuencias la definición será muy pobre. Es por ello, que se suele generar una interpolación entre los máximos de cada banda como muestra la Figura 3, para intentar reconstruir con curvas, la información pobremente detallada desde un punto de vista musical por debajo de los 500Hz.

Descripción de tu imagen
Figura 3 - FFT Analizador de Barras

Resultan ser los más adecuados para estudiar el espectro musical a tiempo real. Los hay por Bandas de Octava, por Tercios de Octava, Sextos de Octava, Doceavos e incluso Treintaidosavos de Octava. Los RTA (Real Time Analizers) utilizan este concepto, donde cada banda de frecuencias a estudiar posee el ancho de banda correspondiente a la partición que le corresponde en la escala logarítmica de base 2. Por ejemplo, para un analizador por Tercios de Octava, la banda de 100Hz tendrá un ancho máximo de 50Hz, pero la banda de 10KHz podrá tener un ancho máximo de hasta 5KHz. Esto es muy importante, ya que se podrán optimizar recursos de procesamiento en las altas frecuencias, para poder aprovecharlos en lograr la mejor resolución en bajas frecuencias. En las Figuras 4 y 5 de la página siguiente podemos observar dos RTA, de Tercios de Octava y Doceavos de Octava, respectivamente.

Descripción de tu imagen
Figura 4 – Analizador de Tercios de Octava
Descripción de tu imagen
Figura 5 – Analizador de Doceavos de Octava

Notemos que el analizador de Tercios de la Figura 4 posee dos medidas adicionales muy útiles: un “peak hold” (que simboliza el valor máximo de pico medido) y una medición del valor RMS por cada banda. Este último nos puede dar una excelente descripción de la densidad espectral del material analizado, para poder lograr un espectro equilibrado a la hora de ecualizar el master general.

La Figura 5 corresponde a un analizador por doceavos de octava. No es casual dicha configuración, ya que permite un muy buen análisis por semitonos.

Se lo conoce también como Stereo-Meter. Es un medidor que visualiza la imagen estéreo de manera intuitiva. Si la señal es netamente mono, se apreciará una línea recta en posición vertical, y su longitud dependerá de la amplitud de la señal. Si la señal proviene sólo del canal R, se observará una línea recta a 45° ascendente. Si la señal proviene sólo del canal L, se observará una línea recta a 45° descendente. En el caso de que el canal L sea igual al R, pero con la polaridad invertida, el Goniómetro dibujará una línea recta horizontal. Para cualquier tipo de señal estéreo, el comportamiento dependerá de las diferencias y similitudes entre los canales L y R, y será de gran utilidad para ver si las mezclas están levemente inclinadas hacia uno de los canales, entre otras cosas.

Descripción imagen 1
Señal Mono
Descripción imagen 2
Solo Señal R
Descripción imagen 3
Solo Señal L
Descripción imagen 4
Estereo Equilibrado