Saltearse al contenido

Errores más comunes en la Mezcla y Masterización de Audio

Instrumento fundamental en cualquier banda de rock y pop, así como en el jazz, tango y decenas de géneros musicales, el bajo eléctrico o acústico tiende a ocupar más espacio del que le corresponde en la zona de frecuencias graves y medios-graves. Esto puede suceder por un número de razones, entre ellas el desconocimiento de la respuesta acústica de la sala en la que se está realizando la mezcla o también el uso de monitores de campo cercano sin el apoyo de un sub-woofer para controlar la emisión de las frecuencias graves. Esta última razón puede ocasionar que la respuesta en frecuencia sea en el mejor de los casos aceptable hasta los 100Hz, iniciando una caída abrupta a partir de allí y generando la necesidad de aumentar la cantidad de graves en la mezcla para compensar auditivamente la carencia de los monitores “near-field”. Si el problema es la sala, la situación puede ser aún más complicada porque podrían existir modos acústicos que anulen completamente la presencia de ciertas frecuencias graves en el punto de escucha y magnifiquen esas mismas frecuencias a pocos centímetros de éste, con lo cual es casi imposible saber cuál es la realidad.

Una buena parte de la responsabilidad de que los platillos tengan un sonido acorde con el resto de la banda es del propio baterista. Si la ejecución es muy furiosa o si hay tendencia a tocar siempre con el Hi-Hat abierto, la presencia de este instrumento será demasiado notoria y podría llegar a ser molesta. La otra parte de la responsabilidad recae en la selección de los micrófonos adecuados y en la ecualización en la etapa de mezcla. El Hi-Hat es uno de los instrumentos que tienden a ser sobre-ecualizados para agregar brillo al conjunto, generando muchas veces una aspereza innecesaria que termina siendo molesta. Reducir un poco la energía en la zona de bajas frecuencias para evitar la bola de graves suele dar mejores resultados que exceder el brillo en los platos en busca de una eventual compensación.

En la gran mayoría de los casos en que el bombo en una mezcla está fuera de plano, es decir, demasiado fuerte en proporción al resto de los instrumentos; se puede comprobar que existe una deficiencia en la respuesta acústica del control. Es realmente muy difícil encontrar el plano ideal para el bombo en una banda de rock, por ejemplo, sin una exacta reproducción de todo el espectro sonoro por parte del sistema de monitoreo. Además, es un instrumento que presenta complicaciones varias a la hora de la mezcla, ya sea porque se oye demasiado el golpe en el parche o porque tiene demasiado cuerpo, por la irregularidad en el toque del baterista, la dificultad para colocar el micrófono en el lugar exacto e infinidad de motivos más, el bombo es generalmente problemático. Cuando una mezcla tiene bien resuelta la relación del bombo con la tarola comienza a armarse una base sólida, pero cuando no es así es poco lo que puede modificarse desde el mastering sin empeorar otros aspectos de la misma.

Estos casos pueden o no ser complicados de resolver, dependiendo de cuan parejo sea el problema para todos los instrumentos. Es decir, si toda la mezcla está opaca y falta de energía en las frecuencias altas y medias-altas no es difícil darle un poco de energía en el mastering. Pero puede ser difícil de resolver si (como sucede muchas veces) hay un instrumento brillante en medio de una mezcla opaca, o viceversa. Típicamente, la tarola puede estar necesitando más brillo y ataque, pero los platillos están agresivos y sobre-ecualizados. Entonces, la mejor solución es volver atrás un paso y resolver el problema puntualmente antes de intentar el mastering, porque sólo podríamos corregirlo generando otro problema. Hay que poner atención en el foco del problema, ya que muchas veces se confunde el exceso de graves con la falta de brillo y se intenta compensar en el mastering con un agregado de altas frecuencias totalmente innecesario, cuando en realidad lo que la mezcla pide es una reducción en determinada zona de las frecuencias graves.

Uno de los más típicos defectos en las mezclas de realización casera. La voz de muchos cantantes es sumamente proclive a sonar sibilante, es decir, excedida en alguna zona de frecuencias que típicamente puede estar entre los 6 y los 9KHz, aunque también hay casos de sibilancia prominente en la zona de los 3,5 KHz. La solución sin dudas es utilizar un buen de-esser, preferiblemente un hardware dedicado externo (analógico o digital) de buena calidad, ya que la remoción de la sibilancia es un proceso delicado que puede afectar armónicos de muchos otros instrumentos, tales como la guitarra, el piano, los platillos, la tarola, etcétera. Idealmente habría que resolver este problema en la etapa anterior al mastering para que sea posible trabajar la voz con independencia del resto de los instrumentos, pero muchas veces esto no es posible y hay que tratar de elegir con el máximo cuidado la frecuencia central del problema para removerla parcialmente con la mínima afectación posible del resto de los componentes de la mezcla. Es muy importante evaluar el antes y después de la aplicación de un de-esser, porque es perfectamente posible que la sibilancia natural del cantante, sin ningún proceso, sea preferible antes que el ahogo que puede generar un reductor de energía incorrectamente aplicado.

Ambos tienen predisposición a sonar excedidas en el rango medio, lo que les da un color que en inglés se define como harsh. Este exceso es fácilmente detectable para un oído entrenado, pero no tanto para el público en general y tiende a producir cansancio auditivo rápidamente. Una mezcla excedida en la zona de 3 a 4KHz resulta molesta y genera ganas de bajar el volumen o dejar de escucharla. Además, este efecto quita calidez de la música, haciéndola menos disfrutable. Si este problema no ha sido resuelto al llegar al mastering, la mejor solución es utilizar un filtro dinámico estilo de-esser, exactamente ubicado en el centro de la frecuencia más crítica y con un ancho de banda acorde a la necesidad de la mezcla. Es decir, si éste es el caso tenemos que dedicarle tiempo a encontrar con la mayor precisión posible la frecuencia central, el factor de selectividad del filtro (comúnmente llamado Q), el umbral a partir del cual queremos que actúe la reducción de ganancia, la relación de compresión, el ataque y el reléase. Si hacemos esto con suficiente cuidado, el resultado será sin duda más amigable que la versión original de la mezcla, porque estaremos reduciendo la energía en la zona molesta sin afectar otras partes del espectro. Sin embargo, es importante considerar que las frecuencias medias son absolutamente necesarias en cualquier mezcla, siempre y cuando no estén presentes en exceso. Si la aplicación del filtro dinámico ahoga demasiado la presencia de la voz, por ejemplo, estaremos generando un problema aún mayor que el que queremos solucionar.

Un problema recurrente de nuestra época es la aparente necesidad de generar mezclas con alto nivel de presión sonora, tendencia que empezó a acentuarse en los últimos años con el advenimiento de plugins de compresores y limitadores estéreo poderosos y fáciles de conseguir. Es un gran error el apretar una mezcla que luego va a ser masterizada, lo único que logramos es echar a perder el rango dinámico disponible y dificultar la tarea de mastering. La compresión no es un proceso reversible, por lo tanto, lo que se pierde con el simple uso de ese plugin no puede ser recuperado en el mastering. Cuando una mezcla llega de esta manera para ser masterizada, debemos intentar por todos los medios que deshagan el último proceso y nos entreguen la mezcla original pre-compresión, en beneficio del resultado final.

Rango dinámico excesivo en la voz del Cantante

Sección titulada «Rango dinámico excesivo en la voz del Cantante»

En algunos casos deberíamos realizar la masterización a partir de los llamados “stems”, es decir, que nos envían las pistas y las voces por separado. Si esto sucede, el beneficio eventual es que podremos tratar la voz con algún tipo de proceso que no corresponda aplicar al resto de la mezcla. El problema potencial aparece cuando la voz tiene un rango dinámico demasiado grande (especialmente cuando se trata de un arreglo vocal de 3 o más voces, caso típico del folklore argentino) y entonces se vuelve difícil de manejar. Hay casos en los que es necesario tratar cada parte de una canción por separado, para poder empatar las dinámicas y no llegar a la saturación.

A modo de sugerencia, siempre nos conviene revisar la dinámica general de las voces cuando éstas tienen preponderancia en la mezcla. No es necesario que suenen siempre al mismo volumen, pero es importante que se mantengan en un rango coherente a lo largo de todo el disco.

Muchas veces pensamos en que la masterización consiste en agregar volumen, graves y brillo. Al contrario, eso es un error, ya que cualquier exceso es malo, al menos en el audio profesional.

O sea que si se busca darle carácter a la mezcla no es imprescindible que tenga muchísima energía en las frecuencias graves porque seguramente eso hará que sobrepase los límites de tolerancia de los reproductores de mediana o baja calidad. Si bien puede sonar aceptable en un estudio equipado con sub-woofer y monitores de alta calidad, lo más probable es que resulte inescuchable para la mayoría de la gente.

La presencia del hiss está relacionada con una cantidad de variables, entre las cuales se encuentra la inapropiada selección de micrófonos o preamplificadores, el ajuste de ganancia en el momento de la toma de sonido (lo cual a su vez está directamente relacionado con la dinámica del ejecutante). Si se trata de una guitarra española, por ejemplo, es muy importante escuchar previamente toda la ejecución para asegurar que la dinámica de la performance quede perfectamente contenida dentro del rango aceptable. Típicamente la ejecución tendrá partes suaves y partes más intensas, donde el volumen emitido por el instrumento puede variar en más de 10dB. Es imprescindible entonces tomar medidas para no agregar hiss en la captura de las partes de menor volumen ni saturar en las de mayor volumen. Ayuda también el poseer un convertidor de alta resolución y trabajar en una profundidad mínima de 24bits.

Click’s causados por defectos en la instalación eléctrica

Sección titulada «Click’s causados por defectos en la instalación eléctrica»

Otro de los problemas más comunes en los home estudios es la falta de una instalación eléctrica adecuada (es decir, trifásica), de manera que sea posible conectar todo lo vinculado al procesamiento, grabación y reproducción de audio en sólo una de las fases, liberándola de los posibles efectos negativos de otros dispositivos (heladera, aire acondicionado, motores eléctricos en general). Si este problema no está resuelto, lo más probable es que al encenderse cualquiera de estos dispositivos en mitad de una grabación obtengamos un pico perfectamente audible.

Este tema lo hemos tratado en mayor profundidad anteriormente en la sección (2.4.2.3), y como solucionar estos tipos de errores.

Cuando el reloj patrón de un circuito digital no es único, aparecen invariablemente errores de base de tiempo, conocidos como jitter. Estos errores están relacionados con el hecho de que es imposible que dos relojes puedan disparar exactamente la misma cantidad de samples por segundo y aún si lo hicieran, el momento de disparo de ambos sería diferente. Por lo tanto, hay que evitar absolutamente la multiplicidad de relojes en un sistema digital de procesamiento de audio, todos los equipos deben estar esclavizados al reloj maestro, que deberá ser el más estable del circuito.

Muchas veces las mezclas ya terminadas son innecesariamente post-procesadas utilizando dithering (que sólo conviene aplicar cuando se reduce la profundidad de bits), lo cual agrega intencionalmente una dosis de ruido de amplio espectro con el propósito de disimular la pérdida de resolución. Lo correcto es entregar las mezclas en el mismo formato en que se realizaron, típicamente 24bits/88.2KHz, para mezclas que se editarán en CD y 24bits/96KHz para mezclas que se editarán en DVD. Hay editores digitales que soportan 32bits de resolución y hay formatos que permiten hasta 192KHz de frecuencia de muestreo, pero el estándar aceptable sigue siendo el que mencionamos más arriba. Si se respeta esta regla, no es necesario post-procesar las mezclas finales en absoluto.