¿Cómo funciona la compresión de audio?
El objetivo de la compresión de audio es reducir el número de bits necesarios para reproducir con precisión un sonido analógico. El primer proceso que analizaremos se llama «pérdida». La compresión con pérdida es una técnica unidireccional que elimina los datos no críticos para ahorrar espacio. Estas técnicas son los métodos más comunes utilizados para comprimir archivos de audio, que se muestran en archivos MP3, AAC y WMA por igual. Hay dos lugares en los que los codecs con pérdidas buscan ahorrar bits: la tasa de bits y la psicoacústica.
Saltar
Tasa de bits
La velocidad de bits mide la cantidad de bits utilizados para codificar un solo segundo de audio. Por ejemplo, si utilizamos codificación de baja calidad de 8 kilobits por segundo (kbps), nuestro algoritmo se limita a utilizar sólo 8 kilobits de datos para describir cada segundo de audio. Eso es como tratar de describir una fotografía a todo color con sólo unos pocos cientos de píxeles. Es posible que los trazos generales sean correctos, pero en general se verá una imagen muy degradada. Si usamos una tasa de bits de mayor calidad como 192kbps, tenemos mucho espacio para cubrir los detalles matizados. Para volver a nuestro ejemplo fotográfico, ahora tenemos suficientes píxeles para describir las diferentes luces, sombras y colores de una imagen. Una tasa de bits alta no determina la calidad de una grabación por sí sola, pero una tasa de bits baja puede limitar gravemente la calidad de salida.
Psicoacústica
La psicoacústica es la ciencia de cómo el cerebro entiende los sonidos. Al manipular las peculiaridades conocidas en la forma en que los humanos perciben el sonido, los algoritmos de compresión pueden eliminar inteligentemente los detalles que la mayoría de los oídos humanos no se perderán. El objetivo es «redondear» la información que no cambiará la calidad de audio percibida de una pista, eliminando juiciosamente sólo la información sin importancia.
Por ejemplo, usted podría saber el rango típico de audición humana está entre 20Hz y 20kHz. Obviamente, los sonidos fuera de ese rango pueden ser eliminados. Además, el rango más detallado de la audición humana se encuentra entre 100Hz y 4kHz , y la eliminación de los sonidos silenciosos fuera de esos rangos de frecuencia hace un daño mínimo a la calidad de una grabación. Podemos hacer un truco similar con sonidos muy contrastados. Si un sonido muy fuerte y un sonido muy silencioso se reproducen al mismo tiempo, el sonido silencioso es mucho más difícil de percibir de lo que sería por sí solo. Los codificadores aprovechan este «enmascaramiento de sonido» para eliminar el sonido silencioso, ahorrando bits en el proceso.
La frecuencia también puede afectar la percepción de los sonidos. Por ejemplo, un ritmo de tambor persistente y de baja frecuencia tiende a ahogar los armónicos más delicados y de mayor frecuencia de los instrumentos melódicos. Y el enmascaramiento de sonido es especialmente efectivo por encima de 15kHz, donde la audición humana es típicamente menos sensible para empezar.
Los esquemas comunes de compresión de audio, como el MP3, aprovechan toda la gama de posibilidades de compresión a la vez que intentan permanecer tan fieles a la grabación original como sea posible. Por supuesto, algunas personas sienten que quitar estas frecuencias hace mucho daño a la grabación. Por eso existen estándares de compresión sin pérdidas.
¿Qué es el audio «sin pérdidas»?
El objetivo de la compresión de audio sin pérdida es reducir el tamaño del archivo y dejar el audio original intacto. Estos ecodecodecs no utilizan ninguna de las técnicas de compresión permanente mencionadas anteriormente, sino que se centran en métodos de compresión de datos totalmente reversibles. Utilizan técnicas de compresión sin pérdidas tomadas de algoritmos de compresión de archivos como ZIP para eliminar datos redundantes al tiempo que preservan la integridad de la información subyacente. Dos populares códecs de audio sin pérdida -FLAC y Apple Lossless (ALAC)- utilizan esquemas basados en compresión ZIP.
Centrarse en la compresión de datos sólo significa preservar muchos de los detalles que los estándares MP3 y otros estándares con pérdidas borrarían. Si tiene oídos agudos y una configuración de audición de alta calidad, la diferencia puede ser palpable.
Sin embargo, la compresión sin pérdidas no sólo es buena para escuchar, sino que también es una gran herramienta de almacenamiento. Al igual que no querrías que un JPG de 72dpi fuera la única copia digital de las fotografías de Ansel Adam, no queremos sólo 128kbpsMP3s de «Kind of Blue». Los estándares sin pérdidas como FLAC nos permiten almacenar audio eficientemente sin tirar datos potencialmente valiosos. También facilitan la remasterización y redistribución de ese audio, ya que comenzar con masters sin compromisos significa un producto final de mayor calidad.