Saiba mais sobre: formatos de arquivo de áudio

por Mário Megatallica

Quem trabalha com áudio está acostumado a lidar com centenas de siglas - muitas delas em inglês. E muitas delas se tornam de uso tão comum no nosso cotidiano que acabam por se tornar uma palavra propriamente dita, sem que percebamos que se tratam de abreviações técnicas relativas à nomes das empresas ou técnicas de programação que as originaram.

Este artigo se propõe a desvendar o que por trás dos nomes das extensões de arquivo de áudio mais comuns no nosso cotidiano. Tais nomes escondem informações interessantes que explicam a origem de cada formato.

Confira.

Formatos mais comuns de arquivo de áudio

WMA
O Windows Media Audio é uma tecnologia de compressão de áudio desenvolvida pela Microsoft para uso no Windows Media Player. A sigla determina tanto o formato de arquivo quanto seus codecs¹. A primeira versão do codec de WMA foi lançado pela empresa em 1999 e é chamado de WMA1, sendo que naquele mesmo ano o algorítimo de compressão do arquivo foi alterado, gerando a segunda versão do codec - o WMA2. A partir de então ganhou novas nomenclaturas de acordo com as novas versões do Windows Media Player. Entretanto, pode ser reproduzido pelo Winamp e outros reprodutores de áudio, com exceção do iTunes, que oferece serviço de codificação de WMA ao AAC. Oferece qualidade de áudio igual ao MP3, porém pode haver limitação em relação à licenciatura por ser proprietário. Vale ressaltar que este formato, assim como o MP3 , é um formato lossy, ou seja, ocorre nele a remoção de certas freqüências e harmônicos / informações em geral contidas no fluxo de áudio original durante a compressão neste formato.


Arquivos WMA não costumam ter um tamanho grande (de 3 a 6Mb, dependendo do tamanho da música), justamente devido à sua compressão e perdas.

MP3
MP3 é uma abreviação de MPEG 1 Layer-3 ou (Mini Player)(camada 3). Trata-se de um padrão de arquivos digitais de áudio estabelecido pelo Moving Picture Experts Group (MPEG), grupo de trabalho de especialistas de Tecnologia da Informação vinculado ao ISO e à CEI. As camadas referem-se ao esquema de compressão de áudio do MPEG-1. Foram projetadas em número de 3, cada uma com finalidades e capacidades diferentes. Enquanto a camada 1, que dá menor compressão, se destina a utilização em ambientes de áudio profissional (estúdios, emissoras de TV, etc) onde o nível de perda de qualidade deve ser mínimo devido à necessidade de reprocessamento, a camada 3 se destina ao áudio que será usado pelo cliente final. Como se espera que esse áudio não sofrerá novos ciclos de processamento, a compressão pode ser menos conservadora e aproveitar melhor as características psicoacústicas do som limitando-se apenas pela qualidade desejada para o ouvido humano. 


O MP3 (MPEG-1/2 Audio Layer 3) foi um dos primeiros tipos de compressão de áudio com perdas quase imperceptíveis ao ouvido humano. O seu bitrate (taxa de bits) é da ordem de kbps(quilobits por segundo), sendo 128 kbps a taxa padrão, na qual a redução do tamanho do arquivo é de cerca de 90%, ou seja, o tamanho do arquivo passa a ser 1/10 do tamanho original. A taxa de bits pode chegar a até 320 kbps (cerca de 2,3 MB/min. de áudio), gerando a qualidade sonora máxima do formato, na qual a redução do tamanho do arquivo é de cerca de 75%, ou seja, o tamanho do arquivo passa a ser cerca de 1/4 do original. Há também outras taxas intermediárias, como 192 kbps e 256 kbps, cuja escolha depende da relação custo-benefício desejada, onde o tamanho do arquivo pode ser reduzido em detrimento da qualidade/fidelidade do som. Para efeitos de comparação, as músicas de um CD de audio comum possuem uma taxa de amostra de dados de 1411,2 kbps.

O Mp3 é conhecido como a extensão de áudio mais compactada, logo, gera arquivos de tamanho pequeno (em média 3Mb).

Para efeitos de logística, o nascimento do MP3 aconteceu em 1987, em um laboratório do Instituto Fraunhofer, na Alemanha. Nesse local, um grupo de pesquisadores desenvolveu um algoritmo para compressão de áudio chamado Eureka-EU 147. Foi o ponto zero do MP3.

Um ano mais tarde, foi criado o Moving Pictures Experts Group (MPEG), que possiblitou ao grupo de Fraunhofer trabalhar em conjunto com a International Standards Organization (ISO), entidade responsável pelos padrões de qualidade industriais seguidos em todo o mundo.

Assim, diversas tecnologias para codificação de áudio e vídeo foram criadas com base no MPEG. Entre essas criações estava o MPEG Audio Layer 3, o popular MP3.

Mas durante um bom tempo, os arquivos de MP3 não se encontravam de foram organizada na internet. Ainda assim, era necessário que o micro tivesse um software específico para se ouvir as músicas.

O primeiro MP3 player foi criado em 1997, nos laboratórios da Advanced Media Products. Batizado de AMP MP3 Playback Engine, o software foi disponibilizado de forma aberta para quem quisesse pegá-lo. Entre os que adquiriram o software, dois adolescentes chamados Justin Frankel e Dmitry Boldyrev, que acrescentaram uma interface Windows ao programa e criaram o Winamp.

Agora, para efeitos de medalha de honra e mérito, quem realmente colocou o MP3 e todas as suas facilidades no topo maior da cultura pop do século 21, foi um moleque chamada Shawn Fanning.

Com 19 anos, Fanning inventou um programa que facilitava a busca de músicas em MP3 na internet. Esse programa chama-se Napster e pode ser considerado uma das últimas revoluções da história do rock.

WAV
WAV (ou WAVE), forma curta de "waveform" audio format, é um formato-padrão de arquivo de áudio da Microsoft e IBM para armazenamento de áudio em PCs.



É uma variação do método de formatação de fluxo de bits RIFF para armazenar dados em blocos (chunks) e também parecido com os formatos IFF e o AIFF usados em computadores Macintosh. Ambos WAVs e AIFFs são compatíveis com os sistemas operacionais Windows e Macintosh. São levadas em conta algumas diferenças nos processadores Intel como a ordem de bytes "little-endian". O formato RIFF age como um "empacotador" (wrapper) para vários codecs de compressão de áudio. É o principal formato usado nos sistemas Windows para áudio simples.

Apesar de um arquivo WAV poder conter áudio compactado, o formato mais comum de WAV contém áudio em formato de modulação de pulsos PCM (pulse-code modulation). O PCM usa um método de armazenamento de áudio não-comprimido (sem perda). Usuários profissionais podem usar o formato WAV para qualidade máxima de áudio. Áudio WAV pode ser editado e manipulado com relativa facilidade usando softwares.

Por ser um formato sem compressão, o WAV ocupa um espaço muito grande de armazenamento, o que pode ser resolvido convertendo o arquivo para outros formatos.

AIFF
O Audio Interchange File Format (AIFF em abreviatura) é o formato de áudio utilizado pelo sistema operativo da Apple, o Mac OS e em computadores Silicon Graphics. A extensão destes ficheiros pode ser aiff ou aif.

O AIFF é considerado o equivalente da Apple para o Microsoft WAV, e assim como este, também gera arquivos de grandes no disco rígido.

FLAC
FLAC (Free Lossless Audio Codec, que significa Codec Livre de Áudio Sem Perdas em inglês) é um codec de compressão de áudio sem perda de informação. Ao contrário de codecs com perda tais como o MP3 e o Vorbis, ele não remove nenhuma informação do fluxo de áudio, mantendo a qualidade do som.

Josh Coalson é o autor original do FLAC. Em 29 de Janeiro de 2003, Xiphophorus (agora conhecida como fundação Xiph.Org) anunciou a incorporação do FLAC sob sua bandeira juntamente com Vorbis, Ogg, Theora, Speex, e outros.

O FLAC foi criado para um empacotamento eficiente de dados de áudio, diferente de algoritmos gerais de compressão sem perda, como ZIP e gzip. Enquanto um ZIP pode compactar um arquivo de áudio com qualidade de cd em 10% ou 20%, com FLAC pode-se alcançar taxas de compressão de 30% a 50%.

Codecs com perda de dados podem alcançar taxas de 80% ou mais, descartando dados do stream original. O FLAC utiliza predição linear para converter amostras do áudio em uma série de pequenos números não correlatos (o residual), que são armazenados eficientemente com o uso do algoritmo Golomb-Rice. Ele também utiliza codificação run-length para blocos de amostras idênticas, como passagens silenciosas. As vantagens técnicas do FLAC comparado a outros codecs sem perda residem na sua habilidade de streaming e em um rápido tempo de decodificação, que independe do nível de compressão.

AAC
O Advanced Audio Coding é um formato de arquivo de áudio de baixa compressão. Concebido para ser o sucessor do MP3, garante uma qualidade de áudio melhor com as mesmas taxas utilizadas em arquivos Mp3.


Ele suporta taxas de amostragem superiores a 48KHz e para atingir a qualidade de "áudio transparente" precisa de trabalhar em taxas acima de 128Kbits/s.

AAC é também o formato de áudio padrão para iPhone, iPod, iPad, Nintendo DSi, iTunes, DivX Plus Web Player e PlayStation 3.

¹ Codec - são decodificadores de sinal.

Fontes:

Nenhum comentário: