A Alliance for Open Media (AOMedia) lançou recentemente oficialmente a primeira versão de especificação final 1.0.0 do padrão de codificação de vídeo AV2, marcando que esta nova geração de formato de codificação de vídeo de código aberto e livre de royalties, considerado o sucessor do AV1, entrou em um estágio estável, permitindo que a indústria desenvolva codificadores e decodificadores compatíveis com o padrão e execute otimização de longo prazo em torno de especificações fixas, sem ter que se preocupar com problemas de compatibilidade causados ​​por versões futuras. Espera-se que o AV2 comprima ainda mais a taxa de bits e reduza os custos de largura de banda em streaming de mídia e cenários de vídeo de ultra-alta definição. No entanto, especialistas da indústria também alertam que a sua complexidade de descodificação é muito maior do que a do AV1 existente, e enfrentará desafios consideráveis ​​no suporte de dispositivos terminais e na aceleração de hardware.

AOMedia foi fundada em 2015. O padrão de codificação AV1 lançado em 2018 foi projetado como um formato de vídeo livre de royalties que pode competir com H.265 (HEVC). Após vários anos de desenvolvimento, embora sua popularidade não seja rápida, gradualmente ganhou uma posição em vídeos on-line e serviços de vídeo em nuvem. O YouTube tem experimentado a codificação AV1 desde 2018, seguido pela Netflix introduzindo o streaming AV1 em seu aplicativo móvel Android em 2020, e a Amazon lançando suporte à codificação AV1 em tempo real por meio dos serviços de mídia AWS Elemental em 2024. Ao mesmo tempo, fabricantes como AMD, Intel e NVIDIA adicionaram sucessivamente suporte acelerado para decodificação e codificação AV1 em seu hardware e drivers, tornando a experiência de reprodução de terminal deste formato gradualmente madura.

Comparado com AV1, o principal ponto de venda do AV2 é reduzir significativamente a taxa de bits sob as mesmas condições subjetivas de qualidade de imagem. De acordo com dados de avaliação oficial publicados pela AOMedia, sob diferentes indicadores objetivos (como PSNR, etc.), AV2 pode atingir uma redução média da taxa de bits de aproximadamente 30% –34% em comparação com AV1, mantendo a mesma qualidade visual. Para plataformas de streaming de mídia, isso significa que, ao mesmo tempo que garante a experiência de visualização do usuário, o AV2 pode completar a transmissão de vídeo da mesma qualidade com menor largura de banda, comprimindo ainda mais os custos de distribuição de conteúdo. Especialmente em cenários de vídeo de alta resolução e alta faixa dinâmica, como 4K, 8K e HDR, a economia de largura de banda e armazenamento será ainda mais considerável.

A comparação fornecida pela AOMedia mostra a diferença na fidelidade de compressão entre AV1 e AV2 em termos de relação sinal-ruído de pico (PSNR). PSNR é um indicador matemático comumente usado que mede a diferença entre a imagem de vídeo compactada e o sinal original. Valores mais altos geralmente significam que mais detalhes são preservados. Nestes testes, o AV2 foi capaz de produzir uma taxa de bits significativamente menor sob as mesmas condições PSNR, refletindo sua atualização abrangente em ferramentas e algoritmos de codificação.

Para alcançar os ganhos de compressão mencionados acima, o AV2 introduz uma série de melhorias na tecnologia de codificação, incluindo métodos mais avançados de previsão intra-quadro e de previsão entre quadros, modelagem de movimento mais sofisticada, ferramentas de transformação e filtragem mais complexas, uma estrutura de particionamento de bloco mais flexível e um mecanismo de codificação de entropia atualizado. Essas mudanças aumentam a dimensão da tomada de decisões e a liberdade do algoritmo no lado da codificação, permitindo que o codificador corresponda com mais precisão às características do conteúdo de vídeo, comprimindo assim informações mais redundantes com a mesma qualidade de imagem.

No entanto, uma maior eficiência de compressão não vem sem um preço. De acordo com a avaliação do líder do projeto VideoLAN, Jean-Baptiste Kempf, a complexidade computacional do AV2 no lado da decodificação aumentou significativamente em comparação com o AV1. Atualmente, estima-se que a complexidade de decodificação do AV2 seja cerca de cinco vezes maior que a do AV1, o que tornará muito difícil para um grande número de CPUs existentes decodificar suavemente os vídeos AV2 por meio de software puro. Na ausência de suporte extensivo à aceleração de decodificação de hardware, os dispositivos terminais comuns podem ser incapazes de suportar a carga adicional trazida pelo AV2 em termos de consumo de energia, geração de calor e suavidade, retardando assim sua implementação em navegadores, caixas de TV e dispositivos móveis.

Por causa disso, Kempf acredita que antes que os chips e plataformas convencionais forneçam aceleração completa de hardware AV2, ainda existem muitas incertezas nas perspectivas de adoção em larga escala deste padrão. Em outras palavras, se o AV2 pode repetir o caminho de desenvolvimento do AV1 e ser realmente implantado em grandes plataformas de streaming de mídia, como YouTube, Netflix e Amazon, dependerá em grande parte se e quando os fabricantes de CPU, GPU e SoC estiverem dispostos a dedicar recursos suficientes de suporte de hardware a ele.

Atualmente, com a implementação oficial da especificação AV2 1.0.0, a AOMedia e seus membros já podem promover a implementação e otimização de codificadores, decodificadores e cadeias de ferramentas de desenvolvimento relacionadas sob um padrão unificado. A indústria geralmente espera que, nos próximos anos, o suporte experimental em torno do AV2 apareça pela primeira vez em players de código aberto, versões experimentais de navegadores e alguns serviços de transcodificação em nuvem. Aplicações comerciais reais para usuários em massa ainda precisam esperar que o ecossistema de hardware amadureça e que as plataformas de conteúdo sejam mainstream para fornecer rotas de adoção mais claras.