G. 729 família de Codecs de baixa taxa de bits (VoIP)
3.6
a família G. 729 de codecs é popularmente usada na maioria das implantações VoIP. G. 729 é um ITU-T G. 729 recomendação para uma estrutura conjugada algébrica-código-animado linear-predição (CS-ACELP)
algoritmo de compressão de fala. O G. 729 faz uso de modelos de trato vocal humano adequados para sinais de voz, ao contrário dos codecs G. 711 e G. 726, que usam compressão baseada em forma de onda. O Basic G. 729 comprime a voz para 8 kbps, que fornece oito vezes mais compressão do que o G. 711 e fornece boa qualidade de voz.
G. 729 Anexo A (G.729A) é a versão de complexidade reduzida da recomendação G. 729, e comprime a voz para os mesmos 8 kbps com a troca de uma ligeira perda de qualidade em comparação com G. 729. Esta versão é desenvolvida principalmente para aplicativos de voz e dados simultâneos multimídia, embora o uso do codec não se limite a esses aplicativos. G. 729A é bit stream interoperável com a versão completa do G. 729. Este codec possui ocultação de perda de pacotes integrada. O codec com sufixo B denotado como G. 729b ou G. 729AB suporta VAD no codificador e CNG no decodificador . G.729 tem uma ampla família de codecs, e alguns dos codecs populares
estão listados na tabela 3.3. Na implantação de VoIP, O G. 729AB é popularmente usado. Na atualização de banda larga, esses codecs podem ser substituídos por G. 729.1. Esses codecs de banda larga são interoperáveis com versões de banda estreita. Portanto, um codec de banda larga sozinho deve ser suficiente para suporte de banda estreita de banda larga e 8 kbps. Exceto G. 722, outros codecs de banda larga comprimem voz para taxas de bits inferiores a G. 711. Na seção a seguir, é fornecida uma visão geral de alto nível sobre o G. 729AB. Codec G. 729AB faz uso de G. 729 como um padrão de linha de base. Para melhor compreensão do G. 729AB, consulte as recomendações G. 729, G. 729B e G. 729A.
quadro 3.3. ITU-T G. 729 Família de Narrowbond de banda Larga e de Voz Codecs
o Nome do Codec | Descrição | Aplicação |
G. 729 | Basic 8 kbps CS- | Suporte em VoIP voz |
ACELP codec de voz | gateways | |
G. 729B | G.729 com o silêncio | |
compressão | ||
G. 729A | Redução de complexidade | Popular em adaptadores VoIP e IP |
8 – kbps CS – ACELP | telefones, compatível com G. 729, | |
codec de voz | e G. 729.1 | |
G. 729AB | G. 729A com o silêncio | compatível com G. 729, G729B, |
compressão | G729.1 | |
G. 729E (G.729 | 11.8 – kbps CS – ACELP | Não é popular no VoIP, funciona melhor |
Anexo E) | codificação de voz | para a música e plano de fundo e |
algoritmo | é usado em aplicações de vídeo | |
G. 729.1 banda larga | Embedded variável 8- | de voz em banda Larga |
estreita e banda larga | 32 kbps, bits | |
interoperável com | ||
G. 729, G.729A |
Codec G. 729
o codec G. 729 consiste em um codificador e Decodificador separados. O codec comprime amostras de fala como quadros usando um procedimento de análise por síntese CS-ACELP. O codec opera com quadros de 10 ms com um olhar à frente de 5 ms, o que resulta em atraso algorítmico total de 15 ms. uma visão geral sobre o codificador e decodificador é dada em relação à Fig. 3.4.
figura 3.4. G. 729 codec. (a) encoder-compressão. (b) decodificador-descompressão de ITU-T-G. 729 — redesenhado com alguma simplificação.
Codificador G. 729. O codificador G. 729 é baseado no modelo de codificação CELP (Code-excited linear-prediction). Para cada quadro de 10 ms, o sinal de fala é analisado para extrair os parâmetros do modelo CELP. Os parâmetros são coeficientes de filtro de previsão linear codificados como pares espectrais de linha, índices adaptativos e codetópicos fixos e ganhos. Esses parâmetros são codificados e transmitidos como carga útil para o aplicativo VoIP. Como mostrado na Fig. 3.4, a fala pré-processada é analisada para coeficientes de filtro LP. Esses coeficientes são convertidos em pares de espectro de linha (LSP) e são quantizados usando preditivo quantização vetorial de dois estágios (VQ). A estimativa de pitch open — oop é calculada para cada quadro de 10 ms com base em um sinal de fala perceptualmente ponderado. A análise de pitch em circuito fechado é realizada usando o sinal de destino e a resposta de impulso pesquisando em torno do valor do atraso de pitch open-l oop. O novo sinal alvo é calculado e usado na busca codetópica fixa para chegar à excitação ideal. Os ganhos de contribuições codetópicas adaptativas e fixas são quantizados por vetores. Finalmente, as memórias do filtro são atualizadas usando o sinal de excitação determinado. Para cada 80 amostras de entrada, o codificador fornece 10 bytes de saída comprimida, tornando a taxa de bits total de 8 kbps. Esses 10 bytes consistem em vários parâmetros, conforme listado na tabela 3.4. Da tabela, pode-se observar que a codificação G. 729 divide os parâmetros em várias classes, com cada um deles tendo alguns bits. É totalmente diferente da compressão G. 711 e G. 726. Para mais detalhes sobre codificação e parâmetros referenciados na Tabela 3.4 consulte .
G. 729 Descodificador. O decodificador G. 729 é ilustrado na Fig. 3.4 b). O decodificador gera 80 amostras de valores lineares de PCM de 16 bits para cada 80 bits (10 bytes) de dados. Os parâmetros de entrada para o decodificador são coeficientes LSP, os dois atrasos de passo fracionário, dois vetores codetópicos fixos e os dois conjuntos de ganhos codetópicos adaptativos e fixos. Inicialmente, os coeficientes LSP são interpolados e convertidos em coeficientes de filtro LP para cada subquadro. Para cada subquadro de 5 ms, a excitação é construída adicionando os vetores codetópicos adaptativos e fixos.
quadro 3.4. G.729 Codificador de Parâmetros e Comprimidos de Alocação de Bits para os 10-ms do Quadro
Nome do Parâmetro | Codeword | Berço 1 | Berço 2 | > Total Bits por Quadro |
espectro de Linha pares (LSPs) | L0, L1, L2, L3 | 18 | ||
Adaptável codetopic atraso | P1,P2 | 8 | 5 | 13 |
Campo de atraso paridade | P0 | 1 | 1 | |
Fixo codetopic índice | C1,C2 | 13 | 13 | 26 |
Fixo codetopic sinal | S1,S2 | 4 | 4 | 8 |
Codetopic ganhos na fase – 1 | GA1, GA2 | 3 | 3 | 6 |
Codetopic ganhos na fase – 2 | GB1, GB2 | 4 | 4 | 8 |
O Total de bits em 10 – ms do quadro | 80 |
a Fala é reconstruída por meio de filtragem a excitação através do filtro de síntese LP. A fala reconstruída é processada através do estágio de pós-processamento, que inclui um pós-filtro adaptativo com base nos filtros de síntese de longo e curto prazo seguidos por um filtro passa-alta e operação de dimensionamento.Além de um atraso algorítmico de 15 ms, atrasos podem ser possíveis devido ao tempo de execução dos algoritmos do codificador e do decodificador no processador. Dependendo da implementação, ao processar vários canais em um processador, o atraso aumenta para o último canal processado.
Leave a Reply