FAMILIA G. 729 DE Códecs DE BAJA VELOCIDAD DE BITS (VoIP)

3.6
La familia de códecs G. 729 se usa popularmente en la mayoría de las implementaciones de VoIP. G. 729 es una recomendación ITU-T G. 729 para un algoritmo de compresión de voz de predicción lineal excitada por código algebraico de estructura conjugada (CS-ACELP)
. G. 729 hace uso de modelos de tracto vocal humano adecuados para señales de voz a diferencia de los códecs G. 711 y G. 726, que utilizan compresión basada en forma de onda. El G. 729 básico comprime la voz a 8 kbps, lo que proporciona ocho veces más compresión que el G. 711 y proporciona una buena calidad de voz.
G. 729 Anexo A (G.729A) es la versión de complejidad reducida de la recomendación G. 729, y comprime la voz a los mismos 8 kbps con la compensación de una ligera pérdida de calidad en comparación con G. 729. Esta versión está desarrollada principalmente para aplicaciones multimedia simultáneas de voz y datos, aunque el uso del códec no se limita a estas aplicaciones. G. 729A es interoperable con la versión completa de G. 729. Este códec tiene ocultación de pérdida de paquetes incorporada. El códec con el sufijo B indicado como G. 729B o G. 729AB admite VAD en el codificador y GNC en el decodificador . G.729 tiene una amplia familia de códecs, y algunos de los códecs populares de
se enumeran en la Tabla 3.3. En la implementación de VoIP, G. 729AB se usa popularmente. En la actualización de banda ancha, estos códecs pueden reemplazarse por G. 729.1. Estos códecs de banda ancha son interoperables con versiones de banda estrecha. Por lo tanto, un códec de banda ancha solo debería ser suficiente para el soporte de banda ancha y banda estrecha de 8 kbps. Excepto G. 722, otros códecs de banda ancha comprimen la voz a velocidades de bits inferiores a G. 711. En la siguiente sección, se ofrece una descripción general de alto nivel del G. 729AB. El códec G. 729AB hace uso de G. 729 como estándar de referencia. Para una mejor comprensión del G. 729AB, consulte las recomendaciones G. 729, G. 729B y G. 729A.

Cuadro 3.3. UIT-T G. 729 Familia de Narrowbond de banda Ancha y los Códecs de Voz

Nombre del Códec Descripción Aplicación
G. 729 Básico de 8 kbps, CS- Apoyado en VoIP voz
ACELP codec de voz puertas de enlace
G. 729B G.729 con el silencio
compresión
G. 729A la Reducción de la complejidad Popular en VoIP y adaptadores IP
8 – kbps, CS – ACELP teléfonos, compatible con G. 729,
códec de voz y G. 729.1
G. 729AB G. 729A con el silencio compatible con G. 729, G729B,
la compresión G729.1
G. 729E (G.729 11.8 kbps CS – ACELP No es popular en VoIP, funciona mejor
Anexo E) codificación de voz para la música y el fondo y
algoritmo se utiliza en las aplicaciones de vídeo
G. 729.1 de banda ancha Embebido variable 8- voz de banda Ancha
y de banda estrecha 32 kbps, bits
interoperable con
G. 729, G.729A

Códec G. 729

El códec G. 729 consta de un codificador y un decodificador separados. El códec comprime muestras de voz como fotogramas mediante un procedimiento de análisis por síntesis CS-ACELP. El códec funciona con fotogramas de 10 ms con una mirada por delante de 5 ms, lo que resulta en un retardo algorítmico total de 15 ms. Se ofrece una visión general del codificador y decodificador en relación con la Fig. 3.4.
 Códec G. 729. a) compresión de codificadores. b) descodificador-descompresión del UIT-T — G. 729-rediseñado con cierta simplificación.
Figura 3.4. Códec G. 729. a) compresión de codificadores. b) descodificador-descompresión del UIT-T — G. 729-rediseñado con cierta simplificación.Codificador G. 729
. El codificador G. 729 se basa en el modelo de codificación de predicción lineal excitada por código (CELP). Por cada fotograma de 10 ms, se analiza la señal de voz para extraer los parámetros del modelo CELP. Los parámetros son coeficientes de filtro de predicción lineal codificados como pares espectrales de línea, índices adaptativos y codetópicos fijos, y ganancias. Estos parámetros se codifican y transmiten como carga útil a la aplicación VoIP. Como se muestra en la Fig. 3.4, el habla preprocesada se analiza para los coeficientes de filtro de LP. Estos coeficientes se convierten en pares de espectro lineal (LSP) y se cuantifican mediante cuantización vectorial predictiva de dos etapas (VQ). La estimación de pitch de open — oop se calcula para cada fotograma de 10 ms basado en una señal de voz perceptualmente ponderada. El análisis de pitch de bucle cerrado se realiza utilizando la señal de destino y la respuesta de impulso buscando alrededor del valor del retardo de pitch de open-l oop. La nueva señal de destino se calcula y se utiliza en la búsqueda codetópica fija para llegar a una excitación óptima. Las ganancias de las contribuciones codetópicas adaptativas y fijas se cuantifican por vectores. Finalmente, las memorias de filtro se actualizan utilizando la señal de excitación determinada. Por cada 80 muestras de entrada, el codificador proporciona 10 bytes de salida comprimida, lo que hace que la velocidad de bits total sea de 8 kbps. Estos 10 bytes constan de varios parámetros que se enumeran en la Tabla 3.4. En la tabla, se puede observar que la codificación G. 729 divide los parámetros en varias clases, cada una de las cuales tiene unos pocos bits. Es completamente diferente de la compresión G. 711 y G. 726. Para más detalles sobre la codificación y los parámetros a los que se hace referencia en el cuadro 3.4 refiérase a .
Decodificador G. 729. El decodificador G. 729 se ilustra en la Fig. 3.4 b). El decodificador genera 80 muestras de valores de PCM lineales de 16 bits por cada 80 bits (10 bytes) de datos. Los parámetros de entrada para el decodificador son los coeficientes LSP, los dos retardos de tono fraccionados, dos vectores codetópicos fijos y los dos conjuntos de ganancias codetópicas adaptativas y fijas. Inicialmente, los coeficientes LSP se interpolan y se convierten en coeficientes de filtro LP para cada subframe. Para cada subframe de 5 ms, la excitación se construye agregando los vectores codetópicos adaptativos y fijos.

Cuadro 3.4. G.729 Parámetros de Codificador y Asignación de Bits Comprimidos para Fotogramas de 10 ms

Nombre del parámetro Palabra de código Subframe 1 Subframe 2 Total
Bits por
Fotograma
Pares de espectro de líneas (LSP) L0, L1, L2, L3 18
Retraso codetópico adaptativo P1, P2 8 5 13
Paridad de retardo de tono P0 1 1
Fijo codetopic índice C1,C2 13 13 26
Fijo codetopic signo S1,S2 4 4 8
Codetopic ganancias en la etapa – 1 GA1, GA2 3 3 6
Codetopic ganancias en la etapa – 2 GB1, GB2 4 4 8
Total de bits en 10 ms marco 80

el Discurso es reconstruido mediante el filtrado de la excitación a través del filtro de síntesis de LP. El habla reconstruida se procesa a través de la etapa de postprocesamiento, que incluye un post-filtro adaptativo basado en los filtros de síntesis a largo y corto plazo, seguido de un filtro de paso alto y una operación de escalado.
Además de un retraso algorítmico de 15 ms, los retrasos pueden ser posibles debido al tiempo de ejecución de los algoritmos de codificador y decodificador en el procesador. Dependiendo de la implementación, mientras se procesan varios canales en un procesador, el retardo aumenta para el último canal procesado.

Leave a Reply