G. 729 familie van low-BIT-RATE Codecs (VoIP)
3.6
de G. 729 familie van codecs worden in de volksmond gebruikt in de meeste VoIP-implementaties. G. 729 is een ITU-T G. 729-aanbeveling voor een conjugaatstructuur-algebraïsch-code-opgewonden lineaire voorspelling (CS-ACELP)
spraakcompressiealgoritme. G. 729 maakt gebruik van menselijke Vocal tract modellen geschikt voor stemsignalen in tegenstelling tot de G. 711 en G. 726 codecs, die golfvorm-gebaseerde compressie gebruiken. Basic G. 729 comprimeert stem tot 8 kbps, die acht keer meer compressie biedt dan G. 711 en een goede stemkwaliteit biedt.
G. 729 Bijlage A (G.729A) is de verminderde complexiteit versie van de G. 729 aanbeveling, en het comprimeert stem tot dezelfde 8 kbps met de afweging van een licht verlies van kwaliteit in vergelijking met G. 729. Deze versie is voornamelijk ontwikkeld voor multimedia simultane spraak-en datatoepassingen, hoewel het gebruik van de codec niet beperkt is tot deze toepassingen. G. 729A is Bitstream interoperabel met de volledige versie van G. 729. Deze codec heeft ingebouwde pakketverlies verbergen. De codec met achtervoegsel B aangeduid als G. 729B of G. 729AB ondersteunt VAD in de encoder en CNG in de decoder . G.729 heeft een brede familie van codecs, en sommige van de
populaire codecs zijn vermeld in Tabel 3.3. In VoIP-implementatie wordt G. 729AB in de volksmond gebruikt. In de wideband upgrade kunnen deze codecs worden vervangen door G. 729. 1. Deze breedband codecs zijn interoperabel met smalbandversies. Daarom moet een breedband-codec alleen voldoende zijn voor zowel breedband-als 8-kbps smalbandondersteuning. Behalve G. 722, comprimeren andere breedband codecs stem tot bitsnelheden lager dan G. 711. In de volgende paragraaf wordt een overzicht op hoog niveau over G. 729AB gegeven. Codec G. 729AB maakt gebruik van G. 729 als basisnorm. Zie voor een beter begrip van G. 729AB de aanbevelingen van G. 729, G. 729B en G. 729A.
tabel 3.3. ITU-T G. 729 Familie van Narrowbond en Breedband-Spraak-Codecs
Codec Naam | Beschrijving | Toepassing |
G. 729 | Basis van 8 kbps CS- | Ondersteund op VoIP-voice |
ACELP speech codec | gateways | |
G. 729B | G.729 met de stilte | |
compressie | ||
G. 729A | reductie van complexiteit | Populair op VoIP en IP-adapters |
8 – kbps CS – ACELP | telefoons, compatibel met G. 729, | |
speech codec | en G. 729.1 | |
G. 729AB | G. 729A met stilte | compatibel met G. 729, G729B, |
compressie | G729.1 | |
G. 729E (G.729 | 11.8 – kbps CS – ACELP | Niet populair op VoIP, werkt beter |
Bijlage E) | spraak codering | voor muziek en achtergrond en |
algoritme | wordt gebruikt in de video-toepassingen | |
G. 729.1 breedband | Ingesloten variabele 8- | Breedband voice |
en smalband | 32 kbps, bits | |
compatibel met | ||
G. 729, G.729A |
G. 729 Codec
de G. 729 codec bestaat uit een aparte encoder en decoder. De codec comprimeert spraakvoorbeelden als frames met behulp van een CS-ACELP analyse-door-synthese procedure. De codec werkt met 10-ms frames met een blik vooruit van 5 ms, wat resulteert in een totale algoritmische vertraging van 15 ms. een overzicht van de encoder en decoder wordt gegeven in relatie tot Fig. 3.4.
figuur 3.4. G. 729 codec. (a) encoder-compressie. (b) decoder-decompressie van ITU-T-G. 729 — opnieuw getekend met enige vereenvoudiging.
G. 729-Encoder. De G. 729 coder is gebaseerd op het code-excited linear-prediction (CELP) codeermodel. Voor elk 10-ms frame wordt het spraaksignaal geanalyseerd om de parameters van het CELP-model te extraheren. De parameters zijn lineaire voorspellingsfiltercoëfficiënten gecodeerd als lijnspectrale paren, adaptieve en vaste codetopische indices, en winsten. Deze parameters worden gecodeerd en verzonden als payload naar VoIP-toepassing. Zoals in Fig. 3.4, vooraf verwerkte toespraak wordt geanalyseerd voor LP-filtercoëfficiënten. Deze coëfficiënten worden omgezet in lijnspectrumparen (LSP) en worden gekwantiseerd met behulp van voorspellende tweetraps vectorkwantisatie (VQ). De open-oop pitch schatting wordt berekend voor elk 10-ms frame op basis van een perceptueel gewogen spraaksignaal. Closed-loop pitch analyse wordt uitgevoerd met behulp van het doel signaal en impulsrespons door te zoeken rond de waarde van de open-l oop pitch delay. Het nieuwe doelsignaal wordt berekend en gebruikt in de vaste codetopische zoekopdracht om tot optimale opwinding te komen. De winsten van adaptieve en vaste codetopische bijdragen zijn Vector quantized. Tot slot worden de filtergeheugens bijgewerkt met behulp van het bepaalde excitatiesignaal. Voor elke 80 samples van input, geeft de encoder 10 bytes van gecomprimeerde output makend de totale bitsnelheid 8 kbps. Deze 10 bytes bestaan uit verschillende parameters zoals vermeld in Tabel 3.4. Uit de tabel, kan worden opgemerkt dat G. 729 codering splitst parameters in verschillende klassen met elk van hen met een paar bits. Het is geheel anders dan G. 711 en G. 726 compressie. Voor meer details over codering en parameters waarnaar wordt verwezen in Tabel 3.4 Zie .
G. 729 Decoder. De G. 729 decoder is afgebeeld in Fig. 3.4 b). De decoder genereert 80 samples van 16-bit lineaire PCM-waarden voor elke 80 bits (10 bytes) data. De inputparameters voor de decoder zijn LSP-coëfficiënten, de twee fractionele toonhoogte vertragingen, twee vaste-codetopische vectoren, en de twee sets van adaptieve en vaste codetopische winsten. Aanvankelijk worden de LSP-coëfficiënten geïnterpoleerd en omgezet in LP-filtercoëfficiënten voor elk subframe. Voor elk subframe van 5 lidstaten, wordt de opwinding geconstrueerd door de adaptieve en vaste codetopic vectoren toe te voegen.
tabel 3.4. G.729 Encoder Parameters en Gecomprimeerd Bits Toewijzing voor 10 ms Frame
Parameter-Naam | Codewoord | Subframe 1 | Subframe 2 | Totaal Bits per Frame |
Lijn spectrum paren (lsp ‘ s) | L0, L1, L2, L3 | 18 | ||
Adaptive codetopic vertraging | P1,P2 | 8 | 5 | 13 |
Pitch vertraging pariteit | P0 | 1 | 1 | |
Vaste codetopic index | C1,C2 | 13 | 13 | 26 |
Vaste codetopic teken | S1,S2 | 4 | 4 | 8 |
Codetopic winsten op fase – 1 | GA1, GA2 | 3 | 3 | 6 |
Codetopic winsten in fase – 2 | GB1, GB2 | 4 | 4 | 8 |
Totale bits in stappen van 10 ms frame | 80 |
Spraak is gereconstrueerd door het filteren van de excitatie door het LP synthesefilter. De gereconstrueerde spraak wordt verwerkt via de postprocessing fase, die een adaptieve post-filter op basis van de lange termijn en korte termijn synthese filters gevolgd door een high-pass filter en schaling operatie omvat.
naast een algoritmische vertraging van 15 ms kunnen vertragingen mogelijk zijn vanwege de uitvoeringstijd van de encoder-en decoderalgoritmen in de processor. Afhankelijk van de implementatie neemt de vertraging bij het verwerken van meerdere kanalen op één processor toe voor het laatst verwerkte kanaal.
Leave a Reply