低ビットレートコーデック(VoIP)のg.729ファミリ)
3.6
コーデックのG.729ファミリは、ほとんどのVoIP展開で一般的に使用されています。 G.729は、共役構造代数符号励起線形予測(CS-ACELP)
音声圧縮アルゴリズムのためのITU-T G.729勧告です。 G.729は、波形ベースの圧縮を使用するg.711およびG.726コーデックとは異なり、音声信号に適した人間の声道モデルを使用します。 基本的なG.729は音声を8kbpsに圧縮し、G.711よりも8倍多くの圧縮を提供し、良好な音声品質を提供します。
G.729Annex A(G.729Annex A,G.729)729A)は、G.729勧告の複雑さの低減バージョンであり、G.729と比較して品質のわずかな損失のトレードオフで、同じ8kbpsに音声を圧縮します。 コーデックの使用は、これらのアプリケーションに限定されるものではありませんが、このバージョンは、主にマルチメディア同時音声とデータアプ G.729Aは、g.729のフルバージョンと相互運用可能なビットストリームです。 このコーデックには、パケット損失の隠蔽が内蔵されています。 G.729BまたはG.729ABと表記される接尾辞Bを持つコーデックは、エンコーダではVAD、デコーダではCNGをサポートします。 G.729には幅広いコーデックのファミリがあり、
の一般的なコーデックのいくつかを表3.3に示します。 VoIP展開では、G.729ABが一般的に使用されます。 広帯域アップグレードでは、これらのコーデックはG.729.1に置き換えることができます。 これらの広帯域コーデックは、狭帯域バージョンと相互運用可能です。 したがって、広帯域と8kbpsの狭帯域の両方のサポートには、広帯域コーデックだけで十分である必要があります。 G.722を除いて、他の広帯域コーデックはg.711より低いビットレートに音声を圧縮します。 次のセクションでは、G.729ABの概要を示します。 コーデックG.729ABは、ベースライン標準としてG.729を使用します。 G.729ABの理解を深めるには、g.729、g.729B、およびg.729Aの推奨事項を参照してください。
表3.3. 狭帯域および広帯域音声コーデックのITU-T G.729ファミリ
コーデック名 | 説明 | アプリケーション | |
G.729VoIP音声でサポートされている基本8kbps CS- | |||
ACELP音声コーデック | ゲートウェイ | ||
G.729B | G.沈黙の729 | ||
圧縮 | |||
G.729A | 複雑性の低減 | VoIPアダプタおよびIPで人気のある | |
8 – kbps CS-ACELP | 携帯電話、Gと互換性があります。729, | ||
音声コーデック | とG.729.1 | ||
無音のG.729AB | g.729A | g.729、G729Bと互換性があります, | |
圧縮 | G729.1 | ||
G.729E(G.729 | 11.8kbps CS–ACELP | VoIPでは普及していない、より良い作品 | |
附属書E) | 音声符号化 | 音楽および背景および | |
アルゴリズム | はビデオアプリケーションで使用されます | ||
G.729.1広帯域 | 埋め込み変数8- | 広帯域音声 | |
および狭帯域 | 32kbps、ビット | ||
と相互運用可能 | |||
G.729、G.729A |
g.729コーデック
G.729コーデックは、個別のエンコーダとデコーダで構成されています。 コーデックは、CS-ACELP解析による合成手順を使用して、音声サンプルをフレームとして圧縮します。 コーデックは10msフレームで動作し、5msの先読みを行い、その結果、合計アルゴリズム遅延は15msになります。 3.4.
図3.4. G.729コーデック。 (a)エンコーダ-圧縮。 (b)デコーダ-ITU-T-G.729からの解凍—いくつかの簡素化で再描画されます。
G.729エンコーダー。 G.729コーダは、符号励起線形予測(CELP)符号化モデルに基づいています。 10msフレームごとに、音声信号が解析されてCELPモデルのパラメータが抽出されます。 パラメータは,線スペクトル対として符号化された線形予測フィルタ係数,適応および固定符号トピック指標およびゲインである。 これらの変数はvoipの適用にペイロードとして符号化され、送信されます。 図に示すように。 3.図4に示すように、前処理された音声は、LPフィルタ係数について分析される。 これらの係数は、ラインスペクトル対(LSP)に変換され、予測2段階ベクトル量子化(V Q)を用いて量子化される。 Open-oopピッチ推定は、知覚的に重み付けされた音声信号に基づいて10msフレームごとに計算されます。 閉ループピッチ解析は、目標信号とインパルス応答を使用して、open-l oopピッチ遅延の値を中心に検索することによって実行されます。 新しいターゲット信号を計算し,最適励起に到達するために固定符号トピック探索に使用した。 適応および固定codetopic寄与のゲインはベクトル量子化されています。 最後に、決定された励起信号を使用してフィルタメモリが更新されます。 入力の80サンプルごとに、エンコーダは10バイトの圧縮出力を与え、合計ビットレートは8kbpsになります。 これらの10バイトは、表3.4に記載されているいくつかのパラメータで構成されています。 この表から、g.729コーディングでは、パラメータをいくつかのクラスに分割し、それぞれが数ビットを持つことがわかります。 これは、G.711およびG.726圧縮とはまったく異なります。 符号化およびパラメータの詳細については、表3を参照してください。4を参照する。
G.729デコーダー。 G.729デコーダは、図1に示されています。 3.4(b). デコーダは、80ビット(10バイト)のデータごとに80個の16ビットリニアPCM値のサンプルを生成します。 デコーダの入力パラメータは,LSP係数,二つの分数ピッチ遅延,二つの固定符号トピックベクトル,および適応符号トピックゲインと固定符号トピックゲインの二つのセットである。 最初に、LSP係数が補間され、各サブフレームのLPフィルタ係数に変換される。 各5msサブフレームについて、励起は、適応および固定codetopicベクトルを追加することによって構築されます。
表3.4. G.729エンコーダパラメータと10msフレームの圧縮ビット割り当て
パラメータ名 | コードワード | サブフレーム1 | サブフレーム2 | フレームあたりの合計 ビット数 |
ラインスペクトルペア(Lsp) | L0,L1,L2,L3 | 18 | ||
適応符号化遅延 | P1,P2 | 8 | 5 | 13 |
ピッチディレイパリティ | P0 | 1 | 1 | |
固定 codetopic index | C1,C2 | 13 | 13 | 26 |
固定符号 | S1,S2 | 4 | 4 | 8 |
ステージ1 | GA1、GA2でのコードトピックゲイン | 3 | 3 | 6 |
ステージ2 | GB1、GB2でのコードトピックゲイン | 4 | 4 | 8 |
10msフレームの合計ビット数 | 80 |
音声はフィルタリングによって再構成されます LP合成フィルタを介した励起。 再構成された音声は,長期および短期合成フィルタに基づく適応ポストフィルタを含む後処理段階を通じて処理され,その後にハイパスフィルタおよびスケーリング動作が続く。
15msのアルゴリズム遅延に加えて、プロセッサ内のエンコーダおよびデコーダアルゴリズムの実行時間のために遅延が発生する可能性があります。 実装に応じて、1つのプロセッサで複数のチャネルを処理している間、最後に処理されたチャネルの遅延が増加します。
Leave a Reply