首頁精選范文解碼技術論文

解碼技術論文范例6篇

更新時間：2023-03-17 05:27:14

前言：中文期刊網精心挑選了解碼技術論文范文供你參考和學習，希望我們的參考范文能激發你的文章創作靈感，歡迎閱讀。

解碼技術論文

解碼技術論文范文1

關鍵詞：RGB YCbCr FPGA 色彩空間轉換

中圖分類號：TN911 文獻標識碼：A 文章編號：1672-3791（2014）09（a）-0023-01

1 常見色彩空間

我們主要介紹RGB和YCbCr色彩空間。RGB色彩空間是一種常用的色彩空間。它可以實現不同平臺的映射而不嚴重損失顏色信息。任何一種顏色都可以由三基色紅、綠、藍混合疊加而成。RGB三個分量彼此相互獨立，三個分量的值越小所代表的亮度越低。RGB色彩空間它所占用的帶寬和存儲量是很大的，如果使用該色彩空間進行圖像傳輸，非常不利于圖像的處理。所以引入另一種色彩空間YCbCr。該格式的色彩空間是演播室編碼方案中使用的顏色模型。Y，Cb，Cr分別代表亮度、藍度分量和紅度分量。YCbCr色彩空間有以下優勢。首先它的構成原理符合人類的視覺感知過程，再次它可以實現亮度和色度的分離，由于人眼對亮度的變化更敏感，所以我們在傳輸圖像時減小帶寬的同時引起的顏色損失小，人眼幾乎無法察覺。

2 總體設計方案

系統的總體設計框圖如圖1所示。

基于FPGA的色彩空間的轉換過程可以描述為：首先通過CCD攝像頭進行視頻圖像采集，采集來的RGB圖像為NTSC或PAL制式的，接著我們會把視頻數據送到解碼芯片TVP5150，它會將信號變為ITU-R BT.656格式的數據流。我們選取的TVP5150芯片是和FPGA主控芯片集成在一個開發板上，它的功耗非常低，芯片小巧利于便攜。視頻解碼芯片在對視頻信號處理之前總線會對其進行配置。從解碼芯片出來的信號便進入FPGA芯片，進行串并轉換、解交織等操作最終實現色彩空間的轉換。最后信號送到ADV7123芯片進行編碼，并通過D/A轉換芯片在VGA顯示器上顯示出來。

3 仿真與硬件驗證

硬件部分我們采用了Alera公司的FPGA芯片EP2C8Q208C8N作為核心處理芯片，該芯片內部含有豐富的可編程邏輯資源，可以非常方便的完成相關乘法器的例化。在使用乘法器IPCore時，我們需要進行優化設置。硬件部分包括CCD攝像頭、FPGA主控芯片、視頻解碼芯片TVP5150、視頻編碼芯片ADV7123等。最終將VGA線和顯示器的VGA口相連接，便可以通過顯示屏觀察結果。

硬件實物圖如圖2所示。

軟件部分采用Quartusii 9.1進行Verilog語言的編寫，并進行時序仿真。進行時序仿真的結果圖3所示。

4 結語

生活中存在多種色彩空間，它們各自具有不同的特點。但是在很多情況下我們又得在它們之間進行轉換，這無論對于科研研究還是消費市場都是很有必要的。本篇論文是通過硬件實現的RGB色彩空間到YCbCr色彩空間的轉換，采用的Alera公司的FPGA芯片EP2C8Q208C8N作為核心處理芯片，利用其內部豐富的可編程邏輯資源實現空間的轉換，并采用Quartusii 9.1進行軟件編程與仿真，驗證了模塊的功能。

參考文獻

[1] 唐曉燕，賈鋒，韓磊.基于FPGA的視頻顏色空間轉換電路設計[J].電子與電腦，2006（8）：47-49.

[2] 吳康，劉耀元，胡民山.用FPGA實現色彩空間RGB到YCbCr的轉換[J].南昌高專學報，2007，22（6）：140-142.

解碼技術論文范文2

統計機器翻譯在短時期能夠得以迅速發展，除了技術進步外，很大一方面要歸功于很多開放源碼的統計機器翻譯工具，有些時候，正是因為這些開放源碼的工具才使得某項技術被廣泛接受和使用。例如，20世紀90年代初IBM公司的Brown等人提出了5個模型來刻畫統計機器翻譯，取得了不錯的效果，但是在此之后很長一段時間內都沒有被大家認可和接受，原因是他們的模型非常復雜，難以理解和實現。直到1999年，開源軟件包Egypt的出現，才使得IBM的模型被廣泛研究和使用。可以說Brown等人的工作為現代統計機器翻譯奠定了深厚的基礎，但其影響卻是通過開源軟件才得以實現，由此可見開源軟件對于統計機器翻譯這樣一個復雜的研究課題的重要性。

1. 首個開源統計機器翻譯工具包Egypt

Egypt是在1999年約翰霍普金斯大學統計機器翻譯夏季討論班上，由一些研究人員共同合作開發的統計機器翻譯工具包。它包括4個模塊;

Whittle: 語料庫預處理模塊;

GIZA: 用于從句子對齊的雙語語料庫中訓練詞語對齊;

Cairo: 詞語對齊的可視化工具;

Decoder: 解碼器，用來執行具體的翻譯過程模塊，這一模塊沒有開放源碼。

其中，用于訓練詞語對齊的模塊GIZA現在仍然被廣泛使用，利用它能夠非常方便地從大規模的雙語文本中獲得統計知識。GIZA++是GIZA的改進版，GIZA++實現了IBM公司提出的5個模型，其主要思想是利用EM算法對雙語語料庫進行迭代訓練，由句子對齊得到詞語對齊。GIZA是獨立于語言的，能夠對任何兩種語言進行訓練，這也是統計機器翻譯的優點之一?，F在幾乎所有的統計機器翻譯系統都利用這一工具進行詞語對齊的訓練。

2.語言模型訓練工具SRILM

SRILM是一個建立和使用統計語言模型的開源工具包，從1995年開始由SRI 口語技術與研究實驗室（SRI Speech Technology and Research Laboratory）開發，現在仍然不斷推出新版本，被廣泛應用于語音識別、機器翻譯等領域。這個工具包包含一組C++類庫、一組進行語言模型訓練和應用的可執行程序等。利用它可以非常方便地訓練和應用語言模型。給定一組連續的詞，調用SRILM提供的接口，可以得到這組詞出現的概率。

3. 機器翻譯的自動評測工具Mteval

在一些著名的統計機器翻譯國際評測中普遍使用自動評測與人工評測相結合的方法，例如美國國家技術和標準研究所（NIST）舉行的評測。Mteval便是他們開發的自動評測工具，最新版本是mteval-11b.pl，是用Perl語言寫成的。

4. 首個基于短語的統計機器翻譯系統“法老”（Pharaoh）

“法老”是較早公開的統計機器翻譯系統，由美國南加州大學信息科學實驗室（Information Science Institute）的菲利普•科恩（Philipp Koehn）在2004年做博士論文期間編寫的?！胺ɡ稀卑▋纱蟛糠? 訓練和解碼。訓練過程用來從語料庫中獲得統計知識。它利用了已有的開源軟件GIZA++和SRILM，GIZA++用來訓練詞語對齊，SRILM訓練語言模型，但解碼沒有公開源代碼。“法老”原理簡單，易于使用，它的出現對于推動機器翻譯研究起到了非常大的作用。

5. 中國首個開源的統計機器翻譯系統絲路（SilkRoad）

“法老”的出現揭開了統計機器翻譯的神秘面紗，然而其核心部分――解碼器的源碼仍然沒有公開。為此，中國的研究人員聯合開發了一個完全開放源代碼的統計機器翻譯系統――“絲路”。該系統由中國的五家研究機構和高校（中科院計算所、中科院自動化所、中科院軟件所、廈門大學、哈爾濱工業大學）聯合開發，并在2006年中國第二屆統計機器翻譯研討會上?！敖z路”包括以下模塊: 語料預處理及后處理模塊“仙人掌”、詞語對齊模塊“樓蘭”、短語抽取模塊“胡楊”、以及三個解碼器（“駱駝”、“綠洲”和“商隊”）。這是第一次將一個完整的統計機器翻譯系統公開，極大地促進了國內統計機器翻譯的快速發展。

6.摩西（Moses）

“摩西”是“法老”的升級版本，它增加了許多功能，是由英國愛丁堡大學、德國亞琛工業大學等八家單位聯合開發的一個基于短語的統計機器翻譯系統。來自這些單位的研究人員于2006年在約翰霍普金斯大學召開了一次研討會，利用6個星期的時間共同開發了這一系統。整個系統用C++語言寫成，從訓練到解碼完全開放源代碼，可以運行在Windows平臺和Linux平臺。

7. 基于句法的統計機器翻譯系統GenPar

GenPar工具包實現了一個基于句法的統計機器翻譯系統?；诰浞ǖ姆椒▽⒕浞ńY構信息引入到統計機器翻譯中來，目前已成為統計機器翻譯領域的研究熱點。但是構建基于句法的統計機器翻譯系統遠比構建基于短語的要困難得多，為了讓研究者們很快進入這一領域，在JHU2005夏季研討會上，由紐約大學艾•丹•米拉姆德（I. Dan Melamed）等人組成的統計機器翻譯組開發了GenPar。

GenPar的基本原理是利用多文本語法（Multi-Text Grammar）實現多語言的句法分析、結構對齊和翻譯。多文本語法是一種多種語言的同步語法，理論上比較完善，功能強大。GenPar有很多特點:首先，該系統是一個純粹基于句法的模型，在翻譯過程中充分利用了句法結構信息; 其次，它具有很好的定制能力，可以實現各種不同類型的基于同步語法的統計機器翻譯，很適合于作為實驗各種理論的研究平臺。總的來看，該系統功能比較強大，但由于其比較復雜，掌握起來比較困難，性能比現有的基于短語的模型稍差。（本文作者米海濤為中科院計算所博士研究生）

鏈接

統計機器翻譯第一人與Google

在統計機器翻譯中有一位頗具傳奇色彩的人物，就是畢業于德國亞琛工業大學的博士生弗朗茨•約瑟夫•歐赫（Franz Joseph Och）。在1999年他開發出了著名的IBM模型訓練工具Giza。在2002年NIST評測中，取得第一名的亞琛工業大學的機器翻譯系統也是由他開發的。2002年，歐赫從亞琛工業大學畢業后進入美國南加州大學信息科學研究所(ISI/USC)工作，同時作為Language Weaver公司的顧問，后來于2004年加盟了谷歌（Google）公司。

他所工作的每一個單位都穩拿當年NIST機器翻譯評測的第一名。尤其是2005年的NIST評測中，他所在的谷歌公司開發的漢英機器翻譯系統取得了0.35的BLEU值，比第二名的南加州大學(即他原來所在的單位)系統的性能提高了近5個百分點。在2006年評測中，除了漢英機器翻譯的受限語料項目，其他所有項目的第一名都是谷歌公司。

解碼技術論文范文3

編解碼技術。多媒體通信的一個顯著特點就是要傳輸的信息量非常大，尤其是視頻數據，其編解碼技術在較大程度上影響著業務的質量。IPTV采用了先進高效的視頻壓縮編碼技術，使得視頻流在800Kb/s的有限帶寬上接近DVD（MPEG2）的視覺效果（DVD的視頻傳輸帶寬通常為3Mb/s）。目前主要編解碼技術是MPEG4、H.264與AVS三種。MPEG系列是重要的視頻編碼標準，所有的視頻編碼技術都參照了MPEG技術。H.264是新一代視頻編碼標準，H.264的壓縮率是MPEG-2的2倍以上，是MPEG-4的1.5至2倍，這樣超高的壓縮率是以犧牲編碼運算量為代價的，但其解碼的運算量漲幅較小，比較容易實現用戶接收播放。AVS是中國擁有自主知識產權的第二代信源編碼標準音視頻編碼技術標準，是高清晰度數字電視、寬帶網絡流媒體、移動多媒體通信、激光視盤等數字音視頻產業群的基礎性標準。

流媒體傳送技術。對于傳送IPTV音視頻數據流而言，流媒體傳送技術極其重要，先進的技術可以節約系統帶寬、減輕系統負擔、優化系統。流媒體傳送系統主要設備是中心/邊緣流媒體服務器與存儲分發網絡。流媒體服務器具有較高的穩定性，支持多個并發流和直播流的需求，而存儲分發網絡由多個服務器組成，通過負載均衡（如CDN）來大規模組網。CDN網絡除了提高用戶響應速度之外，還有一個更為重要的作用，就是減輕巨大的數據流量對骨干網的壓力。

數字版權管理（Digital Rights Management，DRM）。它是保護多媒體內容免受未經授權的播放和復制的一種方法，為內容提供者提供視頻、音樂、彩鈴、論文、圖片等數字數據免受非法復制和使用保護的一種手段。數字多媒體內容是IPTV中最為關鍵的節目來源。有了DRM技術，可使各個平臺(無論是因特網、流媒體還是交互數字電視)的內容提供商們放心地提供更多的內容，采取更靈活的節目銷售方式，同時有效地保護知識產權。

IP機頂盒技術。IPTV系統的接收端包括計算機、電視機與手機。由于電視機本身并沒有存儲功能，不支持軟件安裝，也無法像手機那樣加裝流媒體支持功能，因而無法實現IP的支持功能，必須加裝一個IP數據流轉換成電視機可以接收的信號的機頂盒才能收看IPTV節目。機頂盒應具備數據轉換、接入支持、協議支持、業務支持、解碼支持等功能。

在廣電系統數字電視平移模式中，杭州模式對IPTV技術的應用最為成功。杭州數字電視模式實質上就是用以太網接入，只是最后一段線路即樓道交換機到戶內終端使用的是同軸電纜，它成功地將IPTV技術和廣電的數字電視進行了結合?，F在，其他省市的廣電系統已經在以杭州模式為示范建設自己的廣電網絡。江西省的情況和杭州的實際情況有差別，不具有發展IPTV業務的優勢平臺，所以我們不能停留于模仿層面，而應該在總結先行者的經驗中，尋找更好的在廣電網絡中運用IPTV技術的方法。

一、數字電視平移是廣電網絡追求效益的增長點。IPTV能夠提供多種形式的內容服務，傳輸電視節目只是其功能應用的一部分，它還可以提供其他的電視類業務、通信類業務和各種增值業務，滿足我們的各種需求。

二、增加多種形式的內容服務要求更寬的帶寬來進行傳輸，IPTV采用的編碼和壓縮技術是最新的高效視頻壓縮技術，它壓縮了數據，節約了帶寬。同時IPTV可以在傳輸的過程中把視頻內容按IP協議封裝成數據包，能根據用戶不同的需要，靈活解決網絡傳輸的問題。如果用戶的頻帶寬，就可以壓縮率低一些，傳的包多一些，質量好一點；如果用戶對節目的清晰度沒有太高的要求，可以采用壓縮率高一些，傳的包少一些。這也解決了江西省現有SDH網絡帶寬不足、無法繼續添加業務的問題。

三、真正實現互動是IPTV最重要的一個優勢。IPTV不僅能滿足受眾觀看節目的個性化需求，而且能讓受眾參與到電視節目中來，與電視臺一起完成節目。

解碼技術論文范文4

[關鍵詞]圖像壓縮；圖像編碼；壓縮標準

中圖分類號：Tp311 文獻標識碼：A 文章編號：1009-914X（2014）45-0358-01

0 引言

當今社會正處于高速發展的信息時代，而信息本身就需要進行存儲、圖像信息是人類認識世界和感知世界的重要源泉。圖像具有確切性、直觀性、高效性、時空性等特征，圖像信息的這些特性導致它的數據量特別龐大。圖像壓縮就是對數值矩陣進行處理，用相對少的數據來表示這個數值矩陣。這個過程要在圖像數據存儲、處理和傳輸之前進行，在這之后要對壓縮過的圖像進行解壓縮來重建圖像，這就是圖像壓縮和解壓縮，也稱圖像編碼和圖像解碼。

1 圖像壓縮的原理

從信息論的觀點來看，圖像作為一個信源，描述信源的數據是信息量和信息冗余量之和。所以在圖像數據的表示中存在著大量的冗余，如時間冗余、空間冗余、知識冗余、視覺冗余等，可以利用圖像本身的一些特點和人眼的視覺特性，去除這些冗余數據就可以使原始圖像數據量極大的減少，從而解決圖像數據量龐大的問題，實現圖像數據壓縮。

2 經典圖像編碼

2.1 變換編碼

很多圖像編碼的原理是通過消除圖像的冗余度來達到壓縮的目的，而變換編碼則是改變了冗余度的表達方法，將原始數據用另一種更加緊湊的方法表示，有時可以實現更高的數據壓縮。離散余弦變換（DCT）即是一種分形變換編碼。DTC的出色之處是能將大部分圖像分成像塊，使像塊的能量集中到少數低頻DTC系數上，這樣一來DCT可以將圖像的能量很大程度的集中在一起，為壓縮打下了基礎。

2.2 嫡編碼

嫡編碼的原理是根據消息或消息序列出現概率的分布特性來尋找概率和碼字長度間的最優匹配。游程編碼、霍夫曼編碼和算術編碼等都是目前使用較多的嫡編碼。

3 現代圖像編碼

現代圖像編碼和經典圖像編碼的區別之處在于它不是像經典圖像編碼那樣盡量去除圖像的相關性，而是利用圖像的相關性進行編碼。

3.1 分形編碼

分形編碼是一種直接在空間域尋找并最大限度地利用圖像的自相似性的編碼方法。

3.2 模型基圖像編碼

模型基圖像編碼主要是利用圖像的區域、輪廓等二維特征以及形狀、運動軌跡等三維特征進行建模，然后對圖像和模型進行分析得出模型的各種參數，再對參數進行編碼傳輸，解碼端則由圖像綜合恢復出圖像。這種編碼方式可以實現較高的壓縮比，圖像的恢復質量也有了大大的提高。

3.3 小波變換技術

小波變換理論是新的數學分支，其基本思想是將原始圖像通過一族小波函數轉換為小波域的系數，再通過略去某一閾值下的系數，保留部分原始能量保留較多的系數來壓縮圖像。在小波變換中，圖像被分解為不同空間、不同頻率的子圖像，一幅圖像每經過一次小波變換，圖像就被分解為四幅大小為原來的四分之一的小塊頻帶區域，再將這四幅子圖針對人的視覺特點分別進行不同的編碼處理，可以得到比較高的壓縮比和好的壓縮質量。

4 圖像壓縮的分類

圖像壓縮一般根據圖像數據是否有丟失分為有損壓縮和無損壓縮兩類，無損壓縮是理想的壓縮方法（無信息丟失），也稱可逆壓縮。有損壓縮也稱不可逆壓縮，經過有損壓縮后，重建圖像中像素的值和原始圖像中對應的像素的值不完全相等，圖像會發生畸變。

圖像無損壓縮編碼方法可分為兩大類：基于統計概率的算法和基于字典技術的算法?；诮y計概率的算法是根據信息論中的變長編碼定理和信息嫡的相關知識，用較短的代碼代表出現概率大的符號，用較長代碼代表出現概率小的符號，從而實現數據壓縮。而基于字典技術生成的文件包含的是定長編碼，每個碼代表原文件中的一個特定序列。

和無損壓縮不同的是，有損壓縮編碼在圖像進行解碼還原之后的準確度上要求沒有那個高，因此會產生一定程度上的失真，但這種編碼方式可以提高圖像的壓縮能力。一般情況下，這種失真人眼看起來可能會比較明顯，也可能不明顯，不管是哪種，只要在人眼的容忍范圍之內，就說明這種壓縮時可行的。

5 圖像壓縮標準

隨著圖像處理技術的發展，研究人員提出了多種圖像壓縮標準。常用的圖像壓縮標準分為靜止圖像壓縮標準和視頻圖像壓縮標準。

目前最常用的靜止圖像壓縮標準是JPEG圖像壓縮標準。JPEG標準定義基于DCT得有損基本編碼系統、面向大規模壓縮得擴展的編碼系統和面向可逆壓縮的無損獨立編碼系統。JPEG具有有失真和無失真兩種編碼解碼的處理方式，其中無失真得到的解碼后圖像和原圖像數據基本相同，但壓縮率較低，而有失真可以實現高的壓縮比，但同時可能會導致圖像的失真較明顯。壓縮比的高低可以在算法中改變壓縮參數來調整。JPEG標準的計算量不算很大，算法也易于實現，所以具有較好的實用性能。

隨著多媒體技術的快速發展和廣泛應用，為滿足用戶對更高壓縮效率和對壓縮圖像的互動性和可伸縮性的要求，JPEG2000應運而生的。

JPEG2000標準可以實現很高的壓縮性能，它還具有只對感興趣區域編碼、可進行有損壓縮和無損壓縮、對錯誤的魯棒性、對碼流做隨機訪問等特性。靈活使用這些特征，不僅可以達到很高的壓縮比，還可以滿足在移動和網絡環境下交互操作和可伸縮性的要求。JPEG2000的需求針對性以及技術先進性保證了它光明的應用前景。

6 圖像壓縮性能的評價

一個圖像壓縮方法性能的評價主要從兩個方面來衡量：壓縮比和圖像質量評價。壓縮比就是原始圖像文件大小與壓縮后生成文件大小的比值，比值越大，說明壓縮率越高。圖像質量評價一般是通過保真度準則來判斷。保真度準則有兩種：客觀保真度準則和主觀保真度準則。

6.1 客觀保真度準則

客觀保真度準則是對解碼圖像和原始圖像的誤差進行定量計算的一種衡量標準，一般是對整個圖像或者圖像中的某個指定區域進行某種平均計算得到均方誤差。

6.2 主觀保真度準則

圖像經壓縮編碼和解碼還原之后，圖像質量的好壞還有一個直接的評價者就是人眼，因此人的主觀印象也是衡量一個圖像壓縮編碼的重要因素。主觀保真度準則的實施過程是選定若干評價者對待評圖像打分，對這些分數求個平均值可以得到主觀評價分。但因為個體評價會受到個人喜好、光線、距離等因素的影響，很難對其制定一個統一的標準，所以圖像的主觀質量評價方法受到了一定的限制。

參考文獻

[1] 張偉.基于小波變換的圖像壓縮系統研究[D].廈門大學碩士論文.2005.2.

[2] 向輝.基于小波理論的圖像壓縮算法研究[D].華東師范大學碩士論文.2006.7.

[3] 張躍飛.基于稀疏分解的圖像壓縮[D].西南交通大學碩士論文.2006.9.

[4] 雷萌.數據壓縮算法的比較研究[J].2014.11.

注：基金項目：2012年民族學院校內項目“基于哈希表的數據壓縮算法研究”，項目編號：12myZ05

作者簡介

解碼技術論文范文5

關鍵詞： VoIP； QoS；編解碼；顫音緩存；語音通信質量

中圖分類號：TP39 文獻標志碼：A 文章編號：1006-8228（2013）07-17-02

0 引言

隨著網絡技術的迅猛發展和WiFi入網限制的解除，VoIP技術得到廣泛的應用。通過無線移動通訊網絡的VoIP業務，用戶手機可利用WiFi接入互聯網，然后利用互聯網發送和接收語音數據。近兩年，隨著智能手機的迅速崛起，這種方式漸漸得到了人們的青睞，越來越多的人選擇以這種方式代替原有的通話模式。但是，由于網絡無法提供嚴格的QoS保障，以及時延和時延抖動等原因，使得無線通訊網絡中VoIP的傳輸質量不夠理想。因此，研究如何提高VoIP語音的通信質量有重要意義。

1 VoIP的關鍵技術

VoIP即Voice Over IP的縮寫，它是將模擬音頻信號進行采樣、壓縮、打包等一系列處理后，以IP數據報的形式在IP分組交換網絡上進行傳輸。簡單地說，它是將模擬話音轉換成可以在網絡中傳輸的數字信號。

在建立VoIP通話之前，先要進行呼叫，完成這一任務的信令系統。建立呼叫之后要對數據流進行實時傳輸，這就需要一種實時傳輸技術。要使音頻信號在分組交換網絡傳輸，還需要把模擬音頻信號轉成數字信號，并進行適當的壓縮、編碼以適應這種傳輸環境，這就需要在傳輸之前對音頻進行編碼。在傳輸過程中，還需要對通話服務質量進行實時監控，因此還需要一種 QoS質量保障技術來完成這個工作。VoIP中的關鍵技術總結起來就是：信令技術、語音編碼技術、實時傳輸技術、QoS質量保障技術[1]。

1.1 信令技術

所謂信令技術，可以理解為是一種控制機制。在VoIP系統中常用的信令技術有兩個：一個是由國際電信標準（ITU一T）制定的H.323；另一個是由因特網工作組（IETF）制定的會話初始協議SIP。這兩種技術相比，H.323是一個完整的體系，提供了完成VoIP通信的所有子協議，但是由于H.323更龐大與復雜，不易于管理與維護，并且它不是一個開放性的協議。與此相比，SIP則顯得更靈活，擴展性強。SIP協議只提供會話建立、呼叫控制的功能，因而建立呼叫的時間相對較短，SIP還需要與其他協議協同合作完成VoIP的具體通話任務。SIP協議目前已被廣泛應用到IMS網絡中，負責VoIP業務的實現。

1.2 語音編碼技術

由于傳輸用到的帶寬有限，因此需要將數據壓縮得盡可能小，來降低傳輸比特率。目前主流的編碼技術有波形編碼、參量編碼和混合編碼。VoIP應用中主流的波形編碼有 G.711、G.721、G.723、G.726和G.727，而G.728、G.729、Speex等則是主流的參數和混合編碼。這些編碼各有自己獨特的算法，速率、復雜度也不盡相同。

1.3 實時傳輸技術

實時傳輸技術用來保障壓縮數據可以有序，同步地到達接收方，便于接收方對數據進行解碼。目前VoIP系統中的實時傳輸技術主要是通過RTP協議實現的[2]。

1.4 QoS質量保障技術

為了保障服務質量，VoIP采用了資源預留協議RSVP以及實時傳輸控制協議RTCP。

RSVP信令協議，可以為網絡上的任何終端、主機之間建立的路徑保留帶寬，為數據傳輸預定、保證 QoS。RTCP在進程之間交換控制信息，對傳輸質量進行管理。在 RTP會話期間，參加會話的成員會間隔的傳送包含了已發送數據包數量、丟包數量等統計數據的RTCP包。利用這些信息，服務器就可以動態調整傳輸速率乃至改變載荷類型。RTCP和RTP一般捆綁使用，可以有效地反饋，優化傳輸效率[1]。

2 影響VoIP語音質量的因素

由于VoIP業務是通過因特網來傳輸封包，因此會產生封包延遲、掉包等。影響VoIP語音質量的因素主要有：時延、時延抖動、丟包率。

2.1 時延

數據從發話端傳輸到接收端所需要的時間即形成了時延。語音通信系統中，時延的增加會讓通話雙方感覺話音傳輸的停頓感，同時也會造成回音。對于公用電話網，延時一般只有50～70ms，而IP電話的延時較大、通常為150～250ms，因此，VoIP系統的時延一般控制在100ms～150ms內，否則語音質量難以保證。VoIP系統中，時延由存儲轉發時延，傳播時延及處理時延組成。

2.2 時延抖動

在一個VoIP呼叫過程中，所有發送的數據包經不同路徑到達目的地的時間差異即形成了時延抖動。VoIP不同于傳統PSTN網絡，以固定速率進行傳輸，由于它在IP網絡上存在不同路由，而導致同一數據包之間也會有不同的時延，存在傳輸時間差，因此產生抖動 [3]。

2.3 丟包率

IP數據包傳輸的過程中，丟失的數據包數量占所發送數據包總量的比率即形成了丟包率指。不僅數據包在網絡中間傳輸過程中可能產生丟包，當話音網絡中超出抖動緩沖區所能承受的最大時延時也會產生丟包。丟包會造成話音信息的缺失，嚴重時會導致話音的不連貫，甚至無法準確收聽到對方的話音。丟包率主要與網絡的流量有關，它是影響話音質量的重要因素。通常情況下，語音業務的丟包率須要控制在1%以內。

3 改善VoIP語音通信質量的方法

為了保證VoIP通話的要求，可以從以下幾個方面進行改善。

3.1 優化網絡環境

通過增加DSL或其他設備的頻寬，使得語音質量得到改善。需要注意編解碼所占頻寬的大小，還應該考慮封包成本。例如，G.711雖然只占64kbps，但是把封包成本計算在內，所需的實際頻寬超過100kbps。改善網絡環境就會增加投資成本，包括更換設備和增加頻寬。而且，由于網絡跨越范圍很廣，眾多設備當中可能有部分會發生故障，這時就會使得丟包率瞬間提高，這對于需要即時傳輸的語音封包來說有致命的影響。

3.2 選擇合適的編解碼

選擇合適的編解碼可以對抗瞬間爆發的丟包率。在窄頻環境中可使用iLBC，寬帶環境中可使用ISAC或G.711，這些編解碼可以在丟包率超過20%的情況下，MOS值仍然超過3.0的優異效果。在選擇合適的編解碼的同時，還要保證當前頻寬能夠滿足編解碼的需求。如：iLBC至少在30kbps以上，G.711至少在80kbps以上。

3.3 服務質量保障（QoS）

QoS是將不同的封包（協議）進行標簽化處理，使得帶有特定標簽的封包（協議）能夠被優先處理并傳送。QoS的算法多達數十種，有的機制可以通過結合其他的規則使得效果加以優化。有的機制將不同的封包（協議）通過優先等級隊列的方式，來保證優先級別高的封包（協議）可以“插隊”處理與傳送。有的機制是將可用的帶寬進行分割、編制等級，讓不同的封包（協議）以不同的帶寬傳輸。更復雜的算法設計，還能使用“借用頻寬”的方式來加速封包的傳送。設備端能判斷鄰近的頻寬是否使用中，如果發現“隔壁”頻寬并未使用，就可以允許特定封包（協議）借用隔離的頻寬。有些算法甚至于針對優先等級來決定頻寬借用問題，高優先等級的封包（協議）可以借用低優先等級的頻寬。反之，低優先等級的封包或協議無法借用高優先等級的頻寬[4]。

在VoIP系統中，通過QoS的技術雖然能確保語音封包優先處理與傳送，但是如果此時網絡環境不良，優先傳送的封包發生丟包情形，語音質量依舊會發生不穩定或不良的情形。

3.4 使用顫音緩存

顫音是由于封包遲延產生的，可以在設備接受端使用部分內存作為緩沖區，將沒有到達的封包緩存，并對其進行排序，再按序播放，這樣可以改善顫音的現象。從理論上來講，緩存區越大效果越好，但是這樣會占用寶貴的內存資源。而且，由于聲音是實時的，顫音的處理要在有限時間內完成，因此，太大的緩存空間不但浪費內存，而且還可能使封包延遲更嚴重。

4 結束語

經過上述分析可知，要想提高VoIP語音的通信質量，需要綜合多方面的因素考慮、權衡。要想徹底改變語音質量應該通過改善網絡環境，增加頻寬來實現。但是當網絡環境無法在短期內得到改善時，選擇合適的編解碼將優于傳統的QoS的效果。本文提出的方法，將對VoIP系統語音通信質量的提高，推動VoIP業務的普及具有實際意義。

參考文獻：

[1] 林輝.基于SIP的嵌入式AndroidVoIP語音終端的研究與實現[D].華南理工大學碩士學位論文，2012.

[2] 徐韜.基于Android終端的小型VoIP系統設計與實現[D].大連理工大學碩士學位論文，2011.

解碼技術論文范文6

摘

要

隨著Internet的迅猛發展，人們已經不滿足于在網絡上傳輸簡單的文本圖像信息，更加豐富的多媒體信息，特別是連續的媒體內容（視頻和音頻）已經開始在互聯網上普及。通過網絡傳輸連續媒體數據為人們呈現出一個極具吸引力的信息交流場景。為了適應這種新的需求，視頻編碼的目標逐漸由傳統的面向存儲變為現在的面向傳輸。

本文首先分析了Internet環境下多媒體數據傳輸的各種解決方法，討論適合網絡傳輸的視頻編解碼方案。在目前的Internet環境下，由于網絡的異構性和傳輸速率的不穩定性，媒體流數據在傳輸的過程中會出現延時、丟失等意外狀況，影響了傳輸的質量。針對這個問題，國內外的學者提出了各種解決方案，主要從網絡體系結構和視頻編解碼框架兩個方面進行考慮。然而網絡體系結構的改變不是一朝一夕的事情，因此，設計新的適合網絡傳輸的視頻編碼算法成為本文研究的重點。

在目前實際應用的網絡多媒體技術中，流媒體技術是主要的應用成果。本文以最新的流媒體解決方案為基礎設計了一個網絡多媒體教學系統，通過該系統的設計與實現，本文分析了現有網絡多媒體技術在Internet環境下所存在的不足。針對這些缺陷，本文提出了一個改進型FGS編碼框架。該框架以基本的FGS編碼方案為基礎，引入了改進的預測算法和碼率的自適應策略等新技術。通過實驗結果證明，該框架在一定的條件下提高了FGS算法的性能。

最后，本文對分析結果進行了總結，提出了相應的觀點和對未來網絡多媒體數據傳輸發展方向的展望。

關鍵詞：面向傳輸，流媒體，精細可擴展性

：34000多字的工學碩士學位論文

有中英文摘要、目錄、參考文獻、大量圖片

400元

上一篇人文素養教育論文

下一篇學校節能工作計劃

相關文章

相關期刊

相關精選

1解碼技術論文

亚洲精品一二三区-久久