真人一对一直播,chinese极品人妻videos,青草社区,亚洲影院丰满少妇中文字幕无码

0
首頁(yè) 精品范文 解碼技術(shù)論文

解碼技術(shù)論文

時(shí)間:2023-01-25 21:24:34

開(kāi)篇:寫(xiě)作不僅是一種記錄,更是一種創(chuàng)造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇解碼技術(shù)論文,希望這些內(nèi)容能成為您創(chuàng)作過(guò)程中的良師益友,陪伴您不斷探索和進(jìn)步。

解碼技術(shù)論文

第1篇

關(guān)鍵詞:RGB YCbCr FPGA 色彩空間轉(zhuǎn)換

中圖分類(lèi)號(hào):TN911 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2014)09(a)-0023-01

1 常見(jiàn)色彩空間

我們主要介紹RGB和YCbCr色彩空間。RGB色彩空間是一種常用的色彩空間。它可以實(shí)現(xiàn)不同平臺(tái)的映射而不嚴(yán)重?fù)p失顏色信息。任何一種顏色都可以由三基色紅、綠、藍(lán)混合疊加而成。RGB三個(gè)分量彼此相互獨(dú)立,三個(gè)分量的值越小所代表的亮度越低。RGB色彩空間它所占用的帶寬和存儲(chǔ)量是很大的,如果使用該色彩空間進(jìn)行圖像傳輸,非常不利于圖像的處理。所以引入另一種色彩空間YCbCr。該格式的色彩空間是演播室編碼方案中使用的顏色模型。Y,Cb,Cr分別代表亮度、藍(lán)度分量和紅度分量。YCbCr色彩空間有以下優(yōu)勢(shì)。首先它的構(gòu)成原理符合人類(lèi)的視覺(jué)感知過(guò)程,再次它可以實(shí)現(xiàn)亮度和色度的分離,由于人眼對(duì)亮度的變化更敏感,所以我們?cè)趥鬏攬D像時(shí)減小帶寬的同時(shí)引起的顏色損失小,人眼幾乎無(wú)法察覺(jué)。

2 總體設(shè)計(jì)方案

系統(tǒng)的總體設(shè)計(jì)框圖如圖1所示。

基于FPGA的色彩空間的轉(zhuǎn)換過(guò)程可以描述為:首先通過(guò)CCD攝像頭進(jìn)行視頻圖像采集,采集來(lái)的RGB圖像為NTSC或PAL制式的,接著我們會(huì)把視頻數(shù)據(jù)送到解碼芯片TVP5150,它會(huì)將信號(hào)變?yōu)镮TU-R BT.656格式的數(shù)據(jù)流。我們選取的TVP5150芯片是和FPGA主控芯片集成在一個(gè)開(kāi)發(fā)板上,它的功耗非常低,芯片小巧利于便攜。視頻解碼芯片在對(duì)視頻信號(hào)處理之前總線會(huì)對(duì)其進(jìn)行配置。從解碼芯片出來(lái)的信號(hào)便進(jìn)入FPGA芯片,進(jìn)行串并轉(zhuǎn)換、解交織等操作最終實(shí)現(xiàn)色彩空間的轉(zhuǎn)換。最后信號(hào)送到ADV7123芯片進(jìn)行編碼,并通過(guò)D/A轉(zhuǎn)換芯片在VGA顯示器上顯示出來(lái)。

3 仿真與硬件驗(yàn)證

硬件部分我們采用了Alera公司的FPGA芯片EP2C8Q208C8N作為核心處理芯片,該芯片內(nèi)部含有豐富的可編程邏輯資源,可以非常方便的完成相關(guān)乘法器的例化。在使用乘法器IPCore時(shí),我們需要進(jìn)行優(yōu)化設(shè)置。硬件部分包括CCD攝像頭、FPGA主控芯片、視頻解碼芯片TVP5150、視頻編碼芯片ADV7123等。最終將VGA線和顯示器的VGA口相連接,便可以通過(guò)顯示屏觀察結(jié)果。

硬件實(shí)物圖如圖2所示。

軟件部分采用Quartusii 9.1進(jìn)行Verilog語(yǔ)言的編寫(xiě),并進(jìn)行時(shí)序仿真。進(jìn)行時(shí)序仿真的結(jié)果圖3所示。

4 結(jié)語(yǔ)

生活中存在多種色彩空間,它們各自具有不同的特點(diǎn)。但是在很多情況下我們又得在它們之間進(jìn)行轉(zhuǎn)換,這無(wú)論對(duì)于科研研究還是消費(fèi)市場(chǎng)都是很有必要的。本篇論文是通過(guò)硬件實(shí)現(xiàn)的RGB色彩空間到Y(jié)CbCr色彩空間的轉(zhuǎn)換,采用的Alera公司的FPGA芯片EP2C8Q208C8N作為核心處理芯片,利用其內(nèi)部豐富的可編程邏輯資源實(shí)現(xiàn)空間的轉(zhuǎn)換,并采用Quartusii 9.1進(jìn)行軟件編程與仿真,驗(yàn)證了模塊的功能。

參考文獻(xiàn)

[1] 唐曉燕,賈鋒,韓磊.基于FPGA的視頻顏色空間轉(zhuǎn)換電路設(shè)計(jì)[J].電子與電腦,2006(8):47-49.

[2] 吳康,劉耀元,胡民山.用FPGA實(shí)現(xiàn)色彩空間RGB到Y(jié)CbCr的轉(zhuǎn)換[J].南昌高專(zhuān)學(xué)報(bào),2007,22(6):140-142.

第2篇

統(tǒng)計(jì)機(jī)器翻譯在短時(shí)期能夠得以迅速發(fā)展,除了技術(shù)進(jìn)步外,很大一方面要?dú)w功于很多開(kāi)放源碼的統(tǒng)計(jì)機(jī)器翻譯工具,有些時(shí)候,正是因?yàn)檫@些開(kāi)放源碼的工具才使得某項(xiàng)技術(shù)被廣泛接受和使用。例如,20世紀(jì)90年代初IBM公司的Brown等人提出了5個(gè)模型來(lái)刻畫(huà)統(tǒng)計(jì)機(jī)器翻譯,取得了不錯(cuò)的效果,但是在此之后很長(zhǎng)一段時(shí)間內(nèi)都沒(méi)有被大家認(rèn)可和接受,原因是他們的模型非常復(fù)雜,難以理解和實(shí)現(xiàn)。直到1999年,開(kāi)源軟件包Egypt的出現(xiàn),才使得IBM的模型被廣泛研究和使用。可以說(shuō)Brown等人的工作為現(xiàn)代統(tǒng)計(jì)機(jī)器翻譯奠定了深厚的基礎(chǔ),但其影響卻是通過(guò)開(kāi)源軟件才得以實(shí)現(xiàn),由此可見(jiàn)開(kāi)源軟件對(duì)于統(tǒng)計(jì)機(jī)器翻譯這樣一個(gè)復(fù)雜的研究課題的重要性。

1. 首個(gè)開(kāi)源統(tǒng)計(jì)機(jī)器翻譯工具包Egypt

Egypt是在1999年約翰霍普金斯大學(xué)統(tǒng)計(jì)機(jī)器翻譯夏季討論班上,由一些研究人員共同合作開(kāi)發(fā)的統(tǒng)計(jì)機(jī)器翻譯工具包。它包括4個(gè)模塊;

Whittle: 語(yǔ)料庫(kù)預(yù)處理模塊;

GIZA: 用于從句子對(duì)齊的雙語(yǔ)語(yǔ)料庫(kù)中訓(xùn)練詞語(yǔ)對(duì)齊;

Cairo: 詞語(yǔ)對(duì)齊的可視化工具;

Decoder: 解碼器,用來(lái)執(zhí)行具體的翻譯過(guò)程模塊,這一模塊沒(méi)有開(kāi)放源碼。

其中,用于訓(xùn)練詞語(yǔ)對(duì)齊的模塊GIZA現(xiàn)在仍然被廣泛使用,利用它能夠非常方便地從大規(guī)模的雙語(yǔ)文本中獲得統(tǒng)計(jì)知識(shí)。GIZA++是GIZA的改進(jìn)版,GIZA++實(shí)現(xiàn)了IBM公司提出的5個(gè)模型,其主要思想是利用EM算法對(duì)雙語(yǔ)語(yǔ)料庫(kù)進(jìn)行迭代訓(xùn)練,由句子對(duì)齊得到詞語(yǔ)對(duì)齊。GIZA是獨(dú)立于語(yǔ)言的,能夠?qū)θ魏蝺煞N語(yǔ)言進(jìn)行訓(xùn)練,這也是統(tǒng)計(jì)機(jī)器翻譯的優(yōu)點(diǎn)之一。現(xiàn)在幾乎所有的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)都利用這一工具進(jìn)行詞語(yǔ)對(duì)齊的訓(xùn)練。

2.語(yǔ)言模型訓(xùn)練工具SRILM

SRILM是一個(gè)建立和使用統(tǒng)計(jì)語(yǔ)言模型的開(kāi)源工具包,從1995年開(kāi)始由SRI 口語(yǔ)技術(shù)與研究實(shí)驗(yàn)室(SRI Speech Technology and Research Laboratory)開(kāi)發(fā),現(xiàn)在仍然不斷推出新版本,被廣泛應(yīng)用于語(yǔ)音識(shí)別、機(jī)器翻譯等領(lǐng)域。這個(gè)工具包包含一組C++類(lèi)庫(kù)、一組進(jìn)行語(yǔ)言模型訓(xùn)練和應(yīng)用的可執(zhí)行程序等。利用它可以非常方便地訓(xùn)練和應(yīng)用語(yǔ)言模型。給定一組連續(xù)的詞,調(diào)用SRILM提供的接口,可以得到這組詞出現(xiàn)的概率。

3. 機(jī)器翻譯的自動(dòng)評(píng)測(cè)工具M(jìn)teval

在一些著名的統(tǒng)計(jì)機(jī)器翻譯國(guó)際評(píng)測(cè)中普遍使用自動(dòng)評(píng)測(cè)與人工評(píng)測(cè)相結(jié)合的方法,例如美國(guó)國(guó)家技術(shù)和標(biāo)準(zhǔn)研究所(NIST)舉行的評(píng)測(cè)。Mteval便是他們開(kāi)發(fā)的自動(dòng)評(píng)測(cè)工具,最新版本是mteval-11b.pl,是用Perl語(yǔ)言寫(xiě)成的。

4. 首個(gè)基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)“法老”(Pharaoh)

“法老”是較早公開(kāi)的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng),由美國(guó)南加州大學(xué)信息科學(xué)實(shí)驗(yàn)室(Information Science Institute)的菲利普•科恩(Philipp Koehn)在2004年做博士論文期間編寫(xiě)的。“法老”包括兩大部分: 訓(xùn)練和解碼。訓(xùn)練過(guò)程用來(lái)從語(yǔ)料庫(kù)中獲得統(tǒng)計(jì)知識(shí)。它利用了已有的開(kāi)源軟件GIZA++和SRILM,GIZA++用來(lái)訓(xùn)練詞語(yǔ)對(duì)齊,SRILM訓(xùn)練語(yǔ)言模型,但解碼沒(méi)有公開(kāi)源代碼。“法老”原理簡(jiǎn)單,易于使用,它的出現(xiàn)對(duì)于推動(dòng)機(jī)器翻譯研究起到了非常大的作用。

5. 中國(guó)首個(gè)開(kāi)源的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)絲路(SilkRoad)

“法老”的出現(xiàn)揭開(kāi)了統(tǒng)計(jì)機(jī)器翻譯的神秘面紗,然而其核心部分――解碼器的源碼仍然沒(méi)有公開(kāi)。為此,中國(guó)的研究人員聯(lián)合開(kāi)發(fā)了一個(gè)完全開(kāi)放源代碼的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)――“絲路”。該系統(tǒng)由中國(guó)的五家研究機(jī)構(gòu)和高校(中科院計(jì)算所、中科院自動(dòng)化所、中科院軟件所、廈門(mén)大學(xué)、哈爾濱工業(yè)大學(xué))聯(lián)合開(kāi)發(fā),并在2006年中國(guó)第二屆統(tǒng)計(jì)機(jī)器翻譯研討會(huì)上。“絲路”包括以下模塊: 語(yǔ)料預(yù)處理及后處理模塊“仙人掌”、詞語(yǔ)對(duì)齊模塊“樓蘭”、短語(yǔ)抽取模塊“胡楊”、以及三個(gè)解碼器(“駱駝”、“綠洲”和“商隊(duì)”)。這是第一次將一個(gè)完整的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)公開(kāi),極大地促進(jìn)了國(guó)內(nèi)統(tǒng)計(jì)機(jī)器翻譯的快速發(fā)展。

6.摩西(Moses)

“摩西”是“法老”的升級(jí)版本,它增加了許多功能,是由英國(guó)愛(ài)丁堡大學(xué)、德國(guó)亞琛工業(yè)大學(xué)等八家單位聯(lián)合開(kāi)發(fā)的一個(gè)基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)。來(lái)自這些單位的研究人員于2006年在約翰霍普金斯大學(xué)召開(kāi)了一次研討會(huì),利用6個(gè)星期的時(shí)間共同開(kāi)發(fā)了這一系統(tǒng)。整個(gè)系統(tǒng)用C++語(yǔ)言寫(xiě)成,從訓(xùn)練到解碼完全開(kāi)放源代碼,可以運(yùn)行在Windows平臺(tái)和Linux平臺(tái)。

7. 基于句法的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)GenPar

GenPar工具包實(shí)現(xiàn)了一個(gè)基于句法的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)。基于句法的方法將句法結(jié)構(gòu)信息引入到統(tǒng)計(jì)機(jī)器翻譯中來(lái),目前已成為統(tǒng)計(jì)機(jī)器翻譯領(lǐng)域的研究熱點(diǎn)。但是構(gòu)建基于句法的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)遠(yuǎn)比構(gòu)建基于短語(yǔ)的要困難得多,為了讓研究者們很快進(jìn)入這一領(lǐng)域,在JHU2005夏季研討會(huì)上,由紐約大學(xué)艾•丹•米拉姆德(I. Dan Melamed)等人組成的統(tǒng)計(jì)機(jī)器翻譯組開(kāi)發(fā)了GenPar。

GenPar的基本原理是利用多文本語(yǔ)法(Multi-Text Grammar)實(shí)現(xiàn)多語(yǔ)言的句法分析、結(jié)構(gòu)對(duì)齊和翻譯。多文本語(yǔ)法是一種多種語(yǔ)言的同步語(yǔ)法,理論上比較完善,功能強(qiáng)大。GenPar有很多特點(diǎn):首先,該系統(tǒng)是一個(gè)純粹基于句法的模型,在翻譯過(guò)程中充分利用了句法結(jié)構(gòu)信息; 其次,它具有很好的定制能力,可以實(shí)現(xiàn)各種不同類(lèi)型的基于同步語(yǔ)法的統(tǒng)計(jì)機(jī)器翻譯,很適合于作為實(shí)驗(yàn)各種理論的研究平臺(tái)。總的來(lái)看,該系統(tǒng)功能比較強(qiáng)大,但由于其比較復(fù)雜,掌握起來(lái)比較困難,性能比現(xiàn)有的基于短語(yǔ)的模型稍差。(本文作者米海濤為中科院計(jì)算所博士研究生)

鏈接

統(tǒng)計(jì)機(jī)器翻譯第一人與Google

在統(tǒng)計(jì)機(jī)器翻譯中有一位頗具傳奇色彩的人物,就是畢業(yè)于德國(guó)亞琛工業(yè)大學(xué)的博士生弗朗茨•約瑟夫•歐赫(Franz Joseph Och)。在1999年他開(kāi)發(fā)出了著名的IBM模型訓(xùn)練工具Giza。在2002年NIST評(píng)測(cè)中,取得第一名的亞琛工業(yè)大學(xué)的機(jī)器翻譯系統(tǒng)也是由他開(kāi)發(fā)的。2002年,歐赫從亞琛工業(yè)大學(xué)畢業(yè)后進(jìn)入美國(guó)南加州大學(xué)信息科學(xué)研究所(ISI/USC)工作,同時(shí)作為L(zhǎng)anguage Weaver公司的顧問(wèn),后來(lái)于2004年加盟了谷歌(Google)公司。

他所工作的每一個(gè)單位都穩(wěn)拿當(dāng)年NIST機(jī)器翻譯評(píng)測(cè)的第一名。尤其是2005年的NIST評(píng)測(cè)中,他所在的谷歌公司開(kāi)發(fā)的漢英機(jī)器翻譯系統(tǒng)取得了0.35的BLEU值,比第二名的南加州大學(xué)(即他原來(lái)所在的單位)系統(tǒng)的性能提高了近5個(gè)百分點(diǎn)。在2006年評(píng)測(cè)中,除了漢英機(jī)器翻譯的受限語(yǔ)料項(xiàng)目,其他所有項(xiàng)目的第一名都是谷歌公司。

第3篇

IPTV(Internet Protocol Television)即交互式網(wǎng)絡(luò)電視,是一種利用寬帶有線網(wǎng)絡(luò),集互聯(lián)網(wǎng)、多媒體、通信等多種技術(shù)于一體,向家庭用戶提供包括數(shù)字電視在內(nèi)的多種交互式服務(wù)的新技術(shù)。其傳輸過(guò)程首先是把電視信號(hào)編碼轉(zhuǎn)化成適合INTERNET傳輸?shù)臄?shù)據(jù)形式,然后通過(guò)互聯(lián)網(wǎng)傳送,最后解碼通過(guò)電腦或是電視播放。IPTV的關(guān)鍵技術(shù)包括音視頻編解碼技術(shù)、流媒體傳送技術(shù)、數(shù)字版權(quán)管理(DRM)技術(shù)、IP機(jī)頂盒技術(shù)等。

編解碼技術(shù)。多媒體通信的一個(gè)顯著特點(diǎn)就是要傳輸?shù)男畔⒘糠浅4螅绕涫且曨l數(shù)據(jù),其編解碼技術(shù)在較大程度上影響著業(yè)務(wù)的質(zhì)量。IPTV采用了先進(jìn)高效的視頻壓縮編碼技術(shù),使得視頻流在800Kb/s的有限帶寬上接近DVD(MPEG2)的視覺(jué)效果(DVD的視頻傳輸帶寬通常為3Mb/s)。目前主要編解碼技術(shù)是MPEG4、H.264與AVS三種。MPEG系列是重要的視頻編碼標(biāo)準(zhǔn),所有的視頻編碼技術(shù)都參照了MPEG技術(shù)。H.264是新一代視頻編碼標(biāo)準(zhǔn),H.264的壓縮率是MPEG-2的2倍以上,是MPEG-4的1.5至2倍,這樣超高的壓縮率是以犧牲編碼運(yùn)算量為代價(jià)的,但其解碼的運(yùn)算量漲幅較小,比較容易實(shí)現(xiàn)用戶接收播放。AVS是中國(guó)擁有自主知識(shí)產(chǎn)權(quán)的第二代信源編碼標(biāo)準(zhǔn)音視頻編碼技術(shù)標(biāo)準(zhǔn),是高清晰度數(shù)字電視、寬帶網(wǎng)絡(luò)流媒體、移動(dòng)多媒體通信、激光視盤(pán)等數(shù)字音視頻產(chǎn)業(yè)群的基礎(chǔ)性標(biāo)準(zhǔn)。

流媒體傳送技術(shù)。對(duì)于傳送IPTV音視頻數(shù)據(jù)流而言,流媒體傳送技術(shù)極其重要,先進(jìn)的技術(shù)可以節(jié)約系統(tǒng)帶寬、減輕系統(tǒng)負(fù)擔(dān)、優(yōu)化系統(tǒng)。流媒體傳送系統(tǒng)主要設(shè)備是中心/邊緣流媒體服務(wù)器與存儲(chǔ)分發(fā)網(wǎng)絡(luò)。流媒體服務(wù)器具有較高的穩(wěn)定性,支持多個(gè)并發(fā)流和直播流的需求,而存儲(chǔ)分發(fā)網(wǎng)絡(luò)由多個(gè)服務(wù)器組成,通過(guò)負(fù)載均衡(如CDN)來(lái)大規(guī)模組網(wǎng)。CDN網(wǎng)絡(luò)除了提高用戶響應(yīng)速度之外,還有一個(gè)更為重要的作用,就是減輕巨大的數(shù)據(jù)流量對(duì)骨干網(wǎng)的壓力。

數(shù)字版權(quán)管理(Digital Rights Management,DRM)。它是保護(hù)多媒體內(nèi)容免受未經(jīng)授權(quán)的播放和復(fù)制的一種方法,為內(nèi)容提供者提供視頻、音樂(lè)、彩鈴、論文、圖片等數(shù)字?jǐn)?shù)據(jù)免受非法復(fù)制和使用保護(hù)的一種手段。數(shù)字多媒體內(nèi)容是IPTV中最為關(guān)鍵的節(jié)目來(lái)源。有了DRM技術(shù),可使各個(gè)平臺(tái)(無(wú)論是因特網(wǎng)、流媒體還是交互數(shù)字電視)的內(nèi)容提供商們放心地提供更多的內(nèi)容,采取更靈活的節(jié)目銷(xiāo)售方式,同時(shí)有效地保護(hù)知識(shí)產(chǎn)權(quán)。

IP機(jī)頂盒技術(shù)。IPTV系統(tǒng)的接收端包括計(jì)算機(jī)、電視機(jī)與手機(jī)。由于電視機(jī)本身并沒(méi)有存儲(chǔ)功能,不支持軟件安裝,也無(wú)法像手機(jī)那樣加裝流媒體支持功能,因而無(wú)法實(shí)現(xiàn)IP的支持功能,必須加裝一個(gè)IP數(shù)據(jù)流轉(zhuǎn)換成電視機(jī)可以接收的信號(hào)的機(jī)頂盒才能收看IPTV節(jié)目。機(jī)頂盒應(yīng)具備數(shù)據(jù)轉(zhuǎn)換、接入支持、協(xié)議支持、業(yè)務(wù)支持、解碼支持等功能。

在廣電系統(tǒng)數(shù)字電視平移模式中,杭州模式對(duì)IPTV技術(shù)的應(yīng)用最為成功。杭州數(shù)字電視模式實(shí)質(zhì)上就是用以太網(wǎng)接入,只是最后一段線路即樓道交換機(jī)到戶內(nèi)終端使用的是同軸電纜,它成功地將IPTV技術(shù)和廣電的數(shù)字電視進(jìn)行了結(jié)合。現(xiàn)在,其他省市的廣電系統(tǒng)已經(jīng)在以杭州模式為示范建設(shè)自己的廣電網(wǎng)絡(luò)。江西省的情況和杭州的實(shí)際情況有差別,不具有發(fā)展IPTV業(yè)務(wù)的優(yōu)勢(shì)平臺(tái),所以我們不能停留于模仿層面,而應(yīng)該在總結(jié)先行者的經(jīng)驗(yàn)中,尋找更好的在廣電網(wǎng)絡(luò)中運(yùn)用IPTV技術(shù)的方法。

一、數(shù)字電視平移是廣電網(wǎng)絡(luò)追求效益的增長(zhǎng)點(diǎn)。IPTV能夠提供多種形式的內(nèi)容服務(wù),傳輸電視節(jié)目只是其功能應(yīng)用的一部分,它還可以提供其他的電視類(lèi)業(yè)務(wù)、通信類(lèi)業(yè)務(wù)和各種增值業(yè)務(wù),滿足我們的各種需求。

二、增加多種形式的內(nèi)容服務(wù)要求更寬的帶寬來(lái)進(jìn)行傳輸,IPTV采用的編碼和壓縮技術(shù)是最新的高效視頻壓縮技術(shù),它壓縮了數(shù)據(jù),節(jié)約了帶寬。同時(shí)IPTV可以在傳輸?shù)倪^(guò)程中把視頻內(nèi)容按IP協(xié)議封裝成數(shù)據(jù)包,能根據(jù)用戶不同的需要,靈活解決網(wǎng)絡(luò)傳輸?shù)膯?wèn)題。如果用戶的頻帶寬,就可以壓縮率低一些,傳的包多一些,質(zhì)量好一點(diǎn);如果用戶對(duì)節(jié)目的清晰度沒(méi)有太高的要求,可以采用壓縮率高一些,傳的包少一些。這也解決了江西省現(xiàn)有SDH網(wǎng)絡(luò)帶寬不足、無(wú)法繼續(xù)添加業(yè)務(wù)的問(wèn)題。

三、真正實(shí)現(xiàn)互動(dòng)是IPTV最重要的一個(gè)優(yōu)勢(shì)。IPTV不僅能滿足受眾觀看節(jié)目的個(gè)性化需求,而且能讓受眾參與到電視節(jié)目中來(lái),與電視臺(tái)一起完成節(jié)目。

“三網(wǎng)合一”是大勢(shì)所趨,IPTV的出現(xiàn),加速了三網(wǎng)融合的步伐。無(wú)論是電信還是廣電,都在期望自己成為未來(lái)三網(wǎng)融合后的主導(dǎo)者。在這種形勢(shì)下,廣電網(wǎng)絡(luò)要想繼續(xù)發(fā)展就必須廣泛、科學(xué)地運(yùn)用IPTV技術(shù)。(作者單位:江西省廣播電視網(wǎng)絡(luò)傳輸有限公司)

欄目責(zé)編:肖月

第4篇

[關(guān)鍵詞]圖像壓縮;圖像編碼;壓縮標(biāo)準(zhǔn)

中圖分類(lèi)號(hào):Tp311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-914X(2014)45-0358-01

0 引言

當(dāng)今社會(huì)正處于高速發(fā)展的信息時(shí)代,而信息本身就需要進(jìn)行存儲(chǔ)、圖像信息是人類(lèi)認(rèn)識(shí)世界和感知世界的重要源泉。圖像具有確切性、直觀性、高效性、時(shí)空性等特征,圖像信息的這些特性導(dǎo)致它的數(shù)據(jù)量特別龐大。圖像壓縮就是對(duì)數(shù)值矩陣進(jìn)行處理,用相對(duì)少的數(shù)據(jù)來(lái)表示這個(gè)數(shù)值矩陣。這個(gè)過(guò)程要在圖像數(shù)據(jù)存儲(chǔ)、處理和傳輸之前進(jìn)行,在這之后要對(duì)壓縮過(guò)的圖像進(jìn)行解壓縮來(lái)重建圖像,這就是圖像壓縮和解壓縮,也稱(chēng)圖像編碼和圖像解碼。

1 圖像壓縮的原理

從信息論的觀點(diǎn)來(lái)看,圖像作為一個(gè)信源,描述信源的數(shù)據(jù)是信息量和信息冗余量之和。所以在圖像數(shù)據(jù)的表示中存在著大量的冗余,如時(shí)間冗余、空間冗余、知識(shí)冗余、視覺(jué)冗余等,可以利用圖像本身的一些特點(diǎn)和人眼的視覺(jué)特性,去除這些冗余數(shù)據(jù)就可以使原始圖像數(shù)據(jù)量極大的減少,從而解決圖像數(shù)據(jù)量龐大的問(wèn)題,實(shí)現(xiàn)圖像數(shù)據(jù)壓縮。

2 經(jīng)典圖像編碼

2.1 變換編碼

很多圖像編碼的原理是通過(guò)消除圖像的冗余度來(lái)達(dá)到壓縮的目的,而變換編碼則是改變了冗余度的表達(dá)方法,將原始數(shù)據(jù)用另一種更加緊湊的方法表示,有時(shí)可以實(shí)現(xiàn)更高的數(shù)據(jù)壓縮。離散余弦變換(DCT)即是一種分形變換編碼。DTC的出色之處是能將大部分圖像分成像塊,使像塊的能量集中到少數(shù)低頻DTC系數(shù)上,這樣一來(lái)DCT可以將圖像的能量很大程度的集中在一起,為壓縮打下了基礎(chǔ)。

2.2 嫡編碼

嫡編碼的原理是根據(jù)消息或消息序列出現(xiàn)概率的分布特性來(lái)尋找概率和碼字長(zhǎng)度間的最優(yōu)匹配。游程編碼、霍夫曼編碼和算術(shù)編碼等都是目前使用較多的嫡編碼。

3 現(xiàn)代圖像編碼

現(xiàn)代圖像編碼和經(jīng)典圖像編碼的區(qū)別之處在于它不是像經(jīng)典圖像編碼那樣盡量去除圖像的相關(guān)性,而是利用圖像的相關(guān)性進(jìn)行編碼。

3.1 分形編碼

分形編碼是一種直接在空間域?qū)ふ也⒆畲笙薅鹊乩脠D像的自相似性的編碼方法。

3.2 模型基圖像編碼

模型基圖像編碼主要是利用圖像的區(qū)域、輪廓等二維特征以及形狀、運(yùn)動(dòng)軌跡等三維特征進(jìn)行建模,然后對(duì)圖像和模型進(jìn)行分析得出模型的各種參數(shù),再對(duì)參數(shù)進(jìn)行編碼傳輸,解碼端則由圖像綜合恢復(fù)出圖像。這種編碼方式可以實(shí)現(xiàn)較高的壓縮比,圖像的恢復(fù)質(zhì)量也有了大大的提高。

3.3 小波變換技術(shù)

小波變換理論是新的數(shù)學(xué)分支,其基本思想是將原始圖像通過(guò)一族小波函數(shù)轉(zhuǎn)換為小波域的系數(shù),再通過(guò)略去某一閾值下的系數(shù),保留部分原始能量保留較多的系數(shù)來(lái)壓縮圖像。在小波變換中,圖像被分解為不同空間、不同頻率的子圖像,一幅圖像每經(jīng)過(guò)一次小波變換,圖像就被分解為四幅大小為原來(lái)的四分之一的小塊頻帶區(qū)域,再將這四幅子圖針對(duì)人的視覺(jué)特點(diǎn)分別進(jìn)行不同的編碼處理,可以得到比較高的壓縮比和好的壓縮質(zhì)量。

4 圖像壓縮的分類(lèi)

圖像壓縮一般根據(jù)圖像數(shù)據(jù)是否有丟失分為有損壓縮和無(wú)損壓縮兩類(lèi),無(wú)損壓縮是理想的壓縮方法(無(wú)信息丟失),也稱(chēng)可逆壓縮。有損壓縮也稱(chēng)不可逆壓縮,經(jīng)過(guò)有損壓縮后,重建圖像中像素的值和原始圖像中對(duì)應(yīng)的像素的值不完全相等,圖像會(huì)發(fā)生畸變。

圖像無(wú)損壓縮編碼方法可分為兩大類(lèi):基于統(tǒng)計(jì)概率的算法和基于字典技術(shù)的算法。基于統(tǒng)計(jì)概率的算法是根據(jù)信息論中的變長(zhǎng)編碼定理和信息嫡的相關(guān)知識(shí),用較短的代碼代表出現(xiàn)概率大的符號(hào),用較長(zhǎng)代碼代表出現(xiàn)概率小的符號(hào),從而實(shí)現(xiàn)數(shù)據(jù)壓縮。而基于字典技術(shù)生成的文件包含的是定長(zhǎng)編碼,每個(gè)碼代表原文件中的一個(gè)特定序列。

和無(wú)損壓縮不同的是,有損壓縮編碼在圖像進(jìn)行解碼還原之后的準(zhǔn)確度上要求沒(méi)有那個(gè)高,因此會(huì)產(chǎn)生一定程度上的失真,但這種編碼方式可以提高圖像的壓縮能力。一般情況下,這種失真人眼看起來(lái)可能會(huì)比較明顯,也可能不明顯,不管是哪種,只要在人眼的容忍范圍之內(nèi),就說(shuō)明這種壓縮時(shí)可行的。

5 圖像壓縮標(biāo)準(zhǔn)

隨著圖像處理技術(shù)的發(fā)展,研究人員提出了多種圖像壓縮標(biāo)準(zhǔn)。常用的圖像壓縮標(biāo)準(zhǔn)分為靜止圖像壓縮標(biāo)準(zhǔn)和視頻圖像壓縮標(biāo)準(zhǔn)。

目前最常用的靜止圖像壓縮標(biāo)準(zhǔn)是JPEG圖像壓縮標(biāo)準(zhǔn)。JPEG標(biāo)準(zhǔn)定義基于DCT得有損基本編碼系統(tǒng)、面向大規(guī)模壓縮得擴(kuò)展的編碼系統(tǒng)和面向可逆壓縮的無(wú)損獨(dú)立編碼系統(tǒng)。JPEG具有有失真和無(wú)失真兩種編碼解碼的處理方式,其中無(wú)失真得到的解碼后圖像和原圖像數(shù)據(jù)基本相同,但壓縮率較低,而有失真可以實(shí)現(xiàn)高的壓縮比,但同時(shí)可能會(huì)導(dǎo)致圖像的失真較明顯。壓縮比的高低可以在算法中改變壓縮參數(shù)來(lái)調(diào)整。JPEG標(biāo)準(zhǔn)的計(jì)算量不算很大,算法也易于實(shí)現(xiàn),所以具有較好的實(shí)用性能。

隨著多媒體技術(shù)的快速發(fā)展和廣泛應(yīng)用,為滿足用戶對(duì)更高壓縮效率和對(duì)壓縮圖像的互動(dòng)性和可伸縮性的要求,JPEG2000應(yīng)運(yùn)而生的。

JPEG2000標(biāo)準(zhǔn)可以實(shí)現(xiàn)很高的壓縮性能,它還具有只對(duì)感興趣區(qū)域編碼、可進(jìn)行有損壓縮和無(wú)損壓縮、對(duì)錯(cuò)誤的魯棒性、對(duì)碼流做隨機(jī)訪問(wèn)等特性。靈活使用這些特征,不僅可以達(dá)到很高的壓縮比,還可以滿足在移動(dòng)和網(wǎng)絡(luò)環(huán)境下交互操作和可伸縮性的要求。JPEG2000的需求針對(duì)性以及技術(shù)先進(jìn)性保證了它光明的應(yīng)用前景。

6 圖像壓縮性能的評(píng)價(jià)

一個(gè)圖像壓縮方法性能的評(píng)價(jià)主要從兩個(gè)方面來(lái)衡量:壓縮比和圖像質(zhì)量評(píng)價(jià)。壓縮比就是原始圖像文件大小與壓縮后生成文件大小的比值,比值越大,說(shuō)明壓縮率越高。圖像質(zhì)量評(píng)價(jià)一般是通過(guò)保真度準(zhǔn)則來(lái)判斷。保真度準(zhǔn)則有兩種:客觀保真度準(zhǔn)則和主觀保真度準(zhǔn)則。

6.1 客觀保真度準(zhǔn)則

客觀保真度準(zhǔn)則是對(duì)解碼圖像和原始圖像的誤差進(jìn)行定量計(jì)算的一種衡量標(biāo)準(zhǔn),一般是對(duì)整個(gè)圖像或者圖像中的某個(gè)指定區(qū)域進(jìn)行某種平均計(jì)算得到均方誤差。

6.2 主觀保真度準(zhǔn)則

圖像經(jīng)壓縮編碼和解碼還原之后,圖像質(zhì)量的好壞還有一個(gè)直接的評(píng)價(jià)者就是人眼,因此人的主觀印象也是衡量一個(gè)圖像壓縮編碼的重要因素。主觀保真度準(zhǔn)則的實(shí)施過(guò)程是選定若干評(píng)價(jià)者對(duì)待評(píng)圖像打分,對(duì)這些分?jǐn)?shù)求個(gè)平均值可以得到主觀評(píng)價(jià)分。但因?yàn)閭€(gè)體評(píng)價(jià)會(huì)受到個(gè)人喜好、光線、距離等因素的影響,很難對(duì)其制定一個(gè)統(tǒng)一的標(biāo)準(zhǔn),所以圖像的主觀質(zhì)量評(píng)價(jià)方法受到了一定的限制。

參考文獻(xiàn)

[1] 張偉.基于小波變換的圖像壓縮系統(tǒng)研究[D].廈門(mén)大學(xué)碩士論文.2005.2.

[2] 向輝.基于小波理論的圖像壓縮算法研究[D].華東師范大學(xué)碩士論文.2006.7.

[3] 張躍飛.基于稀疏分解的圖像壓縮[D].西南交通大學(xué)碩士論文.2006.9.

[4] 雷萌.數(shù)據(jù)壓縮算法的比較研究[J].2014.11.

注:基金項(xiàng)目:2012年民族學(xué)院校內(nèi)項(xiàng)目“基于哈希表的數(shù)據(jù)壓縮算法研究”,項(xiàng)目編號(hào):12myZ05

作者簡(jiǎn)介

第5篇

關(guān)鍵詞: VoIP; QoS; 編解碼; 顫音緩存; 語(yǔ)音通信質(zhì)量

中圖分類(lèi)號(hào):TP39 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2013)07-17-02

0 引言

隨著網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展和WiFi入網(wǎng)限制的解除,VoIP技術(shù)得到廣泛的應(yīng)用。通過(guò)無(wú)線移動(dòng)通訊網(wǎng)絡(luò)的VoIP業(yè)務(wù),用戶手機(jī)可利用WiFi接入互聯(lián)網(wǎng),然后利用互聯(lián)網(wǎng)發(fā)送和接收語(yǔ)音數(shù)據(jù)。近兩年,隨著智能手機(jī)的迅速崛起,這種方式漸漸得到了人們的青睞,越來(lái)越多的人選擇以這種方式代替原有的通話模式。但是,由于網(wǎng)絡(luò)無(wú)法提供嚴(yán)格的QoS保障,以及時(shí)延和時(shí)延抖動(dòng)等原因,使得無(wú)線通訊網(wǎng)絡(luò)中VoIP的傳輸質(zhì)量不夠理想。因此,研究如何提高VoIP語(yǔ)音的通信質(zhì)量有重要意義。

1 VoIP的關(guān)鍵技術(shù)

VoIP即Voice Over IP的縮寫(xiě),它是將模擬音頻信號(hào)進(jìn)行采樣、壓縮、打包等一系列處理后,以IP數(shù)據(jù)報(bào)的形式在IP分組交換網(wǎng)絡(luò)上進(jìn)行傳輸。簡(jiǎn)單地說(shuō),它是將模擬話音轉(zhuǎn)換成可以在網(wǎng)絡(luò)中傳輸?shù)臄?shù)字信號(hào)。

在建立VoIP通話之前,先要進(jìn)行呼叫,完成這一任務(wù)的信令系統(tǒng)。建立呼叫之后要對(duì)數(shù)據(jù)流進(jìn)行實(shí)時(shí)傳輸,這就需要一種實(shí)時(shí)傳輸技術(shù)。要使音頻信號(hào)在分組交換網(wǎng)絡(luò)傳輸,還需要把模擬音頻信號(hào)轉(zhuǎn)成數(shù)字信號(hào),并進(jìn)行適當(dāng)?shù)膲嚎s、編碼以適應(yīng)這種傳輸環(huán)境,這就需要在傳輸之前對(duì)音頻進(jìn)行編碼。在傳輸過(guò)程中,還需要對(duì)通話服務(wù)質(zhì)量進(jìn)行實(shí)時(shí)監(jiān)控,因此還需要一種 QoS質(zhì)量保障技術(shù)來(lái)完成這個(gè)工作。VoIP中的關(guān)鍵技術(shù)總結(jié)起來(lái)就是:信令技術(shù)、語(yǔ)音編碼技術(shù)、實(shí)時(shí)傳輸技術(shù)、QoS質(zhì)量保障技術(shù)[1]。

1.1 信令技術(shù)

所謂信令技術(shù),可以理解為是一種控制機(jī)制。在VoIP系統(tǒng)中常用的信令技術(shù)有兩個(gè):一個(gè)是由國(guó)際電信標(biāo)準(zhǔn)(ITU一T)制定的H.323;另一個(gè)是由因特網(wǎng)工作組(IETF)制定的會(huì)話初始協(xié)議SIP。這兩種技術(shù)相比,H.323是一個(gè)完整的體系,提供了完成VoIP通信的所有子協(xié)議,但是由于H.323更龐大與復(fù)雜,不易于管理與維護(hù),并且它不是一個(gè)開(kāi)放性的協(xié)議。與此相比,SIP則顯得更靈活,擴(kuò)展性強(qiáng)。SIP協(xié)議只提供會(huì)話建立、呼叫控制的功能,因而建立呼叫的時(shí)間相對(duì)較短,SIP還需要與其他協(xié)議協(xié)同合作完成VoIP的具體通話任務(wù)。SIP協(xié)議目前已被廣泛應(yīng)用到IMS網(wǎng)絡(luò)中,負(fù)責(zé)VoIP業(yè)務(wù)的實(shí)現(xiàn)。

1.2 語(yǔ)音編碼技術(shù)

由于傳輸用到的帶寬有限,因此需要將數(shù)據(jù)壓縮得盡可能小,來(lái)降低傳輸比特率。目前主流的編碼技術(shù)有波形編碼、參量編碼和混合編碼。VoIP應(yīng)用中主流的波形編碼有 G.711、G.721、G.723、G.726和G.727,而G.728、G.729、Speex等則是主流的參數(shù)和混合編碼。這些編碼各有自己獨(dú)特的算法,速率、復(fù)雜度也不盡相同。

1.3 實(shí)時(shí)傳輸技術(shù)

實(shí)時(shí)傳輸技術(shù)用來(lái)保障壓縮數(shù)據(jù)可以有序,同步地到達(dá)接收方,便于接收方對(duì)數(shù)據(jù)進(jìn)行解碼。目前VoIP系統(tǒng)中的實(shí)時(shí)傳輸技術(shù)主要是通過(guò)RTP協(xié)議實(shí)現(xiàn)的[2]。

1.4 QoS質(zhì)量保障技術(shù)

為了保障服務(wù)質(zhì)量,VoIP采用了資源預(yù)留協(xié)議RSVP以及實(shí)時(shí)傳輸控制協(xié)議RTCP。

RSVP信令協(xié)議,可以為網(wǎng)絡(luò)上的任何終端、主機(jī)之間建立的路徑保留帶寬,為數(shù)據(jù)傳輸預(yù)定、保證 QoS。RTCP在進(jìn)程之間交換控制信息,對(duì)傳輸質(zhì)量進(jìn)行管理。在 RTP會(huì)話期間,參加會(huì)話的成員會(huì)間隔的傳送包含了已發(fā)送數(shù)據(jù)包數(shù)量、丟包數(shù)量等統(tǒng)計(jì)數(shù)據(jù)的RTCP包。利用這些信息,服務(wù)器就可以動(dòng)態(tài)調(diào)整傳輸速率乃至改變載荷類(lèi)型。RTCP和RTP一般捆綁使用,可以有效地反饋,優(yōu)化傳輸效率[1]。

2 影響VoIP語(yǔ)音質(zhì)量的因素

由于VoIP業(yè)務(wù)是通過(guò)因特網(wǎng)來(lái)傳輸封包,因此會(huì)產(chǎn)生封包延遲、掉包等。影響VoIP語(yǔ)音質(zhì)量的因素主要有:時(shí)延、時(shí)延抖動(dòng)、丟包率。

2.1 時(shí)延

數(shù)據(jù)從發(fā)話端傳輸?shù)浇邮斩怂枰臅r(shí)間即形成了時(shí)延。語(yǔ)音通信系統(tǒng)中,時(shí)延的增加會(huì)讓通話雙方感覺(jué)話音傳輸?shù)耐nD感,同時(shí)也會(huì)造成回音。對(duì)于公用電話網(wǎng),延時(shí)一般只有50~70ms,而IP電話的延時(shí)較大、通常為150~250ms,因此,VoIP系統(tǒng)的時(shí)延一般控制在100ms~150ms內(nèi),否則語(yǔ)音質(zhì)量難以保證。VoIP系統(tǒng)中,時(shí)延由存儲(chǔ)轉(zhuǎn)發(fā)時(shí)延,傳播時(shí)延及處理時(shí)延組成。

2.2 時(shí)延抖動(dòng)

在一個(gè)VoIP呼叫過(guò)程中,所有發(fā)送的數(shù)據(jù)包經(jīng)不同路徑到達(dá)目的地的時(shí)間差異即形成了時(shí)延抖動(dòng)。VoIP不同于傳統(tǒng)PSTN網(wǎng)絡(luò),以固定速率進(jìn)行傳輸,由于它在IP網(wǎng)絡(luò)上存在不同路由,而導(dǎo)致同一數(shù)據(jù)包之間也會(huì)有不同的時(shí)延,存在傳輸時(shí)間差,因此產(chǎn)生抖動(dòng) [3]。

2.3 丟包率

IP數(shù)據(jù)包傳輸?shù)倪^(guò)程中,丟失的數(shù)據(jù)包數(shù)量占所發(fā)送數(shù)據(jù)包總量的比率即形成了丟包率指。不僅數(shù)據(jù)包在網(wǎng)絡(luò)中間傳輸過(guò)程中可能產(chǎn)生丟包,當(dāng)話音網(wǎng)絡(luò)中超出抖動(dòng)緩沖區(qū)所能承受的最大時(shí)延時(shí)也會(huì)產(chǎn)生丟包。丟包會(huì)造成話音信息的缺失,嚴(yán)重時(shí)會(huì)導(dǎo)致話音的不連貫,甚至無(wú)法準(zhǔn)確收聽(tīng)到對(duì)方的話音。丟包率主要與網(wǎng)絡(luò)的流量有關(guān),它是影響話音質(zhì)量的重要因素。通常情況下,語(yǔ)音業(yè)務(wù)的丟包率須要控制在1%以?xún)?nèi)。

3 改善VoIP語(yǔ)音通信質(zhì)量的方法

為了保證VoIP通話的要求,可以從以下幾個(gè)方面進(jìn)行改善。

3.1 優(yōu)化網(wǎng)絡(luò)環(huán)境

通過(guò)增加DSL或其他設(shè)備的頻寬,使得語(yǔ)音質(zhì)量得到改善。需要注意編解碼所占頻寬的大小,還應(yīng)該考慮封包成本。例如,G.711雖然只占64kbps,但是把封包成本計(jì)算在內(nèi),所需的實(shí)際頻寬超過(guò)100kbps。改善網(wǎng)絡(luò)環(huán)境就會(huì)增加投資成本,包括更換設(shè)備和增加頻寬。而且,由于網(wǎng)絡(luò)跨越范圍很廣,眾多設(shè)備當(dāng)中可能有部分會(huì)發(fā)生故障,這時(shí)就會(huì)使得丟包率瞬間提高,這對(duì)于需要即時(shí)傳輸?shù)恼Z(yǔ)音封包來(lái)說(shuō)有致命的影響。

3.2 選擇合適的編解碼

選擇合適的編解碼可以對(duì)抗瞬間爆發(fā)的丟包率。在窄頻環(huán)境中可使用iLBC,寬帶環(huán)境中可使用ISAC或G.711,這些編解碼可以在丟包率超過(guò)20%的情況下,MOS值仍然超過(guò)3.0的優(yōu)異效果。在選擇合適的編解碼的同時(shí),還要保證當(dāng)前頻寬能夠滿足編解碼的需求。如:iLBC至少在30kbps以上,G.711至少在80kbps以上。

3.3 服務(wù)質(zhì)量保障(QoS)

QoS是將不同的封包(協(xié)議)進(jìn)行標(biāo)簽化處理,使得帶有特定標(biāo)簽的封包(協(xié)議)能夠被優(yōu)先處理并傳送。QoS的算法多達(dá)數(shù)十種,有的機(jī)制可以通過(guò)結(jié)合其他的規(guī)則使得效果加以?xún)?yōu)化。有的機(jī)制將不同的封包(協(xié)議)通過(guò)優(yōu)先等級(jí)隊(duì)列的方式,來(lái)保證優(yōu)先級(jí)別高的封包(協(xié)議)可以“插隊(duì)”處理與傳送。有的機(jī)制是將可用的帶寬進(jìn)行分割、編制等級(jí),讓不同的封包(協(xié)議)以不同的帶寬傳輸。更復(fù)雜的算法設(shè)計(jì),還能使用“借用頻寬”的方式來(lái)加速封包的傳送。設(shè)備端能判斷鄰近的頻寬是否使用中,如果發(fā)現(xiàn)“隔壁”頻寬并未使用,就可以允許特定封包(協(xié)議)借用隔離的頻寬。有些算法甚至于針對(duì)優(yōu)先等級(jí)來(lái)決定頻寬借用問(wèn)題,高優(yōu)先等級(jí)的封包(協(xié)議)可以借用低優(yōu)先等級(jí)的頻寬。反之,低優(yōu)先等級(jí)的封包或協(xié)議無(wú)法借用高優(yōu)先等級(jí)的頻寬[4]。

在VoIP系統(tǒng)中,通過(guò)QoS的技術(shù)雖然能確保語(yǔ)音封包優(yōu)先處理與傳送,但是如果此時(shí)網(wǎng)絡(luò)環(huán)境不良,優(yōu)先傳送的封包發(fā)生丟包情形,語(yǔ)音質(zhì)量依舊會(huì)發(fā)生不穩(wěn)定或不良的情形。

3.4 使用顫音緩存

顫音是由于封包遲延產(chǎn)生的,可以在設(shè)備接受端使用部分內(nèi)存作為緩沖區(qū),將沒(méi)有到達(dá)的封包緩存,并對(duì)其進(jìn)行排序,再按序播放,這樣可以改善顫音的現(xiàn)象。從理論上來(lái)講,緩存區(qū)越大效果越好,但是這樣會(huì)占用寶貴的內(nèi)存資源。而且,由于聲音是實(shí)時(shí)的,顫音的處理要在有限時(shí)間內(nèi)完成,因此,太大的緩存空間不但浪費(fèi)內(nèi)存,而且還可能使封包延遲更嚴(yán)重。

4 結(jié)束語(yǔ)

經(jīng)過(guò)上述分析可知,要想提高VoIP語(yǔ)音的通信質(zhì)量,需要綜合多方面的因素考慮、權(quán)衡。要想徹底改變語(yǔ)音質(zhì)量應(yīng)該通過(guò)改善網(wǎng)絡(luò)環(huán)境,增加頻寬來(lái)實(shí)現(xiàn)。但是當(dāng)網(wǎng)絡(luò)環(huán)境無(wú)法在短期內(nèi)得到改善時(shí),選擇合適的編解碼將優(yōu)于傳統(tǒng)的QoS的效果。本文提出的方法,將對(duì)VoIP系統(tǒng)語(yǔ)音通信質(zhì)量的提高,推動(dòng)VoIP業(yè)務(wù)的普及具有實(shí)際意義。

參考文獻(xiàn):

[1] 林輝.基于SIP的嵌入式AndroidVoIP語(yǔ)音終端的研究與實(shí)現(xiàn)[D].華南理工大學(xué)碩士學(xué)位論文,2012.

[2] 徐韜.基于Android終端的小型VoIP系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].大連理工大學(xué)碩士學(xué)位論文,2011.

第6篇

隨著Internet的迅猛發(fā)展,人們已經(jīng)不滿足于在網(wǎng)絡(luò)上傳輸簡(jiǎn)單的文本圖像信息,更加豐富的多媒體信息,特別是連續(xù)的媒體內(nèi)容(視頻和音頻)已經(jīng)開(kāi)始在互聯(lián)網(wǎng)上普及。通過(guò)網(wǎng)絡(luò)傳輸連續(xù)媒體數(shù)據(jù)為人們呈現(xiàn)出一個(gè)極具吸引力的信息交流場(chǎng)景。為了適應(yīng)這種新的需求,視頻編碼的目標(biāo)逐漸由傳統(tǒng)的面向存儲(chǔ)變?yōu)楝F(xiàn)在的面向傳輸。

本文首先分析了Internet環(huán)境下多媒體數(shù)據(jù)傳輸?shù)母鞣N解決方法,討論適合網(wǎng)絡(luò)傳輸?shù)囊曨l編解碼方案。在目前的Internet環(huán)境下,由于網(wǎng)絡(luò)的異構(gòu)性和傳輸速率的不穩(wěn)定性,媒體流數(shù)據(jù)在傳輸?shù)倪^(guò)程中會(huì)出現(xiàn)延時(shí)、丟失等意外狀況,影響了傳輸?shù)馁|(zhì)量。針對(duì)這個(gè)問(wèn)題,國(guó)內(nèi)外的學(xué)者提出了各種解決方案,主要從網(wǎng)絡(luò)體系結(jié)構(gòu)和視頻編解碼框架兩個(gè)方面進(jìn)行考慮。然而網(wǎng)絡(luò)體系結(jié)構(gòu)的改變不是一朝一夕的事情,因此,設(shè)計(jì)新的適合網(wǎng)絡(luò)傳輸?shù)囊曨l編碼算法成為本文研究的重點(diǎn)。

在目前實(shí)際應(yīng)用的網(wǎng)絡(luò)多媒體技術(shù)中,流媒體技術(shù)是主要的應(yīng)用成果。本文以最新的流媒體解決方案為基礎(chǔ)設(shè)計(jì)了一個(gè)網(wǎng)絡(luò)多媒體教學(xué)系統(tǒng),通過(guò)該系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),本文分析了現(xiàn)有網(wǎng)絡(luò)多媒體技術(shù)在Internet環(huán)境下所存在的不足。針對(duì)這些缺陷,本文提出了一個(gè)改進(jìn)型FGS編碼框架。該框架以基本的FGS編碼方案為基礎(chǔ),引入了改進(jìn)的預(yù)測(cè)算法和碼率的自適應(yīng)策略等新技術(shù)。通過(guò)實(shí)驗(yàn)結(jié)果證明,該框架在一定的條件下提高了FGS算法的性能。

最后,本文對(duì)分析結(jié)果進(jìn)行了總結(jié),提出了相應(yīng)的觀點(diǎn)和對(duì)未來(lái)網(wǎng)絡(luò)多媒體數(shù)據(jù)傳輸發(fā)展方向的展望。

關(guān)鍵詞:面向傳輸,流媒體,精細(xì)可擴(kuò)展性

:34000多字的工學(xué)碩士學(xué)位論文

有中英文摘要、目錄、參考文獻(xiàn)、大量圖片

400元

第7篇

參考文獻(xiàn)

[1]呂昕.基于UWB的危化品倉(cāng)儲(chǔ)堆垛貨物定位技術(shù)的研究[D].北京:北京化工大學(xué),2015.

[2]王宇.危險(xiǎn)化學(xué)品物流[M].北京:化學(xué)工業(yè)出版社,2010:226-231.

[3]師立晨,王如君,多英全.我國(guó)危險(xiǎn)化學(xué)品重大危險(xiǎn)源安全監(jiān)管存在問(wèn)題及建議[J].中國(guó)安全生產(chǎn)科學(xué)技術(shù),2014,12(12):161-166.

[4]楊飛龍,張嘉琪,王敏.基于RFID的危險(xiǎn)化學(xué)品智能倉(cāng)儲(chǔ)管理系統(tǒng)[J].安全與環(huán)境工程,2015,22(3):111-116.

[5]蔣白樺,索寒生.基于物聯(lián)網(wǎng)技術(shù)的危化品物流應(yīng)用平臺(tái)研究[J].計(jì)算機(jī)與應(yīng)用化學(xué),2014,31(10):1271-1274.

[6]饒運(yùn)濤,鄒繼軍.電子標(biāo)簽技術(shù)[M].北京:北京航空航天大學(xué)出版社,2011:23-27.

[7]陳炯.QRcode碼編解碼技術(shù)的研究與實(shí)現(xiàn)[D].西安:西安電子科技大學(xué),2012.

[8]徐丹,謝小杰,吳俊.基于二維碼技術(shù)的自動(dòng)化倉(cāng)庫(kù)管理系統(tǒng)的設(shè)計(jì)[J].計(jì)算機(jī)與數(shù)字工程,2013,41(12):2020-2023.

[9]GB/T18284-2000.中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)——快速響應(yīng)矩陣碼(QRcode)[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2001.

[10]楊坤.地圖溯源管理機(jī)制與關(guān)鍵技術(shù)研究[D].鄭州:中國(guó)信息工程大學(xué),2013.

[11]劉悅,劉明業(yè).QRCode二維條碼數(shù)據(jù)編碼的研究[J].北京理工大學(xué)學(xué)報(bào),2005,25(4):352-355.

參考文獻(xiàn):

[1]郝金強(qiáng).基于樹(shù)型設(shè)備編碼的可視化倉(cāng)儲(chǔ)管理系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)[D].上海交通大學(xué),2011.

[2]施菁菁.基于ERP的電力物資倉(cāng)儲(chǔ)管理系統(tǒng)研究[D].華北電力大學(xué),2015.

[3]王德廣,石華,周志剛,王超.基于PDA與WebService的鋼板信息管理系統(tǒng)的實(shí)現(xiàn)[J].微型電腦應(yīng)用,2010,27-31.

[4]國(guó)家電網(wǎng)公司編.國(guó)家電網(wǎng)公司物資集約化管理[M].中國(guó)電力出版社,2012,238-265.

參考文獻(xiàn)

[1]周曉明.SAPEWM高級(jí)倉(cāng)儲(chǔ)管理解決方案[J].無(wú)線互聯(lián)科技,2014(8).

[2]賈英杰,王慧東.淺議物資倉(cāng)儲(chǔ)自動(dòng)化管理[J].科技致富向?qū)В?014(20).

[3]汪淳.基于現(xiàn)代物流管理的自動(dòng)化倉(cāng)儲(chǔ)管理解決方案[J].現(xiàn)代商貿(mào)工業(yè),2014(3).

[4]鄭庚.我國(guó)中小企業(yè)商品倉(cāng)儲(chǔ)管理探討[J].現(xiàn)代交際,2013(1).

參考文獻(xiàn):

[1]張國(guó)衛(wèi),孫樹(shù)旺.物流倉(cāng)儲(chǔ)管理實(shí)訓(xùn)課程的研究和應(yīng)用[J].商場(chǎng)現(xiàn)代化,2014(23).119.

[2]李明華.MOOCs革命:獨(dú)立課程市場(chǎng)形成和高等教育世界市場(chǎng)新格局[J].開(kāi)放教育研究,2013.(3).

[3]楊美濃.基于MOOC的《計(jì)算機(jī)應(yīng)用基礎(chǔ)》課程教學(xué)設(shè)計(jì)[J].信息化建設(shè),2016.(07).179-180

第8篇

論文關(guān)鍵詞:元語(yǔ)言意識(shí) 兒童閱讀 語(yǔ)音意識(shí) 句法意識(shí)

論文摘要:兒童元語(yǔ)言意識(shí)和閱讀的發(fā)展關(guān)系一直是心理學(xué)家所共同關(guān)注的一個(gè)重要問(wèn)題。從元語(yǔ)言及元語(yǔ)言意識(shí)的概念含義入手,著重介紹并討論了語(yǔ)音意識(shí)和句法意識(shí)對(duì)兒童閱讀理解能力的影響,從而對(duì)研究?jī)和脑Z(yǔ)言的重要性有進(jìn)一步的認(rèn)識(shí)和了解。

近幾十年來(lái),元語(yǔ)言意識(shí)在兒童詞閱讀發(fā)展中的重要作用是心理語(yǔ)言學(xué)研究中最重要的發(fā)現(xiàn)之一,對(duì)其研究具有重要的理論意義和實(shí)踐意義。下文將以元語(yǔ)言和元語(yǔ)言意識(shí)的概念含義為基礎(chǔ),著重分析探討元語(yǔ)言意識(shí)中的語(yǔ)音意識(shí)和句法意識(shí)對(duì)兒童閱讀的影響,在現(xiàn)有研究的基礎(chǔ)上得出一些有益于兒童早期英語(yǔ)教育的結(jié)論。

一、元語(yǔ)言及元語(yǔ)言意識(shí)

所謂的元語(yǔ)言(metalanguage)是指有關(guān)語(yǔ)言的語(yǔ)言,是人類(lèi)語(yǔ)言的一個(gè)普遍現(xiàn)象。它既是語(yǔ)言學(xué)家必不可少的描寫(xiě)工具,以其專(zhuān)業(yè)性和技術(shù)性而被稱(chēng)為是語(yǔ)言學(xué)家的“行話”(jargon);同時(shí),它又是普通人指稱(chēng)和談?wù)撜Z(yǔ)言的一種必須手段,因而元語(yǔ)言有雙重性。在兒童的語(yǔ)言教學(xué)中,需要培養(yǎng)的基本語(yǔ)言能力有以下兩種:一是理解語(yǔ)言并使用語(yǔ)言表達(dá)思想,進(jìn)行交流;二是描述并理解自己所學(xué)和所用的語(yǔ)言。第二種層次的能力就是我們所說(shuō)的元語(yǔ)言能力。

近年來(lái),認(rèn)知科學(xué)領(lǐng)域的心理學(xué)家和語(yǔ)言學(xué)家都開(kāi)始更多關(guān)注語(yǔ)言使用者的“元語(yǔ)言意識(shí)”(metalinguistic awareness)。元語(yǔ)言意識(shí)是指?jìng)€(gè)體思考和反思語(yǔ)言的特征和運(yùn)作的能力。具有元語(yǔ)言意識(shí)的人,能夠有效地認(rèn)識(shí)和思考語(yǔ)言的本質(zhì)和功能。從事雙語(yǔ)教育研究的學(xué)者發(fā)現(xiàn)對(duì)使用雙語(yǔ)的兒童來(lái)說(shuō),具有較強(qiáng)的“元語(yǔ)言意識(shí)”已經(jīng)成為他們一個(gè)獨(dú)特的優(yōu)勢(shì),因其具有“思考自己的語(yǔ)言、理解詞匯的意義、甚至給這些詞匯下定義”的能力。元語(yǔ)言意識(shí)包括四種一般的類(lèi)型:語(yǔ)音意識(shí)、詞素意識(shí)、句法意識(shí)和語(yǔ)用意識(shí)。在兒童讀寫(xiě)能力發(fā)展的不同階段具有不同影響,其中尤以語(yǔ)音意識(shí)和句法意識(shí)在兒童早期閱讀中的影響最為突出。

二、語(yǔ)音意識(shí)的發(fā)展對(duì)兒童閱讀的影響

語(yǔ)音意識(shí)是指操縱和控制語(yǔ)音表征的能力,包括音位意識(shí)、音節(jié)意識(shí)和音節(jié)內(nèi)單元的意識(shí),是對(duì)任意一種語(yǔ)音單元的意識(shí)。語(yǔ)音意識(shí)與個(gè)體早期的閱讀有著非常密切的關(guān)系,大多數(shù)關(guān)于兒童語(yǔ)音意識(shí)發(fā)展的研究都是從語(yǔ)音意識(shí)對(duì)閱讀能力的影響這一視角進(jìn)行的。

閱讀是一種高水平信息加工的過(guò)程。其中,詞匯通達(dá)是基礎(chǔ)性環(huán)節(jié)。在詞匯通達(dá)中,語(yǔ)音解碼起著非常重要的作用。所謂語(yǔ)音解碼就是將書(shū)面的言語(yǔ)符號(hào)轉(zhuǎn)換為語(yǔ)音表征系統(tǒng)的過(guò)程。在閱讀過(guò)程中,語(yǔ)音解碼過(guò)程存在兩種機(jī)制,一種是詞匯機(jī)制,它依賴(lài)對(duì)整個(gè)詞或詞素讀音的直接通達(dá)自動(dòng)尋址語(yǔ)音(Addressed phonology);另一種是非詞匯機(jī)制或稱(chēng)為正字法機(jī)制,讀者在閱讀過(guò)程可以應(yīng)用從正字法到語(yǔ)音的聯(lián)系將書(shū)面詞語(yǔ)的拼寫(xiě)一一轉(zhuǎn)換并合成相應(yīng)的語(yǔ)音表征,這樣得到的語(yǔ)音也被稱(chēng)為合成語(yǔ)音。在拼音文字系統(tǒng)的閱讀中,一定的語(yǔ)音意識(shí)水平對(duì)于兒童發(fā)現(xiàn)形和音之間的對(duì)應(yīng)規(guī)則,利用非詞匯機(jī)制進(jìn)行語(yǔ)音解碼是十分必要的。語(yǔ)音意識(shí)可以使兒童進(jìn)行有效的語(yǔ)音分解和合成,建立起書(shū)面語(yǔ)和口語(yǔ)的對(duì)應(yīng)關(guān)系,確認(rèn)不熟悉的單詞以提高單詞識(shí)別的速度和自動(dòng)化的程度,從而提高閱讀能力。

同時(shí),Shankweiler等學(xué)者通過(guò)對(duì)閱讀不良兒童進(jìn)行大量研究,提出了“語(yǔ)音限制假說(shuō)”。該假說(shuō)認(rèn)為,閱讀不良的兒童的主要問(wèn)題是在語(yǔ)音加工方面存在缺陷,而且語(yǔ)音加工的缺陷會(huì)產(chǎn)生“瓶頸”效應(yīng),進(jìn)一步影響其他語(yǔ)言加工過(guò)程的進(jìn)行。因?yàn)檎Z(yǔ)言加工的信息是從語(yǔ)音加工單方向上到達(dá)句法和語(yǔ)義加工系統(tǒng),而工作記憶則充當(dāng)了這個(gè)信息加工過(guò)程的中轉(zhuǎn)站。當(dāng)語(yǔ)音加工能力不足時(shí),語(yǔ)音加工中的缺陷就制約了整個(gè)信息的正常加工,從而阻止了信息向更高級(jí)的加工水平進(jìn)行傳遞。“語(yǔ)音加工缺陷理論”試圖將閱讀困難兒童的復(fù)雜原因歸結(jié)為語(yǔ)音加工缺陷的結(jié)果。因此,根據(jù)該理論,語(yǔ)音意識(shí)對(duì)閱讀應(yīng)該具有基礎(chǔ)性決定的作用。另外,Gottardo等人對(duì)112名三年級(jí)兒童語(yǔ)音意識(shí)、句法意識(shí)、工作記憶以及單詞再認(rèn)、假詞拼讀和閱讀理解能力進(jìn)行了考察,結(jié)果表明在語(yǔ)音意識(shí)和工作記憶被控制的條件下,句法意識(shí)對(duì)單詞再認(rèn)、假詞拼寫(xiě)、閱讀理解都不具預(yù)測(cè)作用,該結(jié)論也進(jìn)一步證實(shí)了“語(yǔ)音缺陷假說(shuō)”。

由此我們不難得出:語(yǔ)音意識(shí)是閱讀能力習(xí)得的先決條件,語(yǔ)音加工是閱讀速度和閱讀效率的重要預(yù)測(cè)指標(biāo)。但語(yǔ)音意識(shí)對(duì)閱讀理解的促進(jìn)作用有兩個(gè)先決條件:首先,兒童在學(xué)習(xí)閱讀前已經(jīng)具備一定的口語(yǔ)能力,大量的口語(yǔ)表征已經(jīng)形成,而且詞匯的語(yǔ)音表征和相應(yīng)的語(yǔ)義聯(lián)系已經(jīng)建立。其次,兒童在閱讀中能有意識(shí)地利用非詞匯機(jī)制對(duì)不熟悉的單詞進(jìn)行語(yǔ)音解碼,并能夠根據(jù)解碼的語(yǔ)音確認(rèn)不熟悉單詞的意義,從而提高閱讀能力。

三、句法意識(shí)的發(fā)展對(duì)兒童閱讀的影響

句法意識(shí)是指?jìng)€(gè)體反思句子內(nèi)在語(yǔ)法結(jié)構(gòu)的能力,也稱(chēng)為語(yǔ)法敏感性。Layton 等人將句法意識(shí)的發(fā)展分為四個(gè)水平:(1)獲得默許的句法規(guī)則的知識(shí)水平;(2)獲得自動(dòng)的修補(bǔ)策略;(3)知道句法規(guī)則的存在并能夠識(shí)別出來(lái);(4)把句法知識(shí)反應(yīng)在語(yǔ)言中或相關(guān)的任務(wù)上。前面兩個(gè)水平都是句法上升到意識(shí)水平之前必經(jīng)的準(zhǔn)備階段,第三個(gè)水平開(kāi)始才進(jìn)入了句法意識(shí)時(shí)期。這樣一種劃分可以使我們更清楚句法意識(shí)的范疇,同時(shí)也為測(cè)量句法意識(shí)提供了一個(gè)指標(biāo)。

句法意識(shí)與閱讀之間有著密切的關(guān)系。語(yǔ)言學(xué)家進(jìn)行的研究發(fā)現(xiàn)以下兩點(diǎn):第一,閱讀優(yōu)秀兒童的測(cè)試成績(jī)明顯高于不良閱讀者;第二,被試兒童在學(xué)習(xí)閱讀前的句法意識(shí)測(cè)試成績(jī)對(duì)以后的閱讀成績(jī)有預(yù)測(cè)作用。流利的閱讀不僅需要理解單個(gè)詞匯的意思,同時(shí)還需要在句子和篇章水平上將這些詞匯進(jìn)行整合,這就離不開(kāi)句法分析。句法分析是辨別句子結(jié)構(gòu),理解句子意義的有效手段,而句法分析能力的高低在很大程度上取決于句法意識(shí)的發(fā)展水平。一定的句法意識(shí)發(fā)展水平不僅可以減少句法分析的步驟,提高心理表征的速度,還能澄清模糊的知識(shí)來(lái)提高閱讀理解能力。

在此基礎(chǔ)上,Tunmer等學(xué)者的研究進(jìn)一步證明,句法意識(shí)在控制了語(yǔ)音意識(shí)之后仍能解釋詞的解碼能力中的變異。他們認(rèn)為,句法意識(shí)對(duì)閱讀成績(jī)的影響可能通過(guò)下列兩種方式進(jìn)行:第一種是句法意識(shí)使得讀者能更有效地監(jiān)控他們正在進(jìn)行的理解過(guò)程。兒童的句法意識(shí)越高,這種理解監(jiān)控過(guò)程就越有效。第二種方式可能是,句法意識(shí)幫助兒童獲得語(yǔ)音編碼的技巧。首先,兒童要獲得形素—音素的對(duì)應(yīng)關(guān)系(grapheme-phoneme correspondence)的知識(shí)需要經(jīng)歷較長(zhǎng)的時(shí)間,初級(jí)的讀者不會(huì)記住他們遇到的所有不熟悉的詞語(yǔ)。在獲得所有形素—音素對(duì)應(yīng)的知識(shí)前,句法意識(shí)較好的兒童,能夠反映句子的結(jié)構(gòu)特征,然后利用有關(guān)句子語(yǔ)境限制的知識(shí),再結(jié)合不完整的正字法和語(yǔ)音信息來(lái)認(rèn)識(shí)那些不熟悉的詞匯,也就完成了他們?cè)陂喿x中對(duì)單詞的解碼。其次,使用語(yǔ)境信息的能力可以幫助初學(xué)者發(fā)現(xiàn)一些拼寫(xiě)模式有多于一個(gè)以上的發(fā)音。例如,字母系列ough 在 cough,rough,dough 里面分別有不同的讀音;當(dāng)遇到這樣一個(gè)包含同形異義拼寫(xiě)模式的不熟悉單詞時(shí),那些具有語(yǔ)法意識(shí)知識(shí)的被試能夠產(chǎn)生不同的發(fā)音,直到有一個(gè)讀音與聽(tīng)到過(guò)的單詞的發(fā)音匹配。由此可以看出,句法意識(shí)與閱讀的成績(jī)可能存在著直接的因果聯(lián)系。兒童的句法意識(shí)和語(yǔ)音意識(shí)可能處于相互促進(jìn)且相互制約的平衡中,而提高兒童的句法意識(shí)能夠在對(duì)語(yǔ)音意識(shí)起到促進(jìn)作用的同時(shí)提高整體閱讀能力。

綜上所述,元語(yǔ)言意識(shí)的發(fā)展對(duì)提高兒童閱讀能力有著積極的影響,它們之間的關(guān)系可歸納為以下幾個(gè)方面:第一,元語(yǔ)言意識(shí)中的語(yǔ)音意識(shí)和句法意識(shí)以及其他認(rèn)知因素一起作用影響閱讀能力的發(fā)展。第二,語(yǔ)音意識(shí)和句法意識(shí)通過(guò)不同的途徑影響兒童閱讀能力的發(fā)展,即語(yǔ)音意識(shí)影響字詞解碼進(jìn)而影響閱讀理解,而句法意識(shí)更多地通過(guò)有意識(shí)的句法分析而直接影響上下文語(yǔ)境信息的加工。第三,兒童的元語(yǔ)言能力和閱讀能力都有一個(gè)發(fā)展的過(guò)程,它們之間的關(guān)系也很有可能處于一種動(dòng)態(tài)的發(fā)展中。因此,進(jìn)行兒童元語(yǔ)言意識(shí)與閱讀能力發(fā)展影響的研究,既可以豐富已有的研究理論框架,又可以考察已有的研究結(jié)果是否具有普遍性,同時(shí)為閱讀教學(xué)、閱讀障礙糾正等提供理論上的指導(dǎo)和幫助。

參考文獻(xiàn)

[1]Bowey J A.Phonological awareness and learning in novice readers and nonreaders[J].Journal of Experimental Child Psychology,1994.

Cummins J.Bilingualism and the development of metalinguistic awareness[J].Journal of Cross-Cultural Psychology,1991.

Gombert J E.Metalinguistic development[M].Chicago: University of Chicago Press,1993.

丁朝蓬,彭聃齡.漢語(yǔ)兒童英語(yǔ)語(yǔ)音意識(shí)與拼寫(xiě)[J].心理學(xué)報(bào),1998,(3).

董燕萍.心理語(yǔ)言學(xué)與外語(yǔ)教學(xué)[M].北京:外語(yǔ)教學(xué)與研究出版社,2005.

封宗信.元語(yǔ)言與外語(yǔ)教學(xué)[J].外語(yǔ)與外語(yǔ)教學(xué),2005,(6).

姜濤,彭聃齡.漢語(yǔ)兒童的語(yǔ)音意識(shí)特點(diǎn)及閱讀能力高低讀者的差異[J].心理學(xué)報(bào),1999,(1).

第9篇

關(guān)鍵詞:信息隱匿,壓縮編碼,數(shù)據(jù)變換,數(shù)據(jù)選擇

1 引言

信息隱藏是一門(mén)新興的信息安全技術(shù)。論文參考。涉及感知學(xué),信息論,密碼學(xué)等多個(gè)學(xué)科領(lǐng)域,涵蓋信號(hào)處理,擴(kuò)頻通信等多專(zhuān)業(yè)技術(shù)。 近年來(lái)得到了迅猛發(fā)展。現(xiàn)階段人們一般選擇圖像、文本、音頻和視頻等數(shù)字媒體作為載體。另外, 還出現(xiàn)了基于TCP/IP 的信息隱藏技術(shù)和基于信道編碼的信息隱藏技術(shù)。本文研究的基于壓縮編碼的信息隱藏技術(shù)是信息隱藏技術(shù)的新領(lǐng)域, 它以多媒體系統(tǒng)中的壓縮數(shù)據(jù)作為嵌入載體,數(shù)據(jù)解壓后不影響原始數(shù)據(jù)數(shù)據(jù)的結(jié)構(gòu)和統(tǒng)計(jì)特性, 具有較強(qiáng)的魯棒性和不可檢測(cè)性。

2 壓縮編碼信息隱藏的原理

壓縮編碼是一種提高數(shù)據(jù)傳輸有效性的技術(shù),它是通過(guò)對(duì)數(shù)據(jù)施加某種操作或變換使之長(zhǎng)度變短或者容量變小的同時(shí), 還必須保證原始數(shù)據(jù)能夠從壓縮產(chǎn)生的壓縮碼中得以精確的還原。從信息論的角度來(lái)看,壓縮就是去掉信息中的冗余,即保留不確定的信息,去掉確定的信息(可推知的),也就是用一種更接近信息本質(zhì)的描述來(lái)代替原有冗余的描述。這個(gè)本質(zhì)的東西就是信息量(即不確定因素)。信息隱匿和數(shù)據(jù)壓縮在本質(zhì)上是相互聯(lián)系的:對(duì)于數(shù)據(jù)壓縮來(lái)講,一塊數(shù)據(jù)中隱匿了和數(shù)據(jù)本身無(wú)關(guān)的地的其它數(shù)據(jù),那這塊隱藏了信息的數(shù)據(jù)是有一定冗余的,由冗余的數(shù)據(jù)可以進(jìn)一步被壓縮,進(jìn)一步壓縮的就有可能去掉隱匿的數(shù)據(jù);對(duì)于信息隱匿來(lái)說(shuō),一塊已被壓縮過(guò)的數(shù)據(jù)冗余量已經(jīng)很小了,由于隱匿是嵌入的數(shù)據(jù)和原始數(shù)據(jù)毫無(wú)關(guān)系,在這塊數(shù)據(jù)中進(jìn)一步隱匿數(shù)據(jù),勢(shì)必造成原始掩護(hù)數(shù)據(jù)的有效數(shù)據(jù)的減少,相當(dāng)于隊(duì)已經(jīng)壓縮的數(shù)據(jù)進(jìn)行進(jìn)一步壓縮。只要保證在接收端解壓中可以恢復(fù)原始數(shù)據(jù)的差錯(cuò)率,就可以在壓縮編碼后進(jìn)行信息隱匿,不會(huì)引起截獲者懷疑碼字載體中含有秘密信息。

3 壓縮編碼信息隱匿模型實(shí)現(xiàn)方案

基于信息隱匿和數(shù)據(jù)壓縮的關(guān)系,提出結(jié)構(gòu)如下的數(shù)據(jù)壓縮思想的通用隱匿模型。模型主要由三個(gè)部分組成:圖像壓縮、信息加密和信息隱匿。圖像壓縮部分的量化器輸出至信息隱匿部分,然后從信息隱匿部分得到隱藏有其他信息的量化數(shù)據(jù),并送到熵編碼器,其他內(nèi)容和標(biāo)準(zhǔn)壓縮過(guò)程一致。信息加密部分為傳統(tǒng)的加密方案,其主要目的是增加秘密信息的安全性,使得系統(tǒng)隱匿的信息部分即使被檢測(cè)出來(lái),也不會(huì)泄露其內(nèi)容。論文參考。

信息隱匿部分是模擬最核心的內(nèi)容,這部分主要有三個(gè)部分組成:數(shù)據(jù)變換,數(shù)據(jù)選擇和嵌入過(guò)程。數(shù)據(jù)變化的主要目的是改變加密后的信息統(tǒng)計(jì)特性,使得這些數(shù)據(jù)嵌入掩護(hù)圖像量化后的數(shù)據(jù)之中,不改變或很少改變掩護(hù)圖像的數(shù)據(jù)統(tǒng)計(jì)特性,從而使信息隱匿后的抗檢測(cè)性大大增強(qiáng)。數(shù)據(jù)選擇是從掩護(hù)圖像量化后的數(shù)據(jù)中選擇合適的比特位,用它來(lái)隱藏已加密的信息。合理的數(shù)據(jù)選擇算法應(yīng)該兼顧信息隱匿的容量,信息隱匿的抗檢測(cè)性與魯棒性。嵌入過(guò)程式將加密后的信息和選擇出來(lái)的數(shù)據(jù)進(jìn)行某種運(yùn)算(通稱(chēng)為替換或異或),用運(yùn)算結(jié)果替換選擇出來(lái)的數(shù)據(jù),并將此數(shù)據(jù)連同未選擇出來(lái)的量化數(shù)據(jù)一并交給圖像壓縮部分的熵編碼進(jìn)行編碼。

圖1 基于數(shù)據(jù)壓縮思想的通用信息隱匿模型

通用模型的秘密信息提取過(guò)程基本上是隱匿的逆過(guò)程,其流程圖如下

圖2通用信息隱匿模型的信息提取過(guò)程

壓縮后的數(shù)據(jù)首先經(jīng)過(guò)熵解碼器解碼,然后進(jìn)行數(shù)據(jù)分離,將未嵌入的數(shù)據(jù)部分送入正常的圖像解碼流程(反量化,反映射變換),而將嵌入數(shù)據(jù)的部分進(jìn)行數(shù)據(jù)提取,如果此過(guò)程的算法不是盲的(即需要原始掩護(hù)圖像),則需要分離出來(lái)的數(shù)據(jù)和原始掩護(hù)圖像經(jīng)映射變化,量化后的數(shù)據(jù)進(jìn)行運(yùn)算,將結(jié)果進(jìn)行數(shù)據(jù)恢復(fù)、解密、最后得到嵌入的原始秘密信息。

4 隱匿模型的兩種關(guān)鍵技術(shù)

在這種通用的信息隱匿模型中,數(shù)據(jù)變換和數(shù)據(jù)選擇是關(guān)鍵技術(shù)

數(shù)據(jù)變換的主要目的是改變加密后的信息統(tǒng)計(jì)特性,增強(qiáng)系統(tǒng)信息隱匿的抗檢測(cè)性能。改變數(shù)據(jù)的統(tǒng)計(jì)特性的常用方法是進(jìn)行線性濾波,從本質(zhì)上來(lái)講,線性濾波和線性變換是一致的,從頻域上來(lái)看,濾波就是對(duì)信號(hào)頻譜的不同部分進(jìn)行不同的縮放。在技術(shù)上常就是這樣一個(gè)過(guò)程:DFT→相乘→IDFT,將這一過(guò)程合并為一體時(shí),就成為一個(gè)單純的線性變換。在復(fù)數(shù)域中進(jìn)行整數(shù)的可逆處理時(shí),數(shù)據(jù)量就會(huì)增加一倍,為此可以經(jīng)DFT換成DCT,這樣這一處理過(guò)程就成為一實(shí)數(shù)域的線性變換問(wèn)題。

下面介紹整型變換算法的基本過(guò)程。

(1)對(duì)于給定的線性變換A,如是常見(jiàn)的線性變換,則進(jìn)行(2),否則對(duì)其進(jìn)行改造,使det| A ‘ |=1。

(2)將A ‘ 分解為3類(lèi)基本矩陣(置換矩陣,元素的絕對(duì)值均不小于1的對(duì)角陣,單位三角矩陣)。

(3)對(duì)于每一基本矩陣,構(gòu)造其整型變換,獲得整數(shù)輸出。

(4)對(duì)于每一步都應(yīng)有相應(yīng)的逆變換,所以整個(gè)變換的逆變換可以相應(yīng)的獲得。

(5)對(duì)于多維可分離的線性變換,正變換可以逐維的計(jì)算;為了保證逆變換對(duì)于多維數(shù)據(jù)的完全重建,應(yīng)嚴(yán)格按照和正變換相反的次序進(jìn)行逆變換。

實(shí)現(xiàn)數(shù)據(jù)變換時(shí)的另一個(gè)問(wèn)題是數(shù)據(jù)的范圍問(wèn)題。在實(shí)際處理過(guò)程中,輸入的數(shù)據(jù)都是有一定的范圍的(比如原始圖像數(shù)據(jù)通常用8位無(wú)符號(hào)數(shù)據(jù)表示),如果輸出的數(shù)據(jù)不加以限制,則輸出的數(shù)據(jù)的范圍一般要增大,這樣就必須用更多的數(shù)據(jù)表示處理結(jié)果。

數(shù)據(jù)選擇過(guò)程是從掩護(hù)圖像的量化數(shù)據(jù)中選擇合適的比特位,用它來(lái)隱匿已加密的信息。最基本的做法是選擇掩護(hù)數(shù)據(jù)中的不重要的部分,這樣做得優(yōu)點(diǎn)是對(duì)掩護(hù)圖像的質(zhì)量影響最小,使修改引起別人注意的可能性最小。但是在實(shí)際系統(tǒng)中,數(shù)據(jù)選擇算法應(yīng)該兼顧信息隱匿的容量,信息隱匿的抗檢測(cè)性與魯棒性等多個(gè)方面的性能,可以選擇下面三種。

1.LSP(LeastSignificant Portion)最不重要部分

LSP技術(shù)和LSB(最不重要比特位)技術(shù)基本類(lèi)似,區(qū)別在于LSB平等的對(duì)待掩護(hù)圖像中的每一字節(jié),不同的字節(jié)之間沒(méi)有區(qū)別,在隱藏時(shí)都在數(shù)據(jù)的最低位取相等比特;而LSP針對(duì)變換量化后的數(shù)據(jù)而言,不同位置的重要程度不同,從中所取的最低有效比特?cái)?shù)就不同,其中低頻數(shù)據(jù)是取得少一些,而在高頻數(shù)據(jù)中取得多一些。另外,不同位置的數(shù)據(jù)取值范圍也不一樣,最多的可取比特?cái)?shù)也不一樣。論文參考。

2.隨機(jī)間隔法

隨機(jī)間隔技術(shù)是以LSP為基礎(chǔ)的一種方法,在數(shù)據(jù)選擇時(shí)用一個(gè)掩密密鑰k作隨機(jī)數(shù)發(fā)生的種子,那么可以生成一個(gè)隨機(jī)序列k 1 ,…,k l ,并且把它們一起按下列方式生成隱匿信息位置來(lái)對(duì)經(jīng)LSP選擇的數(shù)據(jù)進(jìn)行進(jìn)一步選擇:j 1 =k 1

j i =k i +j i-1

從而可以偽隨機(jī)決定兩個(gè)嵌入位置的距離。這種方法由于隱匿的位置更少,所以更不容易被檢測(cè)出來(lái)。

3.隨機(jī)位置法

隨機(jī)位置技術(shù)是另外一種偽隨機(jī)的方法,它也以LSP技術(shù)為基礎(chǔ)。和隨機(jī)間隔法不同的是,它對(duì)不同的位置變換數(shù)據(jù)及量化數(shù)據(jù)的不同比特位賦予不同的選擇概率p 1 ,…,p l ,在數(shù)據(jù)選擇時(shí)也用一個(gè)偽裝密鑰k作為隨機(jī)發(fā)送的種子,那么可以生成一個(gè)一個(gè)隨機(jī)序列k 1 ,…,k l ,當(dāng)k i ≥p i 時(shí)選擇比特,否則不進(jìn)行選擇。在此方法中選擇合適概率取值方案可以兼顧信息隱匿的容量、懸念吸引你的抗檢測(cè)性與魯棒性等多方面的性能,是一種更靈活的方法。當(dāng)然可以將隨機(jī)間隔法和隨機(jī)位置發(fā)結(jié)合起來(lái)使用,那是一種更靈活、更復(fù)雜的方案。

5 實(shí)驗(yàn)結(jié)果

運(yùn)用本文提出的通用模型,以lena(512像素×512像素),作為掩護(hù)圖像,在其中隱匿隨機(jī)數(shù)據(jù),映射變換采用8×8的DCT,經(jīng)數(shù)據(jù)變換過(guò)程,結(jié)果如下圖所示。圖中從左到右,從上到下依次為:原始圖像,未嵌入數(shù)據(jù)的JPEG圖像,嵌入不等數(shù)據(jù)量的JPEG圖像。隨著嵌入數(shù)據(jù)量的增加,掩護(hù)圖像的直觀質(zhì)量會(huì)下降,這種質(zhì)量的下降類(lèi)似于不同壓縮比條件下JPEG圖像質(zhì)量的不同下降,從信息隱匿的角度來(lái)看,這種相似性是有利的。

圖3 圖用模型的數(shù)據(jù)隱匿效果

6 小結(jié)

研究了一種基于壓縮編碼的信息隱匿技術(shù),介紹了信息隱匿通用模型的兩種關(guān)鍵技術(shù):數(shù)據(jù)變換和數(shù)據(jù)選擇技術(shù),通過(guò)實(shí)驗(yàn)得到嵌入量與圖像質(zhì)量的關(guān)系。隨著通信技術(shù)的不斷發(fā)展,信息安全將成為一門(mén)很重要的學(xué)科,對(duì)于通信信息隱匿還要尋找更先進(jìn),更合理的算法來(lái)達(dá)到通信的安全性能。

參考文獻(xiàn):

[1] KATZENBEISSERS, PETITCOLASFAP.信息隱藏技術(shù)—隱寫(xiě)術(shù)與數(shù)字水印[M].吳秋新,鈕心忻,楊義先等譯.北京:人民郵電出版社,2001.

[2] 汪小帆,戴躍偉. 信息隱藏技術(shù)方法與應(yīng)用[M].北京:機(jī)械工業(yè)出版社,2001.

[3]柏森,胡中豫,吳樂(lè)華等.通信信息隱匿技術(shù)[M].北京:國(guó)防工業(yè)出版社,2005.

[4]王偉祥, 劉玉君.基于信道編碼的信息隱藏技術(shù)研究.[J] 電視技術(shù).2003(3).

第10篇

關(guān)鍵詞:視頻編碼,幀內(nèi)預(yù)測(cè),SATD,快速幀內(nèi)預(yù)測(cè)模式選擇

 

0、引言

H.264/AVC是由聯(lián)合視頻專(zhuān)家組JVT(Joint Video Team)于2003年5月正式批準(zhǔn)的新一代視頻編碼標(biāo)準(zhǔn)[1、2]。論文指南。與以往的標(biāo)準(zhǔn)相比較,H.264具有壓縮效率高、網(wǎng)絡(luò)適應(yīng)性好和適用于交互和非交互的應(yīng)用環(huán)境的顯著特點(diǎn),現(xiàn)在得到了廣泛應(yīng)用,并處于不斷的改進(jìn)中。

H.264/AVC采用一項(xiàng)重要新技術(shù):基于空間域的幀內(nèi)預(yù)測(cè),它充分利用了圖像的空間相關(guān)性,根據(jù)已解碼的相鄰塊的信息來(lái)預(yù)測(cè)當(dāng)前塊的信息,來(lái)提高編碼性能。H.264/AVC在RDO(RateDistortion Optimization)模式下進(jìn)行幀內(nèi)預(yù)測(cè)模式選擇,用最少的比特率獲得了最好的編碼效果,但由于H.264/AVC支持的幀內(nèi)預(yù)測(cè)模式很多,為了確定一個(gè)宏塊(Macroblock,MB)的幀內(nèi)預(yù)測(cè)模式,需要計(jì)算592種組合模式的率失真代價(jià)(RD_Cost),其運(yùn)算量占整個(gè)模式選擇的60%左右,從而使編碼器的復(fù)雜度很高。在實(shí)際編碼結(jié)果中Intra_4×4模式會(huì)占據(jù)編碼模式中的大部分,因此對(duì)RDO模式下4×4子塊的研究非常有必要,對(duì)研究快速幀內(nèi)預(yù)測(cè)算法具有重要的應(yīng)用價(jià)值。

1、H.264/AVC幀內(nèi)預(yù)測(cè)模式

H.264/AVC支持三類(lèi)幀內(nèi)預(yù)測(cè):一、Intra_4×4是針對(duì)4×4亮度塊的預(yù)測(cè),有9種預(yù)測(cè)模式,其中包括DC預(yù)測(cè)模式(即均值預(yù)測(cè)模式)和8種具有一定方向性的預(yù)測(cè)模式;二、Intra_16×16是針對(duì)16×16亮度塊的預(yù)測(cè),有4種預(yù)測(cè)模式;三、Intra_8×8是針對(duì)8×8色度塊的預(yù)測(cè),有4種預(yù)測(cè)模式,預(yù)測(cè)模式和Intra_16×16一樣,只是模式編號(hào)不一樣。其中Intra_4×4模式由于塊尺寸較小,適用于編碼細(xì)節(jié)豐富的圖像,且能獲得較小的差值,但同時(shí)因其模式數(shù)目較多成為幀內(nèi)編碼的一個(gè)瓶頸。論文指南。Intra_16×16模式則比較適用于圖像平坦區(qū)域的預(yù)測(cè)。

(a)(b)

圖1 幀內(nèi)預(yù)測(cè)模式方向

2、幀內(nèi)4×4塊預(yù)測(cè)的分析

2.1相鄰塊之間的相關(guān)性

在編碼時(shí),只需對(duì)預(yù)測(cè)值與實(shí)際值的差值進(jìn)行編碼即可,則充分利用幀內(nèi)相鄰宏塊間的信息相關(guān)性來(lái)得到預(yù)測(cè)值,即是通過(guò)當(dāng)前塊編解碼后的重建過(guò)程為緊鄰的下一宏塊提供預(yù)測(cè)值。具體到本文的4×4塊,相鄰的4×4塊的預(yù)測(cè)模式之間具有很強(qiáng)的相關(guān)性,根據(jù)當(dāng)前4×4塊的左邊塊和上邊塊的預(yù)測(cè)模式可以預(yù)測(cè)當(dāng)前塊的最可能模式(MPM,Most Probable Mode)。利用該相關(guān)性可以減少預(yù)測(cè)模式的選擇數(shù)目,從而可以減少編碼的比特?cái)?shù)。

2.2RDO下全搜索(FS)的幀內(nèi)預(yù)測(cè)模式選擇過(guò)程

具體的幀內(nèi)模式選擇過(guò)程[3]如下:

(1)分別計(jì)算9種Intra_4×4模式的率失真代價(jià)(RD_Cost) ,選擇具有最小代價(jià)的模式。代價(jià)函數(shù)RD_Cost = SSD +λmode×Rate,其中SSD(Sum of SquaredDifference)表示當(dāng)前塊與重建塊之間的差值平方和;λmode = 0.85×2(QP - 12) /3 (QP為塊的量化參數(shù));Rate表示熵編碼后的碼率。論文指南。

(2)把16個(gè)4×4塊最小的RD_Cost相加得到當(dāng)前宏塊Intra_4×4的RD_Cost。

(3)按類(lèi)似方法分別計(jì)算4種Intra_16×16模式的SAD(Sum of Absolute Difference),選擇具有最小SAD的模式。計(jì)算該模式下的RD_Cost,得到當(dāng)前宏塊Intra_16×16方式下的RD_Cost。

(4)比較前兩步獲得的RD_Cost,選擇具有最小RD_Cost的模式作為該宏塊的幀內(nèi)預(yù)測(cè)模式。

(5)Intra_8×8色度宏塊的預(yù)測(cè)方法與亮度類(lèi)似。

2.3 減小幀內(nèi)預(yù)測(cè)復(fù)雜度的常用方法

為了減小幀內(nèi)預(yù)測(cè)的復(fù)雜度,一般有兩種方法:(1)簡(jiǎn)化代價(jià)函數(shù);(2)縮小預(yù)測(cè)模式選擇的范圍。此方法可以利用當(dāng)前塊及其周?chē)袼氐哪承┨卣?預(yù)先排除某些可能性很小的預(yù)測(cè)模式,或提前終止某些可能性小的模式的代價(jià)計(jì)算,從而降低幀內(nèi)預(yù)測(cè)的復(fù)雜度。PAN Feng等利用子塊邊緣的變化方向從預(yù)選模式中選取最有可能的預(yù)測(cè)方向,算法中采用邊緣梯度直方圖的方法在幾種最有可能的預(yù)測(cè)方向中選取最佳預(yù)測(cè)方向[4];Meng Bojun等提出EIPMS算法,利用代價(jià)函數(shù)和多閾值的方法提高了4×4的子塊的編碼速度[5];文獻(xiàn)[6]利用下采樣方法,用RD模型替代率失真方法選擇預(yù)測(cè)模式;這些算法雖然大幅度降低了復(fù)雜度,但是因?qū)崿F(xiàn)起來(lái)較麻煩、編碼性能有一定的損失或是圖像質(zhì)量下降等問(wèn)題,需要進(jìn)一步的改進(jìn)。

3、Intra_4×4模式選擇的快速算法

本文提出的模式選擇快速算法是基于上述所提到的兩種方法。在SAD(Sum of Absolution Difference)代價(jià)函數(shù)模型下,可以通過(guò)圖像亞采樣等方法,以代價(jià)函數(shù)的局部計(jì)算為手段達(dá)到目的。并利用當(dāng)前塊及其相鄰像素的某些特征,預(yù)先排除某些可能性很小的預(yù)測(cè)模式,達(dá)到降低算法復(fù)雜度的目的。

3.1 SAD/SATD代價(jià)函數(shù)

通過(guò)計(jì)算公式(3-1),選擇值最小的所對(duì)應(yīng)的模式為最佳模式。

Cost=SA(T)D+4R×λ(QP) (3-1)

其中,λ(QP)是關(guān)于QP的指數(shù)函數(shù),4R是對(duì)使用某種預(yù)測(cè)模式后形成比特?cái)?shù)的估計(jì),R根據(jù)當(dāng)前模式是否為最有可能的模式取值為0或1。SAD為原始圖象象素和編碼重建圖象象素的絕對(duì)值差的和。為了更加準(zhǔn)確的計(jì)算Cost值,通常將原始圖象象素和重建圖象象素的差值進(jìn)行Hadamard變換,將其轉(zhuǎn)換到變換域。

由于SATD與率失真(RD)性能有很強(qiáng)的相關(guān)性,所以利用SATD作為判斷準(zhǔn)則,預(yù)先排除掉一些可能性小的預(yù)測(cè)模式降低復(fù)雜度。相鄰的4×4塊的預(yù)測(cè)模式之間具有很強(qiáng)的相關(guān)性,相鄰塊的關(guān)系如圖2所示,其中D是當(dāng)前的4×4亮度塊,A、B和C分別為左上、上邊和左邊的4×4亮度塊。可以根據(jù)它們的預(yù)測(cè)模式確定當(dāng)前4×4塊的最可能預(yù)測(cè)模式,故可以選擇相鄰4×4塊預(yù)測(cè)模式的SATD值作為閾值,預(yù)先排除掉SATD大于該閾值的模式,這樣可以預(yù)先排除大約50%的Intra4×4模式,避免了很多不必要的代價(jià)(Cost)計(jì)算,通過(guò)實(shí)現(xiàn)自適應(yīng)閾值降低預(yù)測(cè)的計(jì)算復(fù)雜度。

引入閾值T,計(jì)算4×4塊在最可能的預(yù)測(cè)模式下的Cost4×4值,如果Cost4×4的結(jié)果小于閾值T,那么就把它作為當(dāng)前4×4亮度塊的最佳預(yù)測(cè)模式;否則,繼續(xù)計(jì)算其他的預(yù)測(cè)模式。在這里閾值T的選取就是至關(guān)重要的地方,如果T較小,則不能有效的減少需要計(jì)算的預(yù)測(cè)模式數(shù);否則如果T較大,較容易選擇“最可能的預(yù)測(cè)模式”,作為最終的結(jié)果,不能有效的找到當(dāng)前塊的最佳預(yù)測(cè)模式。一般的,在圖像內(nèi)容比較復(fù)雜的區(qū)域,可以適當(dāng)?shù)脑龃骉的值;否則,應(yīng)該減小T的值。另外,T的選擇與QP值的大小也有關(guān)系;當(dāng)QP較大時(shí),預(yù)測(cè)誤差較大,則應(yīng)該適當(dāng)?shù)脑龃骉的值;否則,應(yīng)該減小T的值。據(jù)經(jīng)驗(yàn)分析,如果最可能的預(yù)測(cè)模式就是最佳預(yù)測(cè)模式,絕大多數(shù)情況下D塊的預(yù)測(cè)殘差與A或B或C塊的預(yù)測(cè)殘差十分接近。而SATD值反應(yīng)的是預(yù)測(cè)模式對(duì)當(dāng)前紋理結(jié)構(gòu)的近似效果,所以取A、B和C塊Cost4×4值較小的一個(gè)作為D塊的Cost4×4預(yù)測(cè)期望值。再將λ(QP)的作用考慮內(nèi),我們將閾值T設(shè)定為:

T=min(CostA,CostB,CostC)+kλ(QP)(3-2)

第11篇

關(guān)鍵詞:數(shù)字電影 電影技術(shù) 系統(tǒng)設(shè)計(jì)

中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2013)03(a)0021-01

電影是一門(mén)藝術(shù)化的技術(shù),也是一門(mén)技術(shù)化的藝術(shù),能夠采用特有的技術(shù)處理手段,藝術(shù)的表達(dá)導(dǎo)演的一些想法,因此,電影的表達(dá)也離不開(kāi)技術(shù)的支撐。隨著數(shù)字技術(shù)的發(fā)展,數(shù)字電影技術(shù)也得到了迅猛發(fā)展,并且已經(jīng)基本取代了傳統(tǒng)的膠片電影技術(shù)市場(chǎng)。

本論文主要結(jié)合數(shù)字電影技術(shù),詳細(xì)分析現(xiàn)有的數(shù)字電影技術(shù),并在此基礎(chǔ)上構(gòu)建基于數(shù)字電影技術(shù)的數(shù)字電影系統(tǒng),以期能夠?yàn)閿?shù)字電影技術(shù)的發(fā)展提供可供借鑒的技術(shù)應(yīng)用模式,并以此和廣大同行分享。

1 數(shù)字電影技術(shù)分析

1.1 數(shù)字電影技術(shù)概述

數(shù)字電影,顧名思義,是和計(jì)算機(jī)相結(jié)合起來(lái)的一種電影技術(shù),目前,數(shù)字電影技術(shù),主要是指以數(shù)字設(shè)備實(shí)現(xiàn)的攝像、存儲(chǔ),并通過(guò)數(shù)字設(shè)備實(shí)現(xiàn)電影內(nèi)容的傳輸傳送,最后經(jīng)過(guò)專(zhuān)業(yè)設(shè)備將數(shù)字信號(hào)還原成影像信號(hào)并進(jìn)行播放。

傳統(tǒng)的電影攝制是將影像信號(hào)攝錄在膠片上,這種電影技術(shù)具有分辨率大、信息量大的優(yōu)勢(shì),但是由于膠片不易保存和傳輸,因此對(duì)于電影的傳輸普及帶來(lái)不便;而數(shù)字電影的出現(xiàn)很好的解決了這一問(wèn)題,目前數(shù)字電影基本上都是采用高清攝像機(jī)直接獲取高清質(zhì)量的數(shù)字影像,也可以采用膠片拍攝電影,在后期將膠片掃描為數(shù)字信號(hào)。

數(shù)字電影技術(shù)的發(fā)展,大大推動(dòng)了電影技術(shù)的普及和大眾化應(yīng)用,這得益于計(jì)算機(jī)技術(shù)的飛速發(fā)展,數(shù)字電影技術(shù)最主要還是指的電影攝制的數(shù)字化,以及所需配套的數(shù)字化制作、數(shù)字化放映等設(shè)備的應(yīng)用。

1.2 數(shù)字電影技術(shù)發(fā)展應(yīng)用現(xiàn)狀

早在上個(gè)世紀(jì)90年代,好萊塢一大批震驚世界的電影,無(wú)不采用了數(shù)字電影合成技術(shù),例如《星球大戰(zhàn)》、《泰坦尼克號(hào)》、《黑客帝國(guó)》等等,讓觀眾感受到了傳統(tǒng)膠片電影所無(wú)法實(shí)現(xiàn)的視覺(jué)感官感受。目前全球數(shù)字電影的制作已經(jīng)超過(guò)了幾千部,主要以歐美國(guó)家為主。我國(guó)的數(shù)字電影技術(shù)發(fā)展也很快,已經(jīng)建立的全亞洲最大的數(shù)字電影技術(shù)中心,以及數(shù)字電影拍攝、發(fā)行、放映等一系列技術(shù)應(yīng)用也有很大的提升,這些都表明我國(guó)數(shù)字化電影技術(shù)的快速發(fā)展和進(jìn)步,但主要應(yīng)用設(shè)備還是大量的依賴(lài)進(jìn)口或合資生產(chǎn)。

另一方面,數(shù)字電影的發(fā)展,必然也推動(dòng)了數(shù)字放映設(shè)備的建設(shè)。目前,全球數(shù)字電影銀幕數(shù)達(dá)到7萬(wàn)多塊,我國(guó)城市影院建設(shè)保持高速發(fā)展的態(tài)勢(shì),截止到2012年底,全國(guó)銀幕數(shù)從2002年的1845塊增加到了現(xiàn)有的13118塊,其中2K數(shù)字銀幕超過(guò)1.2萬(wàn)塊,主流院線影院基本全面實(shí)現(xiàn)數(shù)字化放映。

近兩年來(lái),數(shù)字中間片(DI)技術(shù)成為世界電影行業(yè)最引人關(guān)注的話題之一。所謂數(shù)字中間片技術(shù),一般是指整個(gè)后期制作都在數(shù)字平臺(tái)上進(jìn)行。數(shù)字中間片技術(shù)的目的主要有兩個(gè):一是為了開(kāi)發(fā)傳統(tǒng)工藝難以實(shí)現(xiàn)甚至無(wú)法實(shí)現(xiàn)的功能,從而取得更靈活、更豐富的創(chuàng)作手段;二是為了提高影片質(zhì)量,降低制作成本。數(shù)字中間片工藝主要有膠片掃描(膠轉(zhuǎn)數(shù))、套底、調(diào)色、特效和修飾、制作字幕、數(shù)字母版制作和膠片記錄(數(shù)轉(zhuǎn)膠)等。出于技術(shù)和成本的原因,目前的數(shù)字中間片技術(shù)大多還是基于2K分辨率的,屬于一種折中的解決方案,僅能滿足DCI中的低檔要求。目前,數(shù)字中間片的實(shí)施與研究還主要集中在美、歐的一些發(fā)達(dá)國(guó)家,并已具備了相當(dāng)?shù)囊?guī)模。

2 數(shù)字電影系統(tǒng)設(shè)計(jì)探討

2.1 數(shù)字電影系統(tǒng)結(jié)構(gòu)設(shè)計(jì)

相較于傳統(tǒng)的膠片電影技術(shù),數(shù)字電影系統(tǒng)由于采用了數(shù)字技術(shù),因而能夠很方便的實(shí)現(xiàn)數(shù)字化的攝制、存儲(chǔ)和傳輸,但是其前提是必須要能夠很好的解決圖像的實(shí)時(shí)傳輸存儲(chǔ)問(wèn)題。為此,數(shù)字電影系統(tǒng)的基本結(jié)構(gòu)可以設(shè)計(jì)由如下幾個(gè)部分構(gòu)成。

(1)數(shù)字式圖像傳感器。

數(shù)字電影的攝制,首要解決的就是數(shù)字化拍攝的問(wèn)題,為此可以采用數(shù)字式圖像傳感器,通過(guò)配合光學(xué)取景器,將鏡頭前的內(nèi)容直接攝制并轉(zhuǎn)化為數(shù)字信號(hào),傳輸給圖像處理單元。

(2)高速圖像處理單元。

高速圖像處理單元是實(shí)現(xiàn)數(shù)字電影的關(guān)鍵結(jié)構(gòu)單元,在整個(gè)系統(tǒng)中處于類(lèi)似CPU的角色,主要負(fù)責(zé)對(duì)數(shù)字圖像的編解碼、灰度處理、二值化處理,以及對(duì)數(shù)字信號(hào)的還原等處理,從而確保數(shù)字圖像的實(shí)時(shí)攝錄和編解碼。

(3)數(shù)字存儲(chǔ)器。

目前常用的數(shù)字存儲(chǔ)器通常都是硬盤(pán),既能夠大幅降低數(shù)字電影系統(tǒng)的成本,同時(shí)又提高了數(shù)字電影存儲(chǔ)、傳輸?shù)募嫒菪裕欣跀?shù)字電影的普及推廣和傳輸應(yīng)用。

(4)交互數(shù)字單元。

交互數(shù)字單元主要是負(fù)責(zé)實(shí)現(xiàn)數(shù)字電影的互動(dòng)及特效等場(chǎng)景的二次編輯加工,其內(nèi)含基于DSP單片機(jī)的編輯器能夠很方便的實(shí)現(xiàn)對(duì)音頻信號(hào)的加工,以及對(duì)色彩、亮度等視頻信號(hào)的編輯和調(diào)整,極大的豐富了數(shù)字電影的加工手段和方式。

2.2 數(shù)字電影配套系統(tǒng)分析

數(shù)字電影要實(shí)現(xiàn)大規(guī)模的推廣和應(yīng)用,不僅僅需要數(shù)字電影攝錄設(shè)備,不是只依靠高清數(shù)字?jǐn)z像機(jī)就能夠?qū)崿F(xiàn)數(shù)字電影技術(shù)的普及應(yīng)用的,對(duì)于數(shù)字電影相配套的系統(tǒng),也必須要大力發(fā)展,才能夠最終推動(dòng)整個(gè)數(shù)字電影系統(tǒng)的不斷發(fā)展和應(yīng)用。

數(shù)字電影系統(tǒng)處理需要數(shù)字化攝錄設(shè)備,還必須配套數(shù)字化編輯設(shè)備,數(shù)字化放映設(shè)備。數(shù)字化編輯設(shè)備目前主要集中的數(shù)字化平臺(tái)的應(yīng)用,包括對(duì)膠片影像的掃描,數(shù)字影像的再加工等內(nèi)容;數(shù)字化放映設(shè)備則主要包括數(shù)字電影的立體式放映及多感交互式互動(dòng)系統(tǒng),目前國(guó)外已經(jīng)發(fā)展到4D立體式放映系統(tǒng),能夠很好的實(shí)現(xiàn)數(shù)字電影的多感交互放映。

3 結(jié)語(yǔ)

數(shù)字電影技術(shù)是電影技術(shù)發(fā)展的里程碑,它實(shí)現(xiàn)了過(guò)去傳統(tǒng)無(wú)法實(shí)現(xiàn)的一些創(chuàng)作,更為重要的是,數(shù)字電影技術(shù)的出現(xiàn),使得個(gè)人創(chuàng)作電影成為了可能,只要擁有一臺(tái)數(shù)字電影設(shè)備,以及具備編輯修改的多媒體系統(tǒng),就能夠?qū)崿F(xiàn)數(shù)字電影的創(chuàng)作,這對(duì)于電影藝術(shù)的大眾化普及是具有深遠(yuǎn)影響的。目前數(shù)字影院發(fā)展態(tài)勢(shì)蓬勃,使得數(shù)字電影技術(shù)有了很大的應(yīng)用空間。本論文簡(jiǎn)要探討了數(shù)字電影技術(shù)及其系統(tǒng)的設(shè)計(jì),對(duì)于數(shù)字電影技術(shù)的普及發(fā)展和提高,無(wú)論是在理論研究還是在實(shí)踐應(yīng)用方面,都具有較好的指導(dǎo)借鑒意義。

參考文獻(xiàn)

[1] 陳犀禾.虛擬現(xiàn)實(shí)主義和后電影理論—— 數(shù)字時(shí)代的電影制作和電影觀念[J].當(dāng)代電影,2001(2):23-24.

[2] 劉兆君.數(shù)字技術(shù)與電影[J].劇作家,2006(5):78-79.

第12篇

2001中南地區(qū)廣播電視技術(shù)討論會(huì)技術(shù)論文二等獎(jiǎng)     多媒體信息是未來(lái)人類(lèi)獲取信息最主要的載體,因此它已成為目前世界上技術(shù)開(kāi)發(fā)和研究的熱點(diǎn)。視頻信息作為多媒體信息中最被關(guān)注、數(shù)據(jù)量最大的一員,現(xiàn)在也正面臨著一場(chǎng)其意義不亞于從模擬到數(shù)字的技術(shù)進(jìn)步革新:從傳統(tǒng)的矩形DCT變換編碼到根據(jù)視頻內(nèi)容、劃分對(duì)象、分別變換編碼的新的編碼方法。

一、傳統(tǒng)的編碼方式

    傳統(tǒng)的視頻編碼是以視頻信號(hào)的數(shù)字量為編碼對(duì)象的,與視頻信息的內(nèi)容無(wú)關(guān),無(wú)論是M-JPEG、MPEG-1還是MPEG-2,都是以DCT矩形變換塊為變換編碼單元,對(duì)DCT塊內(nèi)圖像的亮度和色度進(jìn)行特征取樣,提取像素;采用幀間編碼、運(yùn)動(dòng)估測(cè)技術(shù),在參考幀幀內(nèi)DCT編碼的基礎(chǔ)上,對(duì)DCT塊內(nèi)圖像的像素特征進(jìn)行差值預(yù)測(cè)編碼。基于矩形DCT編碼的視頻編碼在設(shè)計(jì)思想上只考慮到對(duì)信號(hào)數(shù)據(jù)進(jìn)行處理的需要(比如小的比特率以利于傳輸、高的比特率以保證質(zhì)量),但未考慮視頻信息--圖像內(nèi)容本身的含義和重要性,以及視頻信息應(yīng)用者的主觀需求(比如部分內(nèi)容的提取功能)。另外,這種基?quot;塊"的壓縮算法在低碼率時(shí)容易產(chǎn)生"方塊效應(yīng)"和"抽幀",大大縮小了視頻信息的應(yīng)用領(lǐng)域。

    小波變換是一種新的變換編碼方法,它與DCT變換相比,考慮到了視頻信號(hào)對(duì)不同應(yīng)用環(huán)境的自適應(yīng)性(不同的清晰度與比特率),可以將基礎(chǔ)圖像層與增強(qiáng)圖像層分離編碼傳輸,用戶可根據(jù)實(shí)際情況選擇是否打開(kāi)增強(qiáng)圖像層。但無(wú)論用戶選擇是或否,被傳送的視頻信息卻都是一樣的。

二、 基于內(nèi)容對(duì)象的編碼

    1、 VO與VOP概念的引入

    傳統(tǒng)的視頻編碼方式是將整個(gè)視頻信號(hào)作為一個(gè)內(nèi)容單體來(lái)處理,其本身不可再分割,而這與人類(lèi)對(duì)視覺(jué)信息的判別法則,也就是大腦對(duì)視神經(jīng)導(dǎo)入的視覺(jué)信號(hào)的處理方法是完全不同的。這就決定了我們不可能將一個(gè)視頻信息完整的從視頻信號(hào)中提取出來(lái),比如:將加有臺(tái)標(biāo)和字幕的視頻恢復(fù)成無(wú)臺(tái)標(biāo)、字幕的視頻。解決問(wèn)題的惟一途徑就是在編碼時(shí)就將不同的視頻信息載體--視頻對(duì)象VO(Video Objects)區(qū)分開(kāi),獨(dú)立編碼傳送,將圖像序列中的每一幀,看成是由不同的VO加上活動(dòng)的背景所組成。VO可以是人或物,也可以是計(jì)算機(jī)生成的2D或3D圖形。VO具有音頻屬性,其屬性賦值可能?quot;有"或者是"無(wú)"。但音頻的具體內(nèi)容數(shù)據(jù)是獨(dú)立于視頻編碼、傳輸?shù)摹O概念的引入,更加符合人腦對(duì)視覺(jué)信息的處理方式,并使視頻信號(hào)的處理方式從數(shù)字化進(jìn)展到智能化。提高了視頻信號(hào)的交互性和靈活性,使得更廣泛的視頻應(yīng)用和更多的內(nèi)容交互功能成為可能。

    現(xiàn)代圖像編碼理論指出,人眼捕獲圖像信息的本質(zhì)是"輪廓-紋理",即人眼感興趣的是VO的一些表面特性,如形狀、運(yùn)動(dòng)、紋理等。VO的表面往往是不規(guī)則的、千變?nèi)f化的,但可將其視為一定視角下,n個(gè)形狀規(guī)則的、具有一定紋理的剖面的組合的連續(xù)運(yùn)動(dòng),這些剖面的組合稱(chēng)為視頻對(duì)象面VOP(Video Object Profile)。VOP描述了VO在一定視角條件下的表面特性。VOP的編碼主要由兩部分組成:一個(gè)是形狀編碼,另一個(gè)是紋理和運(yùn)動(dòng)信息編碼。VOP紋理編碼和運(yùn)動(dòng)的預(yù)測(cè)、補(bǔ)償在原理上同MPEG-2基本一致,而形狀編碼技術(shù)則是首次應(yīng)用在圖像編碼領(lǐng)域。

    2、新的編碼技術(shù)

    合成VO的獨(dú)立編碼 在以前,2D或3D動(dòng)畫(huà)被看作是視頻的一部分,并一概以視頻的方法來(lái)處理。實(shí)際上,根據(jù)合成VO的合成機(jī)理和特性,大部分合成VO都可以用通用的有關(guān)圖形文本的多種表達(dá)方式來(lái)描述。非復(fù)雜性合成VO將被視為一種獨(dú)立于視頻的數(shù)據(jù)類(lèi)型來(lái)編碼,并定義了其描述框架、通用的數(shù)據(jù)流結(jié)構(gòu)和靈活的接口。而復(fù)雜性合成VO和自然VO的編碼方法,將采用以下的編碼方法。

    基于矩形窗口的VOP分割 考慮到與現(xiàn)有標(biāo)準(zhǔn)的兼容,目前已得到應(yīng)用的VO編碼技術(shù),比如MPEG4,仍采用了基于矩形窗口的內(nèi)容分割法。編碼時(shí),首先利用像素特征統(tǒng)計(jì),將每一個(gè)VOP都限定在一個(gè)矩形窗口內(nèi),稱(chēng)之為VOP窗口(VOP Window),取窗的原則為:長(zhǎng)、寬均為16像素的整數(shù)倍(便于對(duì)現(xiàn)有標(biāo)準(zhǔn)的兼容和將來(lái)的擴(kuò)展),同時(shí)保證VOP窗口中非VOP的宏塊數(shù)目最少。目前標(biāo)準(zhǔn)中的視頻幀可認(rèn)為是一個(gè)無(wú)VOP的特例,在編碼過(guò)程中將形狀編碼模塊屏蔽掉就可以了。在一個(gè)VOP窗口內(nèi),VOP剖面的形狀也是采用8×8像素的矩形形狀。針對(duì)不同的VOP,可以根據(jù)不同的應(yīng)用場(chǎng)合和運(yùn)動(dòng)、變化的特點(diǎn),采用固定的或可變的VOP幀頻(即VOP刷新頻率)。

    矩形窗口分割法并不能體現(xiàn)VOP的具體形狀信息。為了確認(rèn)采用矩形窗口分割法的VOP的形狀信息,就引入了形狀編碼技術(shù)。形狀編碼其實(shí)并不是什么新技術(shù),它在計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)領(lǐng)域早有應(yīng)用。而目前的視頻編碼標(biāo)準(zhǔn)中的位圖技術(shù)其實(shí)就是形狀編碼的簡(jiǎn)單特例。位圖采用矩陣的形式來(lái)表示二值(0或1)的形狀信息,具有較高的編碼效率和較低的運(yùn)算復(fù)雜度。VOP的形狀信息有兩類(lèi):邊緣信息和灰度信息。邊緣信息用0、1來(lái)表示VOP的形狀,0表示非VOP區(qū)域,1表示VOP區(qū)域。對(duì)于包含一定透明度的VOP區(qū)域,可以用灰度信息(取值0~255之間)來(lái)表示透明程度,其中0表示完全透明,255表示完全不透明。對(duì)于模糊邊緣部分,可將其視為灰度信息從周?chē)阎猇OP區(qū)域的灰度值向0值的過(guò)渡區(qū)域,采用內(nèi)插法確定其形狀信息。

    基于小波變換的VOP分割 基于矩形窗口的VOP分割依舊存在"塊效應(yīng)"問(wèn)題,而基于小波變換的VOP分割則可以很好的解決這個(gè)問(wèn)題,而且由于這種分割方法的本身就包含了VOP的形狀信息,所以無(wú)需另對(duì)形狀信息進(jìn)行判別與編碼。基于小波變換的VOP分割方法是目前最為活躍的視頻編碼課題研究領(lǐng)域,各種算法不斷的被發(fā)表,但基本上可以劃分為兩類(lèi)方法:

    1、利用圖像灰度特征分割:不同的圖像具有不同的灰度分布,利用小波變換,將圖像變換到小波域,產(chǎn)生各層、各子帶圖像。小波變換后,大部分的能量是集中在低頻子帶圖像上,即大面積的平均灰度區(qū)域信息主要在低頻子帶圖像中體現(xiàn)。根據(jù)信息論的原理,確定多個(gè)灰度閾值,可以將具有不同灰度的VOP從低頻子帶圖像中分離。同時(shí)再利用高頻子帶圖像以及模糊數(shù)學(xué)模型,確定每一個(gè)VOP的邊緣信息。利用圖像灰度特征分割的小波變換,是沿掃描方向的單方向變換。

    2、利用圖像紋理特征分割:紋理是一種局部特征反復(fù)出現(xiàn)的結(jié)果,它體現(xiàn)了圖像的局部頻域信息。對(duì)于一幅數(shù)字圖像,進(jìn)行多方向的小波變換是可行的,比如對(duì)一幀畫(huà)面進(jìn)行垂直方向或?qū)蔷€方向的小波變換。經(jīng)過(guò)多種小波變換后可得到不同方向的各子帶圖像,它們各自蘊(yùn)涵著不同紋理的局部頻譜信息和紋理走向等信息。對(duì)具有相同頻譜特征的圖像局部進(jìn)行聚類(lèi)分析,并根據(jù)紋理頻譜和紋理走向確定該聚類(lèi)的紋理邊緣。根據(jù)信息論原理和運(yùn)動(dòng)估測(cè),將運(yùn)動(dòng)矢量具有相關(guān)性的聚類(lèi)二次歸類(lèi)于不同的對(duì)象(即VOP),并影射成不同灰度顯示。多級(jí)小波變換的結(jié)果最多可線性的影射成0~255灰度級(jí)顯示。進(jìn)行小波變換的方向越多,各方向的夾角越小,圖像分割也就越準(zhǔn)確,但計(jì)算量也隨之迅速膨脹。根據(jù)局域紋理中心頻率的變化自適應(yīng)地選擇小波變換的級(jí)數(shù)(幾個(gè)方向的變換)和方向,有助于在圖像分割的準(zhǔn)確性和計(jì)算量之間達(dá)到平衡。正如本文前面所述,人眼捕獲圖像信息的本質(zhì)?quot;輪廓-紋理",故基于多方向小波變換的提取圖像特征、分割紋理圖像的方法符合人眼視覺(jué)生理的特點(diǎn),是紋理圖像分析的重要發(fā)展方向。

    無(wú)論是哪一種方法,當(dāng)?shù)玫讲煌琕OP的不同灰度表示之后,通過(guò)類(lèi)似于鍵技術(shù)的多通道處理,即可得到多個(gè)原始的彩色VOP。目前實(shí)驗(yàn)表明,基于小波變換的圖像分割在邊界上仍有些模糊,但總體效果還是相當(dāng)滿意的,達(dá)到了分割紋理圖像的目的。

    VOP運(yùn)動(dòng)信息編碼和運(yùn)動(dòng)補(bǔ)償 人眼在觀看圖像時(shí),會(huì)自動(dòng)跟蹤人所感興趣的VOP。即人看的不是時(shí)間軸上的信息,而是VOP的運(yùn)動(dòng)軌跡---光流軸上的信息。光流軸是VOP上的一點(diǎn)在活動(dòng)圖像上的運(yùn)動(dòng)軌跡,它在不同的幀中位于不同的空間位置,其意義在于:VOP自身的各種變化都將映射于光流軸上的一點(diǎn)。光流軸信息的獨(dú)立編碼將帶來(lái)諸多好處:(1)在編碼時(shí),對(duì)于剛性VOP,由于它在運(yùn)動(dòng)中不會(huì)發(fā)生形狀和紋理上的變化,故該VOP只需要完成一次采樣、編碼,而后就只需發(fā)出幾個(gè)運(yùn)動(dòng)矢量指明它的光流軸即可;對(duì)于非剛性VOP,只需在發(fā)生變化時(shí)才需要重新采樣、編碼,這就使得不同的VOP采用不同的VOP幀頻成為可能,將編碼的數(shù)據(jù)率最低限度的降低。(2)VOP在運(yùn)動(dòng)中的各種變化都將"留跡"于光流軸,當(dāng)在進(jìn)行運(yùn)動(dòng)補(bǔ)償時(shí),比如不同制式之間的轉(zhuǎn)換或者慢動(dòng)作的制作,就可以根據(jù)光流軸映射信息,采用內(nèi)插法得出時(shí)間軸上某一確定點(diǎn)的VOP狀態(tài),達(dá)到無(wú)損轉(zhuǎn)換的目的。(3)在時(shí)間軸上,簡(jiǎn)單的將一個(gè)圖像序列的兩路信號(hào)疊加,隨即噪波和圖像的活動(dòng)部分都得不到增強(qiáng);若在光流軸上進(jìn)行信號(hào)疊加,活動(dòng)圖像的降噪問(wèn)題就得到了簡(jiǎn)單解決。

    VOP的運(yùn)動(dòng)估測(cè)是指:分析兩個(gè)或更多幀上的VOP,確定光流軸,以判斷下一幀中VOP可能出現(xiàn)的位置。VOP的運(yùn)動(dòng)補(bǔ)償是指:根據(jù)VOP光流軸的取向和光流軸上VOP自身變化得映射信息,矯正VOP在時(shí)間軸上的運(yùn)動(dòng)矢量。運(yùn)動(dòng)預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償技術(shù)可以去除圖像信息中的時(shí)間冗余成分,VOP的運(yùn)動(dòng)信息編碼可視為從像素向任意形狀的VOP的延伸。

     紋理編碼 在已得到實(shí)際應(yīng)用的MPEG-4中,VOP的紋理編碼基本上仍采用基于8×8像素塊的DCT方法,有3種模式:幀內(nèi)編碼模式(I-VOP)、幀間預(yù)測(cè)編碼模式(P-VOP)和幀間雙向預(yù)測(cè)編碼模式(B-VOP)。編碼時(shí),對(duì)于完全位于VOP內(nèi)的像素塊,則采用經(jīng)典的DCT方法;對(duì)于完全位于VOP之外的像素塊則不進(jìn)行編碼;對(duì)于部分在VOP內(nèi),部分在VOP外的像素塊則首先采用圖像填充技術(shù)來(lái)獲取VOP之外的像素值,之后再進(jìn)行DCT編碼。

    依據(jù)視覺(jué)特性的紋理編碼目前仍處于理論研究階段,其目標(biāo)是:建立常見(jiàn)紋理局部特征符號(hào)集,定義描述紋理分布、走向的多媒體語(yǔ)言。以人臉為例:人臉定義參數(shù)(FDP)描述了特定人臉紋理形狀模型與通用人臉模型之間的差別,通過(guò)接收到的各種FDP,能把通用的人臉模型變換成由其形狀和紋理確定的特定人臉。人臉動(dòng)畫(huà)參數(shù)(FAP)描述了特定的人臉表情與中性表情的變化關(guān)系,通過(guò)接收到的各種FAP能生成人臉的各種表情以及與聲音同步的嘴唇活動(dòng)等。這樣的合成編碼不僅可極大地提高編碼效率(可獲得1kbps的超低碼率),而且為制作新的人臉等對(duì)象提供了方便。

    分級(jí)編碼 多媒體的應(yīng)用場(chǎng)合具有不同的信道帶寬、處理能力、顯示能力及用戶需求,要求在解碼端支持時(shí)域、空間及質(zhì)量的上伸縮性,即分級(jí)編碼。分級(jí)編碼可以通過(guò)視頻對(duì)象層VOL(Video Object Layer)的數(shù)據(jù)結(jié)構(gòu)來(lái)實(shí)現(xiàn)。每一種分級(jí)編碼都至少有2層VOL,低層稱(chēng)為基本層,高層稱(chēng)為增強(qiáng)層。空間伸縮性可通過(guò)增強(qiáng)層強(qiáng)化基本層的空間分辨率來(lái)實(shí)現(xiàn),因此在對(duì)增強(qiáng)層中的VOP進(jìn)行解碼之前,必須先對(duì)基本層中相應(yīng)的VOP進(jìn)行解碼。同樣對(duì)于時(shí)域伸縮性,可通過(guò)增強(qiáng)層來(lái)增加視頻序列中某個(gè)VO(特別是運(yùn)動(dòng)的VO)的幀率,使其與其余區(qū)域相比更為平滑。

三、 新的技術(shù)標(biāo)準(zhǔn)--MPEG 4

    首次采用VO編碼技術(shù)的視頻編碼標(biāo)準(zhǔn)是由MPEG 4。MPEG 4于1999年年初正式成為國(guó)際標(biāo)準(zhǔn)(標(biāo)準(zhǔn)號(hào)為ISO/IEC 14496),在1999年12月的后繼版本中增加了可變形、半透明視頻對(duì)象及其工具的先進(jìn)功能,它進(jìn)一步提高了編碼效率,并與第一版反向兼容。

    1、MPEG 4標(biāo)準(zhǔn)的構(gòu)成

    1) DMIF(The Dellivery Multimedia Integration Framework):多媒體傳送整體框架協(xié)議。MPEG-4標(biāo)準(zhǔn)將眾多的多媒體應(yīng)用集成于一個(gè)完整的框架內(nèi),旨在為多媒體通信及應(yīng)用環(huán)境提供靈活的算法及工具,用于實(shí)現(xiàn)音視頻數(shù)據(jù)的有效編碼及更為靈活的存取。它解決了多領(lǐng)域中多媒體應(yīng)用個(gè)性化交互操作的問(wèn)題。

    2) 解碼器:定義了MPEG-4系統(tǒng)特殊的解碼模式(SDM),要求特殊的緩沖區(qū)和實(shí)時(shí)模式。

    3) 音頻編碼:支持自然聲音和合成聲音,支持音頻的對(duì)象特征。

    4) 視頻編碼:支持自然和合成的視覺(jué)對(duì)象,合成的視覺(jué)對(duì)象包括2D、3D動(dòng)畫(huà)和人面部表情動(dòng)畫(huà)等。

    5) 場(chǎng)景描述BIFS(Binary Format for Scene description):關(guān)于一組VO的時(shí)空結(jié)構(gòu)關(guān)系的參數(shù)信息,主要描述了各VO在一具體背景下的相互關(guān)系與同步等問(wèn)題,以及VO及其背景的知識(shí)產(chǎn)權(quán)保護(hù)等問(wèn)題。BIFS與VO對(duì)象特征信息的編碼、傳輸是相對(duì)獨(dú)立的。場(chǎng)景描述信息編碼及其的獨(dú)立傳輸是實(shí)現(xiàn)用戶端編輯操作的關(guān)鍵:在解碼之后和場(chǎng)景合成之前,用戶可以通過(guò)對(duì)BIFS參數(shù)的重新設(shè)置來(lái)對(duì)VO 進(jìn)行多種編輯操作,如增減、縮放、平移,甚至一些特技效果。

    下面的表格反映了MPEG體系的部分技術(shù)指標(biāo)。MPEG-4是高比率有損壓縮(比如將一個(gè)9 GB的DVD視頻壓縮拷貝到只有700MB空間的CD-ROM上),其圖像質(zhì)量始終無(wú)法與MPEG-2相比。當(dāng)MPEG-4與MPEG-2的碼率輸出相同時(shí),其質(zhì)量仍稍遜于MPEG-2。同時(shí),MPEG 4對(duì)硬件的要求也較高。事實(shí)上,我們注意到MPEG-4在保證令人滿意的圖像質(zhì)量的情況下,更注重較低的數(shù)據(jù)率和靈活的交互功能。

    2、MPEG 4編碼器

    MPEG 4編碼簡(jiǎn)化原理圖如圖一。

    對(duì)于輸入視頻序列,通過(guò)分析確認(rèn)n個(gè)視覺(jué)目的對(duì)象為編碼對(duì)象,將其認(rèn)定為n個(gè)VO(n=1,2,3…),對(duì)每一個(gè)VO編碼后形成這個(gè)VO的VOP數(shù)據(jù)流。VOP的編碼包括對(duì)運(yùn)動(dòng)(采用運(yùn)動(dòng)預(yù)測(cè)方法)及形狀、紋理(采用變換編碼方法)的編碼。由于VOP具有任意形狀,因此要求編碼方案可以處理形狀(Shape)和透明(Transparency)信息,這就是與只能處理矩形幀序列的現(xiàn)有視頻編碼標(biāo)準(zhǔn)的根本區(qū)別。在MPEG-4中,矩形幀被認(rèn)為是VOP的一個(gè)特例,這時(shí)編碼系統(tǒng)不用處理形狀信息,退化為類(lèi)似于MPEG-1、MPEG-2的傳統(tǒng)編碼系統(tǒng),同時(shí)也實(shí)現(xiàn)了與現(xiàn)有標(biāo)準(zhǔn)的兼容。除去VO的其余圖像部分--背景,仍采用傳統(tǒng)的矩形DCT變換編碼;VO場(chǎng)景描述信息(VO自身信息,如VO對(duì)象的知識(shí)產(chǎn)權(quán)、和VO間的位置、邏輯關(guān)系等)也要進(jìn)行編碼,最后和VOP流、背景一起送入MPEG 4幀復(fù)合器,生成MPEG 4流輸出。

    需指出的是:在VO分割后,每一個(gè)VO都需要一個(gè)VOP編碼通道,在圖一中只畫(huà)出了一個(gè)。多個(gè)VOP幀發(fā)生器的輸出在MPEG 4幀復(fù)合器中可實(shí)現(xiàn)靈活地多路復(fù)用編碼或同步并行傳輸編碼,以適應(yīng)各種傳輸環(huán)境和要求。MPEG 4解碼是以上編碼過(guò)程的逆過(guò)程。可以看出,獨(dú)立于背景的VO編碼可以實(shí)現(xiàn)接收端的用戶對(duì)VO對(duì)象進(jìn)行選擇性地操作。

    3、MPEG 4視頻編碼功能與特點(diǎn)

    MPEG 4標(biāo)準(zhǔn)的制定有兩個(gè)目標(biāo):低比特率的多媒體通信和多工業(yè)的多媒體通信的綜合。即MPEG-4遵循靈活的編碼工具框架體系,設(shè)計(jì)了一個(gè)開(kāi)放的編碼系統(tǒng),對(duì)于不同的應(yīng)用采用不同的編碼算法,以達(dá)到低比特率通信的目標(biāo)。MPEG-4解碼器是可編程的,相應(yīng)的解碼信息可與內(nèi)容本身一起傳輸下載。與現(xiàn)有的MPEG-1和MPEG-2視頻壓縮相比,MPEG-4視頻有一些重要的改進(jìn):

    1)基于內(nèi)容的交互功能: MPEG-4提供了全新的交互方式,根據(jù)制作者的具體自由度設(shè)計(jì),在有限的時(shí)間內(nèi)可實(shí)現(xiàn)對(duì)多媒體VO的時(shí)域隨機(jī)存取(從不同的源獲取內(nèi)容或向不同的源發(fā)送內(nèi)容)、快速搜索、改變場(chǎng)景的視角、改變場(chǎng)景中物體的位置、大小和形狀,或?qū)υ搶?duì)象進(jìn)行置換甚至清除。

    2)支持自然及合成信息的混合編碼(NHC:Synthetic and Natural Hybrid Coding):MPEG-4支持合成信息的編碼,可對(duì)合成的VO及其活動(dòng)信息進(jìn)行參數(shù)化描述。對(duì)于頻繁出現(xiàn)的視覺(jué)對(duì)象則分別定義了它們的紋理形狀和動(dòng)畫(huà)參數(shù)。

    3)高效編碼:包括視頻VO數(shù)據(jù)的高效編碼和多個(gè)并發(fā)數(shù)據(jù)的有效同步編碼。

    4)基于內(nèi)容的伸縮性:是指分級(jí)編碼后,紋理、圖像和視頻基于內(nèi)容的伸縮性,視頻序列中時(shí)域、空間及質(zhì)量的伸縮性,表現(xiàn)為時(shí)域?qū)崟r(shí)或非實(shí)時(shí)、數(shù)據(jù)率大小及重建的圖像質(zhì)量上。

    5)可變的最終輸出:不同的碼率意味著支持不同的功能集。功能集的底層是VLBV核心(VLBV:Very Low Bit Rate Video),它為最低達(dá)5-64kbits/s視頻操作與應(yīng)用提供算法與工具,支持較低的空間分辨率(低于352×288像素)和較低的幀頻(低于15Hz)。VLBV核心功能包括:矩形圖像序列的有效編碼、多媒體數(shù)據(jù)庫(kù)的搜索和隨機(jī)存取。MPEG-4的HBV(HBV: High Bit Rate Video,范圍在64kbits/s-4Mbits/s之間)同樣支持上述功能,但它同時(shí)還支持較高的空間與時(shí)間分辨率。其輸入可以是ITU-R 601的標(biāo)準(zhǔn)信號(hào),因此其典型應(yīng)用為數(shù)字電視廣播與交互式檢索。

    與MPEG-1和MPEG-2相比,MPEG-4的特點(diǎn)是其更適于交互式AV服務(wù)以及遠(yuǎn)程監(jiān)控。MPEG-4是第一個(gè)允許用戶端操作的的視頻編碼標(biāo)準(zhǔn)。MPEG 4的特點(diǎn)非常適合于互聯(lián)網(wǎng)上的交互式影視服務(wù):可適應(yīng)各種應(yīng)用終端的物理網(wǎng)絡(luò)環(huán)境,可實(shí)現(xiàn)對(duì)視音頻內(nèi)容的交互操作,具有下載解碼能力(在一定的硬件基礎(chǔ)上,可下載解碼工具,對(duì)不同編碼方式的內(nèi)容進(jìn)行解碼處理)。MPEG-4的設(shè)計(jì)目標(biāo)還有更廣的適應(yīng)性和可擴(kuò)展性:因特網(wǎng)多媒體應(yīng)用、交互式視頻游戲、實(shí)時(shí)可視通信、交互式存儲(chǔ)媒體應(yīng)用、廣播電視、演播室技術(shù)及電視后期制作、多媒體內(nèi)容存儲(chǔ)和檢索、采用面部動(dòng)畫(huà)技術(shù)的虛擬會(huì)議、多媒體郵件、移動(dòng)通信條件下的多媒體應(yīng)用、可視化合作實(shí)驗(yàn)室場(chǎng)景應(yīng)用、遠(yuǎn)程視頻監(jiān)控、通過(guò)ATM網(wǎng)絡(luò)等進(jìn)行的遠(yuǎn)程數(shù)據(jù)庫(kù)業(yè)務(wù)等等。

    從矩形幀到VOP,MPEG-4順應(yīng)了現(xiàn)代圖像壓縮編碼的發(fā)展潮流,即從基于DCT的傳統(tǒng)編碼向基于對(duì)象和內(nèi)容的現(xiàn)代編碼的轉(zhuǎn)變。從這個(gè)意義上講,MPEG-4視頻編碼技術(shù)翻開(kāi)了圖像編碼史上嶄新的一頁(yè)。

四、 MPEG 4視頻產(chǎn)品

    在2001 NAB會(huì)展上,多家公司推出了他們的MPEG 4產(chǎn)品。Amnis公司推出了基于IP平臺(tái)的MPEG4視頻流技術(shù),展示了可以重放MPEG1, MPEG2和MPEG4的桌面軟件。Envivo 公司陳列了他們的應(yīng)用于IP網(wǎng)絡(luò)或MPEG2節(jié)目數(shù)據(jù)廣播的MPEG4端到端解決方案。該方案是純軟件的,支持視頻、音頻和合成的2D動(dòng)畫(huà)的MPEG4方式編碼,以及對(duì)MPEG 4文件的版權(quán)保護(hù)。Optibase公司推出的MGW系列是一個(gè)插件式的多通道流服務(wù)器系列,可插入不同的編碼模塊以適應(yīng)不同的需求,其中MGW 4000是支持MPEG4(兼容MPEG1和MPEG2)的流服務(wù)器。Optibase還推出了支持多媒體和交互MPEG4流的IP實(shí)時(shí)編碼、分配平臺(tái)。最后,Optibase展示了從MPEG 1到MPEG 4的實(shí)時(shí)轉(zhuǎn)碼技術(shù)。Philips 提供了一個(gè)從制作到重放的、端到端的網(wǎng)上MPEG-4解決方案:包括互動(dòng)內(nèi)容編輯器(支持網(wǎng)上MPEG-4視頻流的搜索、剪輯和編輯)、實(shí)時(shí)軟件MPEG-4編碼器(甚至支持簡(jiǎn)單視頻和AAC音頻的無(wú)線編碼)、通用多點(diǎn)分配IP平臺(tái)和解碼軟件(WebCine' player支持Win95,Win2000和NT操作系統(tǒng);WinCE用于手提電腦;Trimedia是一個(gè)網(wǎng)上廣播機(jī)頂盒)。SUN 公司也推出了他們的通用MPEG-4流服務(wù)器。

    微軟在它現(xiàn)在的WIN98和WIN2000操作系統(tǒng)中也已加入了一個(gè)MPEG-4的播放器,叫做Divx。它可以回放仍是以.AVI為后綴的MPEG 4文件。Divx可以附加到MPEG-4的數(shù)據(jù)流中,并可以進(jìn)行設(shè)置以適應(yīng)不同的使用要求。Divx視頻編碼技術(shù)是由 Microsoft MPEG4 V3 修改而來(lái),使用MPEG 4壓縮算法,打破了ASF的種種協(xié)定。但MPEG4畢竟是一種高比率有損壓縮,其圖象質(zhì)量始終無(wú)法和 DVD 的 MPEG2 相比,即便是在MPEG4碼率和DVD碼率差不多時(shí),總體效果還是有距離(在雜亂的細(xì)節(jié)上稍有模糊)。所以目前的MPEG4 只能面向于娛樂(lè)和欣賞方面的市場(chǎng)。

    市場(chǎng)上的第一張DIVX-MPEG4格式的影碟《活火熔城》,長(zhǎng)98分鐘,采用512×288 16:9格式,幀頻24幀/秒,64KB立體聲音頻。影片由720×480 16:9 30幀/秒的MPEG2制式轉(zhuǎn)刻,刻在單張CD盤(pán)片上。

六、結(jié) 尾

相關(guān)文章
主站蜘蛛池模板: 玉山县| 安庆市| 阳谷县| 九江市| 叶城县| 鹰潭市| 土默特右旗| 孟州市| 灌云县| 西乌珠穆沁旗| 夏邑县| 双峰县| 中卫市| 通许县| 冕宁县| 宁夏| 饶阳县| 绍兴市| 威海市| 韶关市| 万年县| 七台河市| 额尔古纳市| 奉化市| 安福县| 克山县| 昌江| 碌曲县| 临高县| 五莲县| 桓仁| 桂平市| 黑龙江省| 迭部县| 丹阳市| 台东县| 红安县| 彭阳县| 宿迁市| 乐陵市| 龙门县|