電視技術(shù)中音視頻同步技術(shù)及實現(xiàn)
電視技術(shù)中音視頻同步技術(shù)及實現(xiàn)
摘 要 隨著數(shù)字技術(shù)、網(wǎng)絡(luò)技術(shù)、通信技術(shù)和多媒體技術(shù)的進(jìn)一步發(fā)展,數(shù)字電視已經(jīng)成為有線電視的主流形式而得到廣泛普及。音視頻同步是有線數(shù)字電視提供高質(zhì)量收視服務(wù)的重要標(biāo)志;數(shù)據(jù)編碼則是音視頻同步技術(shù)的核心。本文分析影響音視頻信號同步的相關(guān)因素,并在MPEG-2 標(biāo)準(zhǔn)下,提出了可操作性較強(qiáng)的、適用于實時解碼的音視頻同步解決策略。
關(guān)鍵詞 電視技術(shù);音視頻同步;實現(xiàn)
音視頻的數(shù)字化處理與同步傳輸是電視節(jié)目傳輸高質(zhì)量的重要標(biāo)志,也是數(shù)字電視技術(shù)和多媒體通信技術(shù)中一個極為特殊和重要的關(guān)鍵技術(shù)。隨著數(shù)字技術(shù)、網(wǎng)絡(luò)技術(shù)、通信技術(shù)和多媒體技術(shù)的進(jìn)一步發(fā)展及數(shù)字電視的廣泛普及,廣大電視用戶對音頻與視頻服務(wù)質(zhì)量的要求越來越高,如何確保音視頻同步己經(jīng)成為電視技術(shù)研究領(lǐng)域的重點問題。
1有線電視技術(shù)中的音視頻同步
同步,即將不同類型載體所傳輸?shù)男畔凑找欢ǖ臅r間、空間和邏輯關(guān)系組成一個有機(jī)的整體,再以某種形式在同一時間點展現(xiàn)出來。音視頻同步,就是確保具有一定相關(guān)性的音視頻信號能夠在同一時間點上進(jìn)行播放,以達(dá)到電視節(jié)目完整呈現(xiàn)的目的。音頻和視頻技術(shù)的發(fā)展是音視頻同步技術(shù)發(fā)展的前提。如果不能保持音視頻同步,廣大電視用戶所收看到的電視節(jié)目的聲音和圖像就不是相互匹配,邏輯關(guān)系十分混亂,降低了數(shù)字電視傳輸質(zhì)量,影響了用戶的視聽感受,使用戶無法正確理解數(shù)字電視所提供的電視節(jié)目信息。在傳統(tǒng)的模擬電視系統(tǒng)中,發(fā)送端在傳輸圖像與聲音信號時會同時發(fā)送同步信號,接收端也就能夠直接獲得時間信息,發(fā)送端與接收端夠保持同步,用戶所看到電視音視頻也就保持了統(tǒng)一。當(dāng)前,數(shù)字電視已經(jīng)逐步取代了模擬電視,被廣大用戶所接受。音視頻編解碼技術(shù)是數(shù)字電視技術(shù)的核心,圖像和聲音的數(shù)字化處理與傳輸取得突破性進(jìn)展也正是其得以普及的重要原因。但在數(shù)字電視系統(tǒng)中,圖像編碼的類型不同,圖像的復(fù)雜程度明顯變化,編碼后也很難形成同步脈沖,幀與幀之間的延遲恒定性被打破,這就迫切需要新的技術(shù)來為音視頻同步服務(wù)。
2影響音視頻同步的相關(guān)因素
音視頻數(shù)據(jù)自身的特性及其所處的環(huán)境是造成音視頻無法保持同步的重要原因。在現(xiàn)代數(shù)字電視系統(tǒng)中,發(fā)送端產(chǎn)生的音視頻數(shù)據(jù)需要通過一定的傳輸網(wǎng)絡(luò)才能為接收端所接受。而在信號傳輸?shù)倪^程中,音視頻數(shù)據(jù)的將會因一些特定的原因受到影響,從而導(dǎo)致音視頻數(shù)據(jù)被接收端接收時不能保持同步。具體來說,主要有如下幾個因素。
2.1延時抖動
延時抖動,是指數(shù)據(jù)信號從起點傳輸?shù)浇K點時發(fā)生的延時變化。在有線電視技術(shù)系統(tǒng)中,音視頻信號在很多部位都可能發(fā)生延時抖動。延時抖動對于音視頻數(shù)據(jù)信號的同步影響較大,將導(dǎo)致視頻和音頻數(shù)據(jù)流的內(nèi)部時序關(guān)系被打斷,二者之間的一致關(guān)系也被破壞。
2.2時鐘偏差
在無全局時鐘的情況下,由于物理因素而導(dǎo)致發(fā)送端的信源與接收端本地時鐘頻率存在偏差,而音視頻數(shù)據(jù)的播放是由接收端的本地時鐘驅(qū)動的,在一段時間之后,接收端就可能產(chǎn)生數(shù)據(jù)不足或溢出的現(xiàn)象,從而影響有線電視的收視效果。
2.3數(shù)據(jù)采集和傳輸時間偏差
當(dāng)音視頻信號源頭為多個信源的時候,信源必須保持同步采集和傳輸,否則,就會引起接收端信號的不同步現(xiàn)象。
2.4其他
音視頻信號在傳輸過程中由于受到影響,或者是有線電視網(wǎng)絡(luò)傳輸能力出現(xiàn)問題,都有可能造成信號丟失或者是時間邏輯關(guān)系混亂,導(dǎo)致音視頻無法同步。
3 MPEG-2壓縮編碼技術(shù)及其在數(shù)字電視中的應(yīng)用
MPEG-2 壓縮編碼技術(shù)是數(shù)字電視系統(tǒng)中的關(guān)鍵技術(shù)。MPEG,即活動圖像專家組英文表述的縮寫,Moving Picture Expert Group,MPEG-2是由ISO/IEC 信息技術(shù)聯(lián)合技術(shù)委員會1988年于制定的一種通用的活動圖像、伴音及其組合編碼的標(biāo)準(zhǔn)。這一標(biāo)準(zhǔn)支持較高范圍內(nèi)的圖像分辨率。MPEG-2壓縮編碼技術(shù)在數(shù)字電視技術(shù)體系中有重要地位。數(shù)字電視,是將原有的模擬信號轉(zhuǎn)換為數(shù)字信號,再經(jīng)過 MPEG-2壓縮編碼形成數(shù)字信號源,并在電視傳輸網(wǎng)絡(luò)上進(jìn)行傳輸,用戶接收端在模擬電視機(jī)上安裝一個可以機(jī)頂盒,再經(jīng)過調(diào)諧、QAM 解調(diào)、解擾等一系列處理后,將數(shù)字信號還原為模擬信號,最終實現(xiàn)用普通模擬電視來收看到高質(zhì)量數(shù)字電視節(jié)目的電視技術(shù)。
4 主要的音視頻同步算法
音視頻同步是指音頻、視頻在經(jīng)過存儲、處理、傳輸和播放等環(huán)節(jié)仍能維持同一的時間邏輯關(guān)系。這一時間邏輯關(guān)系是在獲取音視頻數(shù)據(jù)時同時確定的,并且要保持恒定,否則就會影響數(shù)字電視節(jié)目的播放質(zhì)量。目前,在MPEG-2標(biāo)準(zhǔn)下,以MPEG-2實時解碼技術(shù)為核心的音視頻同步算法主要操作方法有:
4.1恢復(fù)系統(tǒng)時鐘
針對因發(fā)送端與接收端時鐘不一致而導(dǎo)致的音視頻不同步現(xiàn)象,可以利用碼
流中的PCR恢復(fù)系統(tǒng)時鐘的STC,進(jìn)而按照DTS和PTS所指示的時間解碼和播放音視頻幀,這樣音視頻就能保持同步。
4.2音視頻跟蹤技術(shù)
利用MPEG-2 軟件解碼器進(jìn)行解碼時可以采用這一方法。其中,音頻跟蹤技術(shù)主要是以音頻為主流媒體,視頻為從流媒體,在保持音頻的播放速率不變的基礎(chǔ)上,利用基于相同時間基點的數(shù)據(jù)單元的時間標(biāo)簽,通過調(diào)整視頻的播放幀率來實現(xiàn)音視頻同步。而視頻跟蹤技術(shù)中,就是以視頻為主流媒體,音頻為從流媒體,處理方法同上。
4.3其他
除上述方法之外,還可以將音頻信號,嵌入到視頻的傳輸系數(shù)中,再將這種混合了音視頻的數(shù)據(jù)一起進(jìn)行編碼。接收端接收到數(shù)據(jù)信息之后,先從混合信號中提取出隱藏的音頻信息,再利用解碼器進(jìn)行解碼,這時就可以實現(xiàn)音視頻信號的同步播放。
當(dāng)前,數(shù)字電視已成為廣播電視主要播出時所采用的主要形式,數(shù)字電視高質(zhì)量傳輸和播出的重要標(biāo)志就是音視頻同步。音視頻同步具體是指音視頻信號經(jīng)過信號存儲、轉(zhuǎn)換、傳輸、信號還原之后,在被播出時能夠保持一致。MPEG-2是適用于廣播電視技術(shù)圖像及語音同步的編碼標(biāo)準(zhǔn),針對造成音視頻信號不能同步的因素,制定有效方案來實現(xiàn)音視頻同步,為廣大用戶提供更高質(zhì)量的有線數(shù)字電視播放服務(wù)。
參考文獻(xiàn)
[1]蔡安妮,孫景鰲.多媒體通信技術(shù)基礎(chǔ)[M].1版.北京:電子工業(yè)出版社,2000.