2018-07-18 09:35:10
6265
語音質量是公網對講產品影響用戶體驗最重要的指標,早期公網對講產品不成功的主要原因也是實際用戶體驗到的音質達不到可接受的范圍。從模擬對講發(fā)展到數字對講,主要解決三個問題,提升語音質量、增強保密性和提高頻譜利用率,首當其沖就是要改善語音通信質量,特別是復雜電磁環(huán)境和遠距離傳輸時的語音通信質量。公網對講作為“數字對講”技術之一,其語音質量又如何呢?在4G寬帶移動網絡支持下,公網對講能帶給我們更好的音質體驗嗎?
衡量語音質量的指標
衡量通信系統(tǒng)語音質量主要有兩個指標,一是接收端語音的MOS分;二是端到端語音延時。
MOS分(Mean Opinion Score,平均主觀意見分)用于衡量經過通信系統(tǒng)壓縮編碼傳輸后恢復語音的“還原度”,包括可懂度、清晰度和自然度,采用5分制打分(5優(yōu),4良,3尚可,2差,1劣)。傳統(tǒng)PSTN有線電話的語音質量一般定義為MOS 4.0分,2G無線電話的語音質量為MOS 2.5-4分之間,3G移動電話系統(tǒng)采用的語音編解碼算法可以達到4分以上。
端到端語音延時,用于衡量通信系統(tǒng)的實時性,延時過大將極大影響交互溝通的用戶體驗。傳統(tǒng)PSTN電話的端到端語音延時小于16ms;IP電話系統(tǒng)一般要求端到端語音延時小于300ms;衛(wèi)星電話端到端語音延時大于500ms。通常我們在打IP電話或衛(wèi)星電話時,會感覺到對方反應“遲鈍”,造成溝通不暢,就是因為端到端語音延時過大造成的?;贗P網絡協(xié)議的公網對講系統(tǒng),其端到端延時往往大于幾百毫秒,也是影響用戶體驗的重要指標。
影響公網對講語音質量的主要因素
影響公網對講音質的主要因素分為兩大部分,一部分是終端硬件因素,包括麥克風、喇叭、聲腔結構和音頻電路等;另一部分是平臺系統(tǒng)設計因素,包括語音編解碼算法、音頻增強算法、傳輸策略和服務器處理機制等。本文重點介紹公網對講平臺對用戶音質體驗的幾個因素。
語音編解碼算法(也稱為聲碼器)
是決定公網對講平臺所能提供的語音質量的根本因素。換句話說,如果平臺所采用的語音編解碼算法所能提供的語音質量就很差,終端硬件的音頻設計再好也無法根本性提高語音質量?,F有公網對講平臺主要采用三類語音編解碼器,第一類是早期支持2G CDMA網絡的平臺,采用EVRC變速率聲碼器的半速率(4Kbps)編碼,其音質較差,MOS分只有 3.0分左右;第二類以支持3G 移動網絡為出發(fā)點,采用3GPP AMR變速率聲碼器(4.75Kbps-12.2Kbps),其全速率編解碼音質可達到MOS 4.0分以上;第三類是脫胎于VoIP系統(tǒng),采用ITU G.72x語音編碼標準,可根據終端能力匹配來選擇編解碼算法。
語音增強
主要包括環(huán)境噪聲抑制、自適應聲學回聲消除、自動增益控制、自適應均衡等算法。語音增強技術應用的有無或好壞,很大程度上影響了產品的用戶音質體驗。
傳輸策略
基于無線IP網絡傳輸的公網對講系統(tǒng),必須面對丟包、抖動、亂序等網絡傳輸因素對音質的影響,因此必須設計一套有效的傳輸策略來對抗這些網絡特征對語音質量產生的負面影響。所以說,對于OTT體制的公網對講平臺,實現公網對講業(yè)務基本功能并不難,在好的網絡環(huán)境下“演示”效果也可能會表現不錯,但用戶真正使用的時候就會出各種各樣的音質問題。因此,對公網對講平臺而言,難的是如何在不同的網絡環(huán)境下提供很好的用戶音質體驗。
4G公網對講的語音質量能不能大幅提升?
使用2G網絡的公網對講用戶已經熟知2G公網對講機音質差、語音延時大的問題,在2G公網對講機向4G公網對講機過渡的過程中,用戶必然會問,4G網絡帶寬大,傳輸速度快,語音質量是不是也能大幅度提高呢?答案是“不一定”,4G公網對講完全有條件大幅度提升語音質量,但并不是采用了4G終端就能提升語音質量,而是取決于平臺的系統(tǒng)設計能否有效利用4G網絡的帶寬優(yōu)勢。
如前所述,公網對講系統(tǒng)音質的好壞的根本因素是采用什么樣的語音編解碼器,如果平臺只能支持低碼率低質量的語音編碼器,也沒有根據4G網絡的優(yōu)勢調整傳輸控制策略,不能充分利用4G網絡的帶寬優(yōu)勢,4G公網對講機也就徒有虛名,并不能給用戶帶來大的音質體驗提升。
集群通(GQT)系統(tǒng)的語音業(yè)務設計
集群通平臺的語音業(yè)務設計,支持多聲碼器互通,支持用戶可配置語音編解碼算法,具備充分調優(yōu)的語音增強算法和自適應傳輸網絡環(huán)境的傳輸控制策略。
集群通平臺主聲碼器采用3GPP AMR多速率聲碼器,編碼速率從4.75Kbps到12.2Kbps可根據用戶或網絡條件配置,該聲碼
器的MOS分最高可達4.2分。同時,由于集群通系統(tǒng)架構支持多聲碼器互通,在4G網絡條件下可以后向兼容引入新的更高質量的語音編碼器,如OPUS音頻編碼器,達到更高的語音通信質量。
在網絡傳輸策略上,集群通系統(tǒng)支持自適應的傳輸控制算法,端到端語音延時(實際用戶體驗到的時延)可以控制在200ms到500ms,大大優(yōu)于目前大部分2G公網對講平臺的1000ms端到端時延指標。
綜上所述,集群通平臺的語音業(yè)務設計采用的是可擴展的系統(tǒng)架構,隨著網絡環(huán)境、用戶需求、業(yè)務應用的演進,音頻業(yè)務服務質量也可以同步不斷改進。