Ⅰ 音頻信號能進行壓縮的依據是什麼
音頻信號能進行壓縮的依據是音頻壓縮技術。
音頻壓縮技術指的是對原始數字音頻信號流(PCM編碼)運用適當的數字信號處理技術,在不損失有用信息量,或所引入損失可忽略的條件下,降低(壓縮)其碼率,也稱為壓縮編碼。它必須具有相應的逆變換,稱為解壓縮或解碼。音頻信號在通過一個編解碼系統後可能引入大量的雜訊和一定的失真。
在音頻壓縮領域,有兩種壓縮方式,分別是有損壓縮和無損壓縮。常見到的MP3、WMA、OGG被稱為有損壓縮,有損壓縮顧名思義就是降低音頻采樣頻率與比特率,輸出的音頻文件會比原文件小。另一種音頻壓縮被稱為無損壓縮,也就是所要說的主題內容。無損壓縮能夠在100%保存原文件的所有數據的前提下,將音頻文件的體積壓縮的更小,而將壓縮後的音頻文件還原後,能夠實現與源文件相同的大小、相同的碼率。無損壓縮格式有APE、FLAC、WavPack、LPAC、WMALossless、AppleLossless、La、OptimFROG、Shorten,而常見的、主流的無損壓縮格式只有APE、FLAC。
Ⅱ 音質標准
聲音的質量,即音頻信號的保真度,是指在傳輸和處理過程中音頻信號的清晰程度。在音頻質量標准方面,業界通常將聲音質量分為4個等級。其中,數字激光唱盤CD-DA在信號帶寬為10Hz~20kHz時聲音質量最高;而電話的話音質量最低,其信號帶寬僅為200Hz~3400Hz。除了頻率范圍,人們還會使用失真度、信噪比等指標來進一步描述音質標准。對模擬音頻而言,聲音成分越豐富,失真與干擾越小,聲音的保真度和音質也越高。而在數字音頻中,再現聲音頻率的成分越多,誤碼率越低,音質越好。數碼率或存儲容量是衡量音質的常用指標,取樣頻率越高、量化比特數越大、聲道數越多、存儲容量越大,保真度就越高,音質也越好。
不同類型的音頻有不同的音質需求。語音音質要求清晰、不失真、再現平面聲象;而樂音音質則要求高保真,營造空間聲象,通常通過多聲道模擬立體環繞聲或虛擬雙聲道3D環繞聲等方法實現。音頻信號的用途不同,採用的壓縮質量標准也會有所不同。例如,電話質量的音頻信號採用ITU-G·711標准,其特徵為8kHz取樣、8bit量化、碼率為64Kbps。而AM廣播則採用ITU-G·722標准,特徵為16kHz取樣、14bit量化、碼率224Kbps。高保真立體聲音頻壓縮標准由ISO和ITU-T聯合制定,適用於CD-DA光碟。
在實際應用中,對聲音質量的要求直接影響設備的復雜性與成本。通常以「足夠滿足需求,而又不過度浪費資源」為原則,找到聲音質量與設備成本之間的平衡點。通過合理選擇音頻壓縮標准和技術,可以在保證音質的同時,實現設備的優化設計。
在音響技術中它包含了三方面的內容:聲音的音高,即音頻的強度和幅度;聲音的音調,即音頻的頻率或每秒變化的次數 ;聲音的音色,即音頻泛音或諧波成分。談論某音響的音質好壞,主要是衡量聲音的上述三方面是否達到一定的水準,即相對於某一頻率或頻段的音高是否具有一定的強度,並且在要求的頻率范圍內 、同一音量下,各頻點的幅度是否均勻、均衡、飽滿,頻率響應曲線是否平直,聲音的音準是否准確,既忠實地呈現了音源頻率或成分的原來面目,頻率的畸變和相移又符合要求 。聲音的泛音適中,諧波較豐富,聽起來音色就優美動聽。