歐洲電視廣播的音訊規格導讀

ETSI 000 468 這本 spec. 是介紹關於 DVB (digital Video Broadcasting) 的 SI (Service Information), 完全 free, 可以從 ETSI (ETSI = European Telecommunications Standard Institute) 下載. 不過如果是嫌錢太多的人, 可以到ANSI 去買, 大約花個 58 USD,  就可以買到 1998 年的舊版. 呃, 這是個什麼世界啊! 一定是流動性不足的關係, 不然我可以到 ANSI 放空 100 本, 再到 ETSI 買進.

好, 閒話休提, 這本 spec. 的內容不外乎是介紹 TS (transport stream) 裡面 SI 的各種 table, 重頭戲就是第五章的 Service Information (SI) Tables 和第六章的 Descriptor. 它們就占了 68 頁之多 (總共 116 頁). 不過我比較感興趣的是附錄的部分. 附錄 D 加進了 E-AC (也就是 enhanced AC3 或是稱為 AC3 plus, AC3+), DTS 與 HE-AAC.

傳統的 AC3 當然還在用. 至於 AC3+ 要去看另外一本 TS 102 366 Digital Audio Compression (AC-3, Enhanced AC-3) Standard. 同樣地, 隨便向 ETSI 註個冊就可以下載它來看了. 需要填寫的註冊內容比加入 facebook 還少, 只不過得承認 "台灣是中國的一省" 比較有爭議. ETSI 的註冊條款似乎只在於不可盜用其內容, 所以我不貼它的圖就是了.

TS 102 366 最令我嫌惡的地方並不是它有 214 頁厚, 而是它竟然還是同時支援 32, 44.1 和 48KHz 三種頻率, 在電信領域, 規格愈有彈性就愈討厭啊! 繼續往下看, 更討厭的來了.

DTS, 竟然堂堂支援 15 種頻率, 從 8 KHz ~ 192 KHz 都有. 還好 DTS descriptor 只給它 4 bits, 不然不知道它還會變出什麼花樣來!? TS 102 114 – DTS Coherent Acoustics; Core and Extensions 裡面說到, DTS 的 core 只支援 8/16/32, 11.025/22.05/44.1, 12/24/48 九種 sampling rate, 要加上 extension 才會鬧出 96 KHz.

[note2] 如果去看美規的 A/53 part5 – ATSC Television Standard / AC3 Audio System Characteristics, AC-3 只能夠有 48 KHz 一種頻率, 乾淨多了.

原來 DTS core 為了節省頻寬, 竟然會選擇傳 8KHz 那樣小家子氣的東西. Receiver 必須 up-sampling 2 倍到 4 倍, 以便做出傳統 32/44.1/48 KHz 的 DTS. 然後再加上 extansion 裡面要求支援 X-CH (也就是 6.1CH) 和 X96 (也就是 96KHz extrension), 做出更好的音效, 包括上看 8 channels.

[note] 在 TS 102 114 定義了 8CH 在 frame header 裡面, 但是回歸母體的  ETSI 000 468, descriptor 最多只有支援 5CH.

最後來到 AAC 與 HE-AAC, 這本規格說什麼呢? 沒說! 它說去看 ISO/IEC 14496-3. 因此只能推估頻率上限是和 AC3 相仿的 48 KHz 或是 AAC 上限的 96 KHz, 頻道是 5.1 CH.

 

歐洲的下一代數位電視廣播音訊標準 (Next DVB – Audio Standard)

由於歐洲國家的地面廣播向來各行其是, 因此在規格上比較混亂. 到了數位廣播的時代, 大家的看法也沒有太收斂. 因此幾個不同聯盟都出來制定規範.

根據 EBU (歐洲廣播聯盟) 的文件, 他們把 broadcast chain 分得很細, 包括 production, contribution, distribution 和 emission 等階段. 每個階段又分成 radio, television 和 internet 等不同的應用.

Production: 節目製作.

Contibution: 從 OB van (outside broadcast van, 戶外轉播車) 傳到 broadcast house.

Distribution: 從 broadcast house 到 playout.

Emission: 從 transmitter 到 receiver. 指無線廣播.

經過 phase 1 的篩選, phase 2 只剩下這幾個標準被留下來:

Dolby Digital

Dolby Digital Plus

MPEG Surround Layer 2

AAC/HE-AAC

DTS/DTS-HD

由於 EBU 所制定的規範管不到 home theater, 所以在規範中增加了 transcoding 的條件. 亦即非典型的 AAC, DD+ 之類的 decoder, 不能直接用 raw data 輸出, 要先轉成 DTS 的 1.5 Mbit/s 或 Dolby Digital 的 448 kbit/s. 這樣可以使得舊式的 AV receiver 延續生命, 而不會被民眾痛罵到昏頭.

在評比項目當中, 除了聽覺品質的之外, 實際的壓縮 bit rate 也很重要. 比方說系統給 256 kbps, encoder 老是會多壓出 0.1 kbps, 這樣的系統也會掛掉. 相對地, 無法達到所要求的 bit rate 也不行 (the quality performance cannot be achieved if the bitrates used are not sufficient. ).

最後的評比結果, HE-AAC 可說是大獲全勝. 在 128 kbps 的 extra low bit rate, 還是能夠得到 good~excellent 的評價. HE-AAC 壓在 160 Kbps 的品質, 和其他 decoder 在 320 kbps 表現得一樣好 (除了在一個名叫 “applause" 的 file, HE-AAC 怎麼壓都是 fair 之外, 其他都是  excellent).

相對的, MPEG Surround 雖然用到了一些先進技術, 但是被評價為不合  TV broadcast 的水準, 只能用在 DAB 之類的場合.

根據 Dolby 所提供的資料, 他們自稱 Dolby Digital 和 Dolby Pluse 是在這個測試中表現最好的 decoeder. 其實呢? DTS 的分數在 phase 1 是最高的. 不過這是一場不公平的比較, DTS 用的 bit rate 是 Dolby 的 3、4 倍之多, 因此 phase 2 根本就沒有人和 DTS 一起比較, 算是無視它的存在!

EICTA (Eroupe Information and Communication Technology Industry Association), HD Forum (法國), Nordig (瑞典、挪威、冰島、丹麥、芬蘭), Spanish HD Forum (西班牙), Italian HD Forum (義大利) 這些國家都選了 Dolby Digital PLus HE-AAC + tanscoding 作為他們下一代的 audio 廣播標準.

在某些場合, HE-AAC 的名字可能會被 Dolby Pulse 所取代. 因為打不過 HE-AAC 的 Dolby, 已經把它收錄旗下, 換個名字. 加一點料 (metadata) 後, 重新包裝成自家的產品. 這招著實利害!

HE-AAC 小檔案

因為客戶又在問, 所以寫個小 memo. 以後再有人問, 就轉寄這個內容給他好了. 雖然 Wiki、Google 都找得到這些資訊, 但是請客戶上網去找就太沒形象了. 還是自己準備一版吧!

HE-AAC 是 AAC 眾多 profile 之一, 這些 profile 包括:

1. Main profile (以淘汰, 這麼多年來, 只測到一隻 sample)

2. Low Complexity profile (就是所謂的 LC-AAC)

3. Sample Rate Scalable profile (SRC)

4. Long Term Predication profile (LTP)

5. High Efficient profile (即 HE-AAC)

6. Scalable to Lossless (STL, 即 Fraunhofer IIS 版的 HD-AAC)

7. Low Delay AAC (即 LD-AAC)

HE-AAC 比一般 AAC 差在哪裡呢? 

1. 從 MPEG2 AAC 到 MPEG4 AAC 時, 增加了 Perceptual Noise Substitution (PNS), 顧名思義就是用 pseudo random noise 取代 noise input. 另外也增加了 LTP.

2. 增加了 Spectral Band Replication (SBR), 即 HE-AAC version 1.

3. 增加了 Parametric Stereo (PS), 即 HE-AAC version 2.

其中 SBR 簡單地說就是, 犧牲高頻, 只採用低頻和中頻的訊號去複製出 (Replication)高頻. 至於怎麼複製呢? 就是利用低頻與中頻的諧波 (harmonic). 當 AAC 加了 SBR 的技術就變成 HE-AAC, MP3 加了 SBR 的技術就變成 MP3pro. 這個 side information 通常是附加的, 使得舊的 decoder 也可以播出少了高頻的音樂, 勉強還可以聽就是了.

PS 技術是針對低頻的 stereo 訊號, 將它壓縮為 mono 的訊號, 這樣就節省了一定的 bit rate, 想要還原回一定的音質的話, 就需要補上 down-mix 成 mono 的過程中, 已經拿出來的一些 side information. 因此, 一個只支援 HE-AAC version 1 的 decoder, 在播 HE-AAC version 2 的音樂的時候, 就會只聽到一個聲道.