2016年1月19日火曜日

【音楽】(一部で)話題の MQA をデータと特許の上辺だけさらっと調べてみた【技術メモ】

CES 2016 で Tidal をはじめ、複数の事業者が MQA というフォーマットの採用を発表しました。

ハードウェアでもこれに対応する動きもあり、ここ最近飛ぶように売れている ONKYO DP-X1 でも対応するようで、活気付いてきています。

<CES>MQAのダウンロード配信、日本でも近日開始。TIDALでのストリーミングもデモ

ではその MQA ってどんなものなの?といっても抽象的な「オーディオ折り紙」とか「アナログを再現する」といった内容がほとんどでした。

今回の CES で同様に採用を発表したノルウェーのレーベル 2L 社が運営する音楽配信サイトでは MQA のサンプルが公開されたので中を覗いてみたらちょっと驚きの状態だったので、MQA の特許文書を斜め読みしてみました。

http://www.2l.no


MQA ってそもそも何に使うもんなの?

音楽を配信するときに使うファイルの圧縮方法で、基本的には CD と同じ音質のままを維持しつつも、 より高ビットレートな音楽を配信するために利用するようです。

ただ、FLAC をはじめとした従来の高圧縮フォーマットが発表された時と圧倒的に異なることがあって、既存のファイルフォーマットを踏襲することで MQA を再生する仕組みの無い 「多くの」 プレイヤーでも利用できる 「可能性が高い」 ことでした。
(後述しますがデータを見る限り無条件に使えるというわけではなさそうです。特にポータブル音楽プレイヤーあたりでは厳しい物がありそう。)

このあたりだけをみると MQA のファイルフォーマットが FLAC や WAV であることを考えると、ソフトウェア業界人的にはコンテナという表現のほうが直感的な気がします。

曲を比べてみた

サンプルとして使った曲は Ola Gjeilo から North Country II です。

理由は単純にオリジナルが 96kHz-24bit なのと MQA があるから比べやすそう、という理由だけです。

MQA がデコードされるとどういう PCM と同等になるのかわからないため、この実験では 96kHz-24bit と比較しています。

それぞれをスペクトラムアナライザに通してみた

96kHz-24bit FLAC フォーマット


綺麗に倍音が見えますね。
96kHz の音源なので 48kHz までの音が記録できます。
(使われてるの 20kHz 以下しかないじゃんとかそういう話は置いといて)

MQA FLAC フォーマット


基本的には 48kHz で再生できるため 24kHz までの音が記録できます。

が、20kHz くらいから 24Hz の高い周波数でちょっと雲がかかったようになっています。

あと、ちなみにビット深度を見ると 24bit になっています。つまり 48kHz-24bit のデータということになります。

どうもこれが MQA の正体のようです。
ちなみに FLAC から WAV に可逆変換をしても同様のスペクトラムで 24bit になります。

せっかくなんで MQA を WAV に変換してみた結果をバイナリエディタで見てみました。

PCM Stereo Format
サンプリング周波数は 48kHz
データスピード (48kHz x 3Byte x 2ch = 288000)
1ch あたりのバイト数(3Byte x 2ch)
ビット深度(24bit)

思った以上に普通の PCM でした。

MQA ってなんなのか今時点でわかること

多分この辺が MQA という圧縮技術だろう、というデータの状態まではわかりました。
スペクトラムを見る限りでは 22kHz のデータは残っています。しかも音楽として聴こえる状態です。
が、上の周波数部分になにか雲がかかっています。

データを圧縮してビットに意味を持たせて詰め込むというのはソフトウェア的にもよくある方法ではありますが、音楽の周波数というのは時間軸上に存在しています。

1秒間に48000回の音を記録するので 48000Hz 、音としてはその半分 24000Hz が表現できます。
1秒間に96000回の音を記録するので 96000Hz 、音としてはその半分 48000Hz が表現できます。

MQA はこの1秒間に存在している 2 倍のデータを 48000Hz-24bit の中に押し込めていそうです。

試しに 48kHz-24bit の PCM に変換してファイルサイズを比べてみます。
  • 96kHz-24bit の FLAC を変換して 48kHz-24bit WAV を作る
    • → ファイルサイズ : 90.4 MB (90,372,812 bytes)
  • 48kHz-24bit の MQA FLAC を変換して 48kHz-24bit WAV を作る
    • → ファイルサイズ : 90.4 MB (90,372,812 bytes)
なので PCM のデータとしては同一の時間長なデータであることがわかります。
(同一の時間長なだけで同じ品質のデータではありません。PCM は同一の時間であれば必ず同じデータ量になります。)

とりあえずここまで予想してみました。

特許からみる MQA

ではこの技術の特許を調べてみましょう。
こんなときは Google 特許検索が便利です。
とりあえず MERIDIAN AUDIO で調べてみたところ、それっぽい感じのが2つほどありました。


Digital encapsulation of audio signals
The invention relates to the provision of high quality digital representations of audio signals.
超訳。
(英語力はないので期待しないでください。)
本発明はオーディオ信号の高品質な表現を提供する。
これではなさそうですが、もしかしたら MQA のデコーダ側の実装で関連するかも?


Doubly compatible lossless audio bandwidth extension
The invention relates to digital audio signals, and particularly to lossless bandwidth extension schemes that provide compatibility with standard PCM playback.
超訳。
(英語力はないので期待しないでください。)
本発明はデジタルオーディオ信号において、特に標準の PCM 再生に対して互換性のあるロスレスな帯域幅拡張方式を提供します。

こっちっぽいですね。(独断)

で、早速 Google 翻訳でざっくり訳して眺めていきます。
  • デジタルオーディオの信号は高周波と低周波に分けられる。
  • これらを帯域フィルタで分割する。
  • 帯域フィルタが出力する下半分(低周波)は PCM である。
  • 帯域フィルタが出力する上半分(高周波)は圧縮された情報である。
  • オーディオとして主たる成分は低周波の部分なので概ねそのまま使う。
  • 重要な高周波は圧縮して使う。
  • さほど重要ではない成分はタッチアップ情報として使う。
序盤だけです。

ちゃんと訳して紙に描いてみないとしっかりとはわからないかも。

この文書の Fig7 あたりに 24bit の内訳の基本が書かれているみたいなので見てみると
  • 0 - 12bit が PCM でレガシーなデコーダーはここをデータとして利用する。
  • 13 - 15bit が非可逆圧縮された高域成分。
  • 16 - 19bit がノイズ状出力を得るための成分。
  • 20 - 23bit がタッチアップ(補修用?)情報。 
のようです。

あと、エンコーダに透かしを入れる機能がある。
ということも書かれていますね。

MQA という名前が Master Quality Authenticated (マスター品質保証?) なのでこのエンコーダー通してるので MQA で定めたデータが品質通り復元できるデータですよ、という担保にしたいということなのでしょう。

これが入るとパテントとか オトナノモンダイ なんかもありそうですが。。。

おわりに

こんな感じでとりあえず MQA ってどんな感じなんだろう?というところから調べてみました。

結局のところざっとみた感じだとコンテナするフォーマット的には可逆だけど、実際に格納する 48kHz-16bit PCM 的には不可逆ですし、データ上は圧縮処理をして混ぜているので CD と同じ常態か?というと違っていて、元のデータと同じ状態に復元できないという意味では Lossy(不可逆) であるとも言えます。

つまり現時点では PCM の仮面を被った圧縮音源と、そのライセンスと利用権利を引っさげて何か言っている、という状態です。
 
音も聴き比べてみても奥行きを感じない気がするので、MQA 対応のプレイヤーで聴いてみたいですね。
このあたりは先にデータを覗いてしまった先入観もがっちり働いてしまっていると思うので。

エンコーダー、デコーダーともにソフトウェアで対応できる気がするですが、さすがに OSS 実装とか出ないかしら?

高品質なデータに戻すためにはノイズフィルタの性能や復元するデータ自体へのデジタルフィルタなんかもあると思うので、このあたりはパテントで固められちゃうのかな。

こうなってくると心配になってくるのが 「他社のオリジナルには基本乗らないスタイル」 なSonyさんの存在ですね。

2 件のコメント :