ピックアップ

NobleAudioの完全ワイヤレスイヤホンFALCONはフラッグシップを音を持って産まれた?

「NobleAudioがワイヤレスイヤホンを発売する。」 これだけでイヤホンファン、オーオタ諸氏はドキっとしたことでしょう。 超高性能イヤホンメーカーが自社ハイエンドモデルの帯域バランスを元にワイヤレスイヤホンを本気で作ったようです。 このFALCON。結論を言うと過去所有していたワイヤレスイヤホン、ワイヤレスレシーバーを超える最高の出来、どちらが良いという感想にならないほどに 「NobleAudioが作ったNobleAudioのサウンドシグネチャを持ったワイヤレスイヤホン」 でした。 正直、同社初めてのワイヤレス、しかも完全ワイヤレス(英語圏だとTruelyWirelessと言ったりするらしい)こんなにNobleAudioの音になるとは思っていませんでした。 一言で言えば同社のフラッグシップモデル、KHANに非常によく似たバランスに元気さ・明るさを足したような音です。

【音楽】(一部で)話題の MQA をデータと特許の上辺だけさらっと調べてみた【技術メモ】

CES 2016 で Tidal をはじめ、複数の事業者が MQA というフォーマットの採用を発表しました。

ハードウェアでもこれに対応する動きもあり、ここ最近飛ぶように売れている ONKYO DP-X1 でも対応するようで、活気付いてきています。

<CES>MQAのダウンロード配信、日本でも近日開始。TIDALでのストリーミングもデモ

ではその MQA ってどんなものなの?といっても抽象的な「オーディオ折り紙」とか「アナログを再現する」といった内容がほとんどでした。

今回の CES で同様に採用を発表したノルウェーのレーベル 2L 社が運営する音楽配信サイトでは MQA のサンプルが公開されたので中を覗いてみたらちょっと驚きの状態だったので、MQA の特許文書を斜め読みしてみました。

http://www.2l.no


MQA ってそもそも何に使うもんなの?

音楽を配信するときに使うファイルの圧縮方法で、基本的には CD と同じ音質のままを維持しつつも、 より高ビットレートな音楽を配信するために利用するようです。

ただ、FLAC をはじめとした従来の高圧縮フォーマットが発表された時と圧倒的に異なることがあって、既存のファイルフォーマットを踏襲することで MQA を再生する仕組みの無い 「多くの」 プレイヤーでも利用できる 「可能性が高い」 ことでした。
(後述しますがデータを見る限り無条件に使えるというわけではなさそうです。特にポータブル音楽プレイヤーあたりでは厳しい物がありそう。)

このあたりだけをみると MQA のファイルフォーマットが FLAC や WAV であることを考えると、ソフトウェア業界人的にはコンテナという表現のほうが直感的な気がします。

曲を比べてみた

サンプルとして使った曲は Ola Gjeilo から North Country II です。

理由は単純にオリジナルが 96kHz-24bit なのと MQA があるから比べやすそう、という理由だけです。

MQA がデコードされるとどういう PCM と同等になるのかわからないため、この実験では 96kHz-24bit と比較しています。

それぞれをスペクトラムアナライザに通してみた

96kHz-24bit FLAC フォーマット


綺麗に倍音が見えますね。
96kHz の音源なので 48kHz までの音が記録できます。
(使われてるの 20kHz 以下しかないじゃんとかそういう話は置いといて)

MQA FLAC フォーマット


基本的には 48kHz で再生できるため 24kHz までの音が記録できます。

が、20kHz くらいから 24Hz の高い周波数でちょっと雲がかかったようになっています。

あと、ちなみにビット深度を見ると 24bit になっています。つまり 48kHz-24bit のデータということになります。

どうもこれが MQA の正体のようです。
ちなみに FLAC から WAV に可逆変換をしても同様のスペクトラムで 24bit になります。

せっかくなんで MQA を WAV に変換してみた結果をバイナリエディタで見てみました。

PCM Stereo Format
サンプリング周波数は 48kHz
データスピード (48kHz x 3Byte x 2ch = 288000)
1ch あたりのバイト数(3Byte x 2ch)
ビット深度(24bit)

思った以上に普通の PCM でした。

MQA ってなんなのか今時点でわかること

多分この辺が MQA という圧縮技術だろう、というデータの状態まではわかりました。
スペクトラムを見る限りでは 22kHz のデータは残っています。しかも音楽として聴こえる状態です。
が、上の周波数部分になにか雲がかかっています。

データを圧縮してビットに意味を持たせて詰め込むというのはソフトウェア的にもよくある方法ではありますが、音楽の周波数というのは時間軸上に存在しています。

1秒間に48000回の音を記録するので 48000Hz 、音としてはその半分 24000Hz が表現できます。
1秒間に96000回の音を記録するので 96000Hz 、音としてはその半分 48000Hz が表現できます。

MQA はこの1秒間に存在している 2 倍のデータを 48000Hz-24bit の中に押し込めていそうです。

試しに 48kHz-24bit の PCM に変換してファイルサイズを比べてみます。
  • 96kHz-24bit の FLAC を変換して 48kHz-24bit WAV を作る
    • → ファイルサイズ : 90.4 MB (90,372,812 bytes)
  • 48kHz-24bit の MQA FLAC を変換して 48kHz-24bit WAV を作る
    • → ファイルサイズ : 90.4 MB (90,372,812 bytes)
なので PCM のデータとしては同一の時間長なデータであることがわかります。
(同一の時間長なだけで同じ品質のデータではありません。PCM は同一の時間であれば必ず同じデータ量になります。)

とりあえずここまで予想してみました。

特許からみる MQA

ではこの技術の特許を調べてみましょう。
こんなときは Google 特許検索が便利です。
とりあえず MERIDIAN AUDIO で調べてみたところ、それっぽい感じのが2つほどありました。


Digital encapsulation of audio signals
The invention relates to the provision of high quality digital representations of audio signals.
超訳。
(英語力はないので期待しないでください。)
本発明はオーディオ信号の高品質な表現を提供する。
これではなさそうですが、もしかしたら MQA のデコーダ側の実装で関連するかも?


Doubly compatible lossless audio bandwidth extension
The invention relates to digital audio signals, and particularly to lossless bandwidth extension schemes that provide compatibility with standard PCM playback.
超訳。
(英語力はないので期待しないでください。)
本発明はデジタルオーディオ信号において、特に標準の PCM 再生に対して互換性のあるロスレスな帯域幅拡張方式を提供します。

こっちっぽいですね。(独断)

で、早速 Google 翻訳でざっくり訳して眺めていきます。
  • デジタルオーディオの信号は高周波と低周波に分けられる。
  • これらを帯域フィルタで分割する。
  • 帯域フィルタが出力する下半分(低周波)は PCM である。
  • 帯域フィルタが出力する上半分(高周波)は圧縮された情報である。
  • オーディオとして主たる成分は低周波の部分なので概ねそのまま使う。
  • 重要な高周波は圧縮して使う。
  • さほど重要ではない成分はタッチアップ情報として使う。
序盤だけです。

ちゃんと訳して紙に描いてみないとしっかりとはわからないかも。

この文書の Fig7 あたりに 24bit の内訳の基本が書かれているみたいなので見てみると
  • 0 - 12bit が PCM でレガシーなデコーダーはここをデータとして利用する。
  • 13 - 15bit が非可逆圧縮された高域成分。
  • 16 - 19bit がノイズ状出力を得るための成分。
  • 20 - 23bit がタッチアップ(補修用?)情報。 
のようです。

あと、エンコーダに透かしを入れる機能がある。
ということも書かれていますね。

MQA という名前が Master Quality Authenticated (マスター品質保証?) なのでこのエンコーダー通してるので MQA で定めたデータが品質通り復元できるデータですよ、という担保にしたいということなのでしょう。

これが入るとパテントとか オトナノモンダイ なんかもありそうですが。。。

おわりに

こんな感じでとりあえず MQA ってどんな感じなんだろう?というところから調べてみました。

結局のところざっとみた感じだとコンテナするフォーマット的には可逆だけど、実際に格納する 48kHz-16bit PCM 的には不可逆ですし、データ上は圧縮処理をして混ぜているので CD と同じ常態か?というと違っていて、元のデータと同じ状態に復元できないという意味では Lossy(不可逆) であるとも言えます。

つまり現時点では PCM の仮面を被った圧縮音源と、そのライセンスと利用権利を引っさげて何か言っている、という状態です。
 
音も聴き比べてみても奥行きを感じない気がするので、MQA 対応のプレイヤーで聴いてみたいですね。
このあたりは先にデータを覗いてしまった先入観もがっちり働いてしまっていると思うので。

エンコーダー、デコーダーともにソフトウェアで対応できる気がするですが、さすがに OSS 実装とか出ないかしら?

高品質なデータに戻すためにはノイズフィルタの性能や復元するデータ自体へのデジタルフィルタなんかもあると思うので、このあたりはパテントで固められちゃうのかな。

こうなってくると心配になってくるのが 「他社のオリジナルには基本乗らないスタイル」 なSonyさんの存在ですね。

コメント

  1. とても参考になりました。

    返信削除
  2. http://www.jas-audio.or.jp/jas_cms/wp-content/uploads/2015/12/201511-045-057.pdf

    返信削除
  3. Encapsulationは、MQAに関するオフィシャル資料でも記述されてますので、お書きになった内容は的外れですね。わかったようなことを書いて、わかっていないという印象を与えてしまうと思うので、適宜アップデートされたほうが良いと思います。でも、ためになりました。

    返信削除
    返信
    1. このエントリーを書き始めた2015年12月(記事の公開的には2016年1月)の頃に比べ得られる情報が増えましたし、国内外でも多く楽曲が提供され、プレイヤーも多く対応し始めた状況を考えるとおっしゃる通りアップデートは必要そうですね。
      ご指摘ありがとうございます。

      削除
  4. とても参考になりました。他人の書いたものを引用しおもしろおかりく曲解して嘘を書くと、皆さんが喜んで読んでくれるんですね。1)ロッシーだとか赤字ででかでか書いているけど、そんなことは開発者が説明済み。mqa.co.uk 参照 あるいはオーディオ協会MQA紹介論文参照 2)Encupsulationは、MQAの公式資料(配布カタログ)にも書かれており関係ない、どころかキーテクノロジーの一つ。3)PCMの仮面をかぶった・・のではなく、eOnkyoで買って、クリックするとFLAC(48k24bitでした)として普通に再生されるので、DoPのような、PCMと見せかけるということではない。冷静にPCMのコンテナに収納された小さな(1-1,5Mbpsの)データーになっている。ということではないでしょうか4)ライセンスについては、レコード会社の3大メジャーが契約し、グラミーノミネート常連の2Lもしかり、日本のテクニクス、オンキヨー(eOnkyo Music)マークレビンソンなども契約を終えているとのこと。ビジネスとして動いている段階です。何か言ってる。。とかいう呑気な状況ではない。5)エンコーダー、デコーダーは、実際にソフトが出ている。前者がプロ用ツール、プラグインとして。後者は例えばMac Audirvanaなど。6)MQAは圧縮技術ではなく、音声符号化(コーデック技術)として新しい。効率的なコーデックで結果としてファイル、転送レートを小さくする、従来の急峻なデジフィルの副作用であった、過渡特性の劣化を抑制しているということ。7)ポータブルプレーヤへの実装は、昨年終わってヨドバシカメラで売ってます。つまり、情報が陳腐化しているので、読んでびっくりしました。

    返信削除
    返信
    1. 要所を的確にご指摘くださりありがとうございます。情報がきちんと出たことと、私自身もプレイヤーや楽曲を入手したこともあり更新の機会を伺っていますが、これだけ流通すればフォローアップも今更かな?という気もありました。

      公開当時が2016年1月、気になって書き始めたのが2015年12月でした。あと少しで2年ほど前の情報ですので、おっしゃる通り情報の陳腐化は否めないですね。
      1年半以上も前の記事が1年半ほど過ぎて評価を頂けるとは思いませんでした。ありがとうございます。

      削除
  5. 今更ながら記事を拝見させていただきました。
    2016年とあるので情報も少ないときに客観的な記事が書けていたのがすごい。

    なんとも的を射てますね。
    >>PCM の仮面を被った圧縮音源と、そのライセンスと利用権利を引っさげて何か言っている

    オープンソースフォーマットのFLACに寄生して
    ライセンス使用料を搾取するマルウェアといったところでしょうか。

    ここのコメントも見ましたが、第三者視点の研究結果を提示しているわけでもなく、
    営利団体のMQAが公開している公式情報がソースとかいう始末。
    鵜呑みにしているカモにしか見えません。

    MQAで検索するとステマ記事ばかりで。。
    折り紙構造がどうたらこうたら・・などと
    データとしての分析が全く提示されておらず話になりません。
    圧縮している形式はすべて折り紙構造と言えるのでは?って感じです。

    本ブログのように分析した結果の日本語記事が少ないので助かりました。

    返信削除

コメントを投稿