あなたの耳は何ビット?量子化ビット数による音質の違いとは ~モスキート音の聴き比べに飽きた方へ~

ちょっとWEBで検索してもそれらしいホームページが見当たらなかったので自分で作ることにしました。
(モスキート音の聴き比べは沢山見つかるのですけど。。。)

それは、「量子化ビッド数が音質に与える影響について」です。

量子化ビット数とは、音楽ソースの情報を何段階で表現するかを示した値です。この値が高いほど、本来の音源に忠実なデータということになります。

例えば量子化ビット数が8ビットの場合は、2進数で-128~+127までの数値を表現することができますし、16ビットの場合は、-32768~+32767の数値を表現することができます。

昨今、ハイレゾ音源が話題になっていますが、「音が良い」と言われるハイレゾ音源の量子化ビット数は殆どが24ビットです。
CDの量子化ビット数は16ビット
懐かしいファミリーコンピューターなどは8ビット以下です。

量子化ビット数が1ビット増えると2倍の情報量となるので、昔のゲーム機の8ビットと比べて
ハイレゾ音源は、[24bit – 8bit = 16bit]なので2の16乗(65535)倍、細かい情報が含まれていることになります。

量子化ビット数と波形

量子化ビット数が増えるほど、カクカクしている波形が滑らかになって本来の音に近づいていきます。

頭ではビット数が大きいほうが音が良いのだろうなぁと想像が出来ても、その違いを聴きくらべた人はあまりいないのだろうと思います。

そこで今回は、量子化ビッド数の違いを実際の音で聴き比べてみましょう。

以下に4bit~16bitまで2bit刻みでWAVファイルを用意しました。

注意)WAVファイルが再生可能なブラウザに限り試聴可能です。対応していない環境の方はゴメンナサイ。

量子化ビット数の違う音を聴き比べてみましょう

例1) まずは、解り易く音ではよく基準にされる1kHzのサイン波形です。

A:1kHzのサイン波(量子化ビット数=4ビット)

B:1kHzのサイン波(量子化ビット数=6ビット)

C:1kHzのサイン波(量子化ビット数=8ビット)

D:1kHzのサイン波(量子化ビット数=10ビット)

E:1kHzのサイン波(量子化ビット数=12ビット)

F:1kHzのサイン波(量子化ビット数=14ビット)

G:1kHzのサイン波(量子化ビット数=16ビット  CDの音質)

どうですか?ある程度のビット数から違いが良くわからないですよね。

例2) 次は、ナチュックスピーカーが提供しているフリーBGMの中から「Op003」の冒頭部分。クラシカルな曲です。

A:Op003 (量子化ビット数=4ビット)

B:Op003 (量子化ビット数=6ビット)

C:Op003 (量子化ビット数=8ビット)

D:Op003 (量子化ビット数=10ビット)

E:Op003 (量子化ビット数=12ビット)

F:Op003 (量子化ビット数=14ビット)

G:Op003 (量子化ビット数=16ビット CDの音質)

[Op003のフルバージョンはこちらから。]

おや?やっぱりある程度のビッド数から違いを聴き分ける自信がなくなってきませんか?

それじゃハイレゾ音源は要らないの?

これだけ聴くと「ハイレゾなんて要らないじゃない」という人がいると思うのですが、実際はそんなに単純な話ではないのです。

上記のWAVファイルは最大音量が0dB(出力可能な最大音量)になるように調整してあります。
8ビットのSIN波形であれば、山の上側のピークが+127。山の下側のピークは、-128になります。
このSIN波形の音量を半分にした場合はどうなるでしょう?

山の上側のピークが+63。山の下側のピークは、-64になります。これは7ビットのSIN波形と同じ波形になります。
さらに音量を半分にすると、山の上側のピークが+31。山の下側のピークは、-32になり、これは6ビットのSIN波形と同じ波形になります。

ということで、録音時の音量が小さくなるほど、量子化ビット数が見かけ上少なくなってしまうのです。
CDの場合で言えば、本来16ビットある分解能が、下手な録音だと実際は15ビットとか、14ビットとかどんどん悪くなっていきます。

この現象がもっと顕著に現れるのがオーケストラの演奏です。オーケストラの場合、音量の大きいところと、小さいところの差が非常に激しいのが一般的です。ピアニッシモで演奏される部分など耳を澄まさないと聴こえないくらいの場面が沢山あります。

こういった場面の場合、量子化ビット数が大きいほど有利といえます。 たとえば、オーケストラがフォルテッシモで演奏する場面とピアニッシモで演奏する場面の音量差が200倍(46dB)くらいあったとすると16ビットのCDの場合、ピアニシモの部分は見かけ上の量子化ビット数が半分の8ビットになってしまいます。

これがハイレゾ音源の場合は、24ビットから200倍(46dB)音量が下がったとしても、まだ16ビット分の量子化ビット数が確保されていますので、音が悪くなったと感じることがありません。

量子化ビットと音量

上記波形はすべて同じ音質になります。8ビットの量子化ビット数があっても音量を25%にしたら、見かけ上6ビットの量子化ビット数になります。

以上をまとめると

  1. 量子化ビット数を語る前に、録音の状態が最良である必要がある。(比較に値する録音である必要がある)
  2. CDもハイレゾ音源も音量の大きなところではあまり変わらない。(音の違いがよくわからない)
  3. 音量の非常に小さいところでは見かけ上の量子化ビット数が減るため量子化ビット数の大きいハイレゾ音源がダントツ有利。(これは結構違いが出ると個人的には思います)

なぜ量子化ビットが低くてもそれなりに聴こえるの?

案外8bitの音もそれなりに聴こえたりします。256の分解能しかないのに何でだろうと少し不思議です。

さて、量子化ビット数の少ない音とビット数の多い音は音質的にはどこが違うか聴き分けることができましたか?
実は高音側のノイズレベルが異なるのです。このことは量子化ビット数の多い音(本来の音に近い波形)と量子化ビット数の少ない音(カクカクと階段状の波形)の周波数スペクトルを見ると良くわかります。

量子化ビット数が少なるなると、その分、高音(高い周波数)側にスペクトルが現れます。これが「サー」とか「ビー」というノイズとして耳に聴こえます。量子化ビット数が減ったとしても基本の音そのものが変わってしまうことはないのです。

spectrum

耳そのものがフィルタの役割をするのでそれなりに聴こえる

今回のWAVファイルのサンプル例では1kHzのSIN波形でした。

この場合のノイズは2kHz,3kHz,4kHz….と1kHzの高調波がノイズとして聴こえます。
これが10kHzのSIN波だったらどうでしょう。10kHzの上の高調波は20kHzですからそもそも耳で聞こえません。(20kHzのモスキート音が聴こえるような人は別です)

実は耳というものは非常に急峻なフィルタ特性を有しており、かつ非常に狭い範囲の音しか聴くことができないのです。特に年齢を重ねるとその範囲はどんどん狭くなります。(ちなみに私は13kHzまでの音しか聴こえません) それが量子化ビットの低さを補う結果となっています。

※どの周波数まで聴こえるか調べたい方は、「モスキート音」で検索すれば沢山見つかります。

まとめ

おそらくBGMなどイージーリスニングの場合、ハイレゾ音源はおそらく不要です。だって、ほとんどの場合、量子化ビットが低いことにより発生するノイズ(一般的に量子化ノイズという)より部屋の中の雑音のほうが音が大きいのですから。

ただ、真剣に音楽を聴こうという場合はやはり、ハイレゾ音源は欲しいところです。 とくに、オーケストラのような大きい音から小さい音までの差が大きい音源では差が出易いので特におすすめです。 ただし、まとも録音のものに限るということは忘れないでくださいね。