圧縮音源の圧縮ノイズのイメージと写真の相関性

著者は音楽関連でハイレゾ周辺の情報を趣味でも追いかけていて、音楽自体もパソコンを母艦にUSB DAC内蔵アンプを駆動して楽しんでいます。

ついでにこちらも趣味で写真を楽しんでいて、ハイエンドではありませんがそこそこ上級ユーザーに位置づけられるポジションにいると思います。

一見、全く関係がない2つのジャンルですが、圧縮音源の圧縮による音再現の限界のいくつかは写真でのJPEG形式での保存の圧縮ノイズのイメージで捉えると、個人的にはストンと納得がいきイメージがうまく理解できることに気づきましまた。

このあたり理屈ではなくあくまでイメージですが、圧縮音源の限界の部分の理解の一助になれるかどうか、ちょっとまとめてみます。

レベルの大きな音がたくさん並ぶ楽曲

圧縮音源を聴いていて個人的に一番よく分る限界のポイントは、ポップスやロック系の音楽でレベルが大きく主張の強い音がいくつか並び立つようなポイントです。

それぞれの強い音同士の輪郭が相互に干渉してザラザラするような感じになります。

耳の聴感特性、おおざっぱには大きな音と一緒に鳴っているボリュームの小さな音源は聞き取りにくい、を使った圧縮を行なっている方式では、この圧縮ノイズが出やすい感じです。

ちょっと見にくいかもしれませんが、画像にすると次のような感じ。

JPEG形式で記録するときに圧縮率を上げると被写体の輪郭周辺にジワジワ、ザラザラした独特のノイズが出て画像の品位が落ちます。

上の画像では3つの四角形が重なる付近を拡大してみるとノイズが浮き上がってきます。

圧縮音源では主張の強い、一般的にはボリュームが大きな音は情報量を削って圧縮率を稼ぐことが難しいのでしょう。このようなキレイに圧縮しきれない条件になると、この画像の輪郭周辺のような雰囲気で音の輪郭が崩れて聞える音になる、ように思います。

大編成のオーケストラはスマートフォンで撮った夜景

スマートフォンのカメラは元々イメージセンサー自体の感度が高くないので、夜景などを撮る時には無理に感度を引き上げたことで発生するザラザラしたノイズを消すためにかなり強烈にノイズリダクションをかけています。

この副作用で、元々は被写体にあったはずの細かなテクスチャーなどがディテイルが塗りつぶされて、のっぺりした油絵チックなタッチの写真に仕上がりがちです。

同じように圧縮音源の方では、オーケストラのように音の出るポイントがたくさんある楽曲に高い圧縮をかけようとすると、音源のフォーマットによっては「スマートフォンのカメラで撮った夜景写真」のような平板なイメージに聞えることがあります。

楽曲に含まれる情報量が多すぎて音の細かな表現を残した圧縮ができず、圧縮の際に荒れる部分を目立たなくするためにもノイズをやや強引に強く削除。その際に本当は必要な音楽の細かなニュアンスも一緒に塗りつぶされてしまった、そんな感じですね。

非常に抑揚が失われてしまった平板な音に聞えます。

音の定位もレンズのシャープさ、に近い印象

上の二つの例ほどピッタリくるイメージがある訳ではありませんが、音源の定位の仕方はカメラのレンズの描写性能、像のシャープさをイメージすると想像しやすい気がします。

また、キレイな音の余韻や残響は写真ならば美しいボケ味でしょうか。こちらもイメージする際の相関性はあまり高くはないのですが、雰囲気は伝えられる気がします。

元々音楽は目に見えないもので、人間という生き物は外界の様子を捉えるのには視覚情報に大きく頼った存在です。ですので音楽の聞え方を言葉にするのは実はとても難しいのではないかと思います。

この辺り、他のイメージに上手く置き換えて説明できれば、オーディオに必要な要素もいろいろともっとわかりやすく伝えられそうな気がしています。