2014年も四半期に入ってきた最近、耳にする機会が多くなってきました「ハイレゾ」という言葉。
既にそれが「ハイレゾリューションオーディオ」の事で、普通よりも良い音のオーディオを指すのだとご存じの方は多いでしょうが、実際にその音を聴いたことが無かったり、日頃からオーディオ機器には別段お金を掛けていない人にとっては、実際のところ一般的なオーディオとはどのように違うのかと問われても答えられないのではないでしょうか。

このブログを日頃よりご覧頂いている方は、写真およびデジタルカメラに詳しい方も多いでしょうから、写真に例えたならば理解しやすいのではないか。そう思いまして、このブログで「ハイレゾ」を解説するに当たり、写真に置き換えたならばどのような違いなのかを表してみようと思いました。
得てして音の良し悪しをブログで伝えるのは、個人的な主観から拾い上げた感覚を文章に起こす他無く、伝わりきらないばかりでなく、感覚の違いが印象の違いとして表されてしまうので、ブログでの評価が自分の求めている方向性に合致していたから高価な投資を行って買ってみたら、どうもしっくりこない残念な結果を産んでしまうかもしれません。
もったいないですよね。ブログのレビューをする人も悪気があってやってるんじゃないんですから。ステマの場合はさておき。

なので、ソムリエよろしく事象に例えた曖昧な言葉を使うよりかも、写真として置き換えた場合を示すことにします。写真の画像であれば画面に現物を表示するわけですから、個人の持つ感覚の違いと文章表現による二重の変換が入らず、より信頼の置ける結果が示せると思うのです。

よって今回は、現代の音楽界を代表する存在の一人となっている 《電子の歌姫》 さんの力をお借りして、ハイレゾを解説させて頂く次第です。
まずはいきなりですが、ハイレゾの画像をご覧頂くことにします。

HIRES_基準画像ダヨー
【 ハイレゾ 】 のイメージ画像

美しいミクさん……いえ、ミクダヨーさんのご尊顔ですね。
拡大しても1280ピクセルの画像ですので、果たしてハイレゾと言って良いのかは議論の余地がありそうですが、あくまで参考にするための画像ですので細かいことは気にしないでほしいのです。ほら、1280×720の映像はハイビジョンって言いますし。
写真としては、いちおうそれなりに良く写るデジタル一眼カメラで撮影した写真を、クオリティを低下させないレベルで出力したものです。画像クリックで拡大してもらうと判りやすいですが、細かい文字形状も確認できます。
こちらをハイレゾのイメージ画像としますので、脳裏にしっかりと焼き付けてください。ミクダヨーさんが夢に出てきてくれそうなくらいにじっくりと。


HIRES_高圧縮
【 音楽CD 】 のイメージ画像

こちらの画像は「音楽CD」のイメージ画像です。いわゆるお店で購入する楽曲の収録されたCDですね。
一見するとハイレゾと差はありませんが、良く目を凝らすと違いがわかります。
文字の輪郭が少し曖昧になって、読み取りにくい部分があるでしょう。細かい情報成分が失われてしまっているのです。
一般的な画像加工ソフトで、元画像を一度縮小して、再度拡大した状態と思ってもらえれば理解しやすいと思います。再度拡大した同じピクセル数で判断するのはこの画像もそうですが、視聴環境でも最終的な出力(スピーカーやヘッドフォン)では同じ仕様となるので、同じピクセルと見なしたほうが性格でしょう。
つまり音楽CDに収録されている音は、ハイレゾに比べると「情報密度が少ない」のです。
数字で言うと、ハイレゾの場合は大抵が「96KHz/24bit」以上の情報量を持ちます。対して音楽CDは「44.1KHz/16bit」と少ない数値です。
周波数はちょっと捉えづらいですが、bitというのが具体的な情報量だとは皆さんご存知でしょう。画像で置き換えると、16bitは「High Color」で6万5536(2の16乗)の色数を持ち、24bitは「True Color」で1677万7216(2の24乗)の色数を持ちます。その差、実に256倍。16から8を加えただけで大した違いが無いと思いきや、相当な違いがあるのです。
なので、音楽CDを画像に例えると、グラデーションがなだらかではなくなり、コントラストが強い「電子的な印象の強い」音となるのです。逆に言えば、ハイレゾは「アナログに近い柔らかで繊細な音」になります。

ちなみに、レコードやカセットテープなどのアナログオーディオが古い時代の技術で、CDや圧縮音楽などのデジタルオーディオが新しい技術のため、中には「アナログはデジタルよりも劣る」と決めつけている人がいるようですが、決してそんなことはありません。アナログはデジタルに比べてノイズの排除による信号訂正が難しいためノイズの影響を受けると知覚しやすくなりますが、徹底的にノイズの発生と混入を排除したアナログ機材ならばデジタルに劣るようなこともありませんし、そもそも最終的な出力と、人間の知覚できる情報はアナログですから、出力されるまでに訂正されて必要な音情報までもが削ぎ落とされたデジタル信号の方が劣る場合も大いにあり得ます。そこが生まれた時からデジタルオーディオの世代が勘違いしやすいところなので注意しましょう。
まあ、ごく一部の古参オーディオマニアの方々は、頭からそれと決めつけてデジタル音楽を否定する風潮もあるので、お互い様とも言えますが。

ちなみに、音楽CDと言っても「元祖ハイレゾ音源」とも言える「スーパーオーディオCD(SACD)」があり、こちらはハイレゾですので、あくまでここで示した音楽CDは一般的な仕様の物であることを前提とします。こちらは後ほど「DSD」を紹介する際に改めて記述します。


HIRES_ダイナミックレンジ狭い
【 圧縮音源 】 のイメージ画像1

続きましては、現在最も多く利用されているであろう「圧縮音源」のイメージ画像です。
圧縮音源とは、PCやiPodなどで音楽を聴く場合に主に利用されている、MP3やAACなどの事を指します。
圧縮と言っても、画像におけるJPEGのように「ノイズ」として感知されることはほぼありません。MP3はJPEGの動画版であるMPEGの技術のひとつなので特性は似ていますが、画像はブロックノイズやモスキートノイズが「ノイズ」として感知されますが、音では「音の情報が減った」程度にしか感知できず、音のノイズである「ホワイトノイズ」などのようにザラザラとしたものにはなりません。ノイズは後述しますので、こちらのイメージについて解説します。

圧縮音源(※非可逆圧縮の場合)が一体何を圧縮してサイズを縮めているのか。それは「人間が感知しにくい帯域の音」と「平滑化」と「グループ化」です。
圧縮音源と言っても「可逆圧縮(ロスレス)」と言われる、先述の「感知しにくい帯域の音」と「平滑化」は行わず、グループ化(圧縮アルゴリズムによる縮小アーカイブ)のみを行ない、音質を低下させない物もあり、他でもないハイレゾ音源の配信として主に利用されているのが「FLAC」という可逆圧縮形式ですので、圧縮音源と言えば全て音質が低下するわけではありませんのでご注意ください。大変ややこしいです。

非可逆圧縮形式の場合、と前置きをする事になりますが、圧縮のために犠牲となったのは「ダイナミックレンジ」です。写真用語でいうところの「ラティチュード」ですね。光量が足りないところの「黒つぶれ」や、光量が多すぎるところの「白飛び」が発生しています。ただ、人間の耳に感知できない “とされる” 周波数帯(20KHz以上)を削る事が多く、その周波数以上に存在するデータを切り落とすためサイズが縮小できます。
また、音の波形を平滑化して「ゆらぎ」を少なくし、デジタルとして扱いやすく縮小しやすい連続性のあるデータにすることで圧縮効率を上げ、さらにサイズを縮小しています。そのため、ピアノやアコースティックギターなどの生音が、電子楽器のように角張った音になり、艶が無くなったように感じます。イメージ画像にのようにコントラストが高く明暗がハッキリとしたデータは、デジタルでサイズ縮小するにはうってつけです。
そのため、最近一般的になっている電子音楽を伴奏とした楽曲(近年のアニソンに多い印象)ならば、非可逆圧縮による音質低下の影響は大きくないでしょう。当然ながら今のデジタル世代にはデジタルの手法が都合良いのです。それに、デジタル音に耳が慣れていると、コントラストの高い画像や音の方が、良いと感じる場合も多いでしょう。MP3はハイレゾと比べて「誰もが悪いと感じる」のではありません。音や楽曲との相性はもちろんありますが、最終的には好みかどうかが評価を決める最大要因ですね。


HIRES_モザイク
【 圧縮音源 】 のイメージ画像2

先ほどは圧縮音源を表すのにダイナミックレンジが狭い画像をイメージとして掲示しましたが、圧縮の印象により合致するのは、こちらのイメージ画像2のようなものでしょう。単純に言えば「モザイク」画像です。
一度縮小したものを拡大して見ても同じ結果です。つまり、情報量を削ったということですね。
同じようなことを上でも書きました。そう、音楽CDですね。「ハイレゾ」と比べると「音楽CD」の情報量が少ないため、情報量を減らした画像にしましたが、実際には無圧縮の音楽CDや可逆圧縮のFLACなども、デジタル音声形式(PCM:パルス符号変調)に標本化する上では大なり小なり「平滑化」は必ず行われます。ハイレゾは音の情報量が極めて多いため平滑化されたデータの数が多く、実際の音に近いニュアンスで聴こえます。音楽CDはハイレゾに比べると情報量が少ないため平滑さが感知しやすくなり、圧縮音源はさらに情報量が少ないために多くの環境で感知しやすくなります。
先ほど24bitと16bitの違いは取り上げましたが、圧縮音源の場合は情報量をビットレートで表すのが一般的なので、ここではビットレートで記述しますと、音楽CDは規格値として約1411Kbpsで、圧縮音源では128Kbpsが多く使われています。10倍以上の差が有りますね。圧縮音源はデコードにより実質これよりも大きなビットレートで再生されますので実質的にはそこまで差がなかったりしますが、ややこしいので省略します。

こちらの画像よりもさらにイメージしやすいのは、3D画像でよく知られるポリゴンデータかもしれません。ポリゴンデータは座標の数が多くなるにつれ、滑らかでリアルになります。人物の3Dデータが近年のコンピュータ演算能力の向上により、本物と見紛うほどに滑らかな形状となっているのは、座標の数とテクスチャ等の情報が格段に増えた事が最大要因ですが、ハイレゾも同じことが言えます。単純なことですが、情報量が多いほど滑らかになり、デジタル感が薄れてリアルになります。つまり、ハイレゾは生の楽器の音に近づいているのです。ハイレゾに全て生の楽器を扱うクラシックやジャズの音源が多いのはそのためです。高価で高尚な趣味だから、なんて偏見に満ちた理由ばかりではないのです。


HIRES_ノイズ
【 PCオンボード出力 】 のイメージ画像

これは多分に偏見を含むものなので参考までとして頂きたいのですが、PCに最初から備わっているサウンドチップから発生する音は、PC内部の各種回路や電源から到来するノイズに晒されており、分解能も低いため、こちらの参考画像のように霞がかった、ハッキリしないモヤモヤする音になる印象です。
もちろんソフトウェア(プレイヤーからオーディオドライバまで)で生成されるデジタルデータは基本的にビットパーフェクトで劣化がなく、ノイズの混入などする余地はないのですが、オーディオドライバとOSのカーネルから物理的な電子回路に出力され、D/Aコンバートなどの処理を経るうちにノイズが入ってきて、さらに低品質なアンプだと増幅時にもノイズが増えて、低品質な音に成り果ててしまいます。
なので、ドライバの時点で高品質な回路へ繋ぎ、PC内のノイズに晒されたり低品質な回路を通る前に拾い上げてやることで、PCで高音質のリスニングが楽しめるのです。


HIRES_DSD
【 DSDハイレゾ音声 】 のイメージ画像

最後に、ハイレゾオーディオの代表であり、現状で最も「ピュアオーディオ」のデジタル符号化形式とされる「DSD」について記述します。
イメージ画像が雑コラかつこっち見んな状態なので、とても刺激的なものとなってしまったことは謝りたいと思います。ごめんなさい。ミクダヨーさんの存在感が異常なのが悪いんです。
DSDとは「アナログの音(波形)に近似させるための技術」で、現在最も優れているとされる「ΔΣ変調」を利用したデジタル音声技術で、上記してきたデジタル音声形式が「PCM」形式であるのに対し、DSDは「PDM」形式です。とは言っても、自分自身がこの技術的仕様について詳しく無いし難解ですので、興味がある方は各々独自にお調べください。少なくとも、ハイレゾの音楽を趣味として一方的に享受するだけならば理解する必要はないと思います。
情報量は音楽CDの64倍ですので、それだけ滑らかな音になり、より一層生の音に近くなるとのことです。
DSDはハイレゾが広く一般的に知られるようになり、PCでの視聴環境も整ってきた最近になって出てきた方式ではなく、先述した「スーパーオーディオCD(SACD)」に採用された方式なので既に15年以上の実績が有ります。

イメージ画像では、ねんどろいどの写真の上に、ミクダヨーさんご本人の生写真をコラージュして、リアルさを表現してみました。FLACなどのハイレゾ音源はねんどろいどフォーマットに変換された後のミクダヨーさんなのに対して、DSDはミクダヨーさんそのものを高次元に再現した写真データみたいな。
技術に詳しい方からすると、そう一言では片付けられないようですが、ここでは方向性が掴めれば良いと思いますのでツッコまないでください。
ワタクシはミクダヨーさんにツッコミを入れる勇気はありませんので。


さて、長々と解説してきましたが、少しでもハイレゾやら圧縮音源やらの違いを理解するお役に立てましたでしょうか?
もちろん画像データと音データは捉え方が異なりますので、細かい差異はいくらでもあるでしょう。ワタクシ自身の知識不足により正確に表せていないところもあるかもしれません。
それでも、導入するにあたってその優位性や価値を判断する材料となるのであれば、と思っている次第です。

ぜひ、これらのミクダヨーさん画像を夜の営みにもご活用頂ければ幸甚です。