項目別バックナンバー[5]:技術情報:66
PCMの原理
PCM(パルス・コード・モジュレーション)信号は、連続的なアナログ信号を間欠的に分割して表現すると考える事が出来る。
その最初の段階では、アナログ信号を一定間隔に分割して、分割点のアナログ信号の振幅を取り出す、この作業を標本化(サンプリング)と呼ぶ。
音声か映像信号に於いては、分割した各グループの代表振幅を表す事になる。
標本化では1秒間に何回標本化するのかが、音声や画質を決める重要な要素になるので、これを標本化周波数と呼ぶ。
標本化周波数は高い程良いのだがデータ量が大きくなるので、実用的には必要な最小限が重要になる、最小限は音声や映像に含まれる最高周波数の2倍となる。
標本化とは、ある信号に対して全ての時刻の振幅が判らなくとも、一定の間隔で取り出した振幅値から原信号が再現出来る事を示している。取り出しの周期は原信号の周期の半分で十分とも示している。(染野・シャノンの定理)
量子化は、標本化したアナログ信号振幅を数値で表現する事である、実際はビット数で決まる量子化ステップで近似する事になる。
それ故に、標本化した信号振幅を正確に表す事は不可能になるが、ビット数を増やす事で限りなく正確な数値に近づいて行く。
量子化に於いて、量子化ステップが等間隔に目盛られている場合を直線量子化とよぶ、それに対して等間隔でない場合は非直線量子化と呼ばれる。
標本化・保持信号はPCM(パルス・コード・モジュレーション)信号であり、それでは元々のアナログ信号は階段波に変化している。
音声信号は16ビットで処理するので、2進数で表現できる最大値は65536になり、1ステップの精度は0.00152%になる、その精度の意味は量子化した場合の最大誤差は0.00152%どまりになる事だ。
入力のアナログ信号振幅が大きくなるとステップ間隔は段々と粗くなって行くので、入力が小さい時はきめ細かく量子化できるが、入力が大きくなると誤差が大きくなって行く事になる。
それは音声振幅が大きい時はきめ細かく表現しなくとも問題はない事になる。
PCM(パルス・コード・モジュレーション)では標本化を一定間隔で行うので完全には原アナログ信号波形を表せない、その時のアナログ信号と量子化信号との差を量子化誤差と呼ぶ、それは歪や雑音になる。
ステップ間隔を小さくして、量子化間隔を狭くすると量子化誤差は小さくなる、理論上は原アナログ信号の最高周波数の2倍以上あれば十分なので、量子化誤差はビット数によって少なく出来る事になる。
ただし映像信号では偽輪郭効果がある、その歪を除く方法にはディザーがある、ディザーでは符号化前に意識的にアナログ原信号に細かいランダムノイズを加える方法が取られる。
一方では、音声信号では信号レベルが非常に低いピアニシモや低音で歪を生じる現象がある。
アナログ信号を標本化する場合に標本化パルス幅が広い場合において原信号の高周波帯域が減衰する傾向がある、それはアパーチャー効果と呼ばれる。
標本化パルス幅は有限なのでこの影響は程度の差はあるが何かは生じる。
標本化された音声信号振幅は、量子化段階でビット数に応じた量子化値で表現される、その数値は2進符号で表現されるので、これを符号化(エンコード)と呼ぶ。
音声信号は20Hzから20kHzの交流信号なので、音声信号を量子化するには音声信号波形の正負について考える必要がある。
普通の2進数に対して音声信号振幅の0値を量子化範囲の中心になるようにずらす事になる、そのずらした分をオフセットと呼ぶ、その結果の音声に使用する2進数は、オフセットバイナリーコードと呼ぶ。
標本化周波数は44.1kHzなので、標本化間隔は約22μsになる、実際の作業としては、この時間内に標本化・量子化・符号化を行う必要がある、電気的には論理素子は数ns程度で動作し、メモリアクセスも100ns程度で十分に可能なので実現は十分可能になる。
2進コードの音声信号はローパスフィルターを通して必要以上の周波数成分を取り除くだけでもとのアナログ信号に戻せる、その作業を復号化(デコード)と呼ぶ。
予測符号化としてDPCM(差分PCM)があり、1950年にアメリカでテレビ電話の画像伝送の伝送帯域の圧縮用に開発された。
1965年にカラーテレビのテレビ信号の伝送帯域圧縮(ビット数の節約)への用途で使用されて、その後に音声PCMへも応用が広がった。
音声信号のPCMの場合もビット数を少なく出来れば記憶媒体の節約になるが、その時の前提は音質や画質の劣化が無視できる程度にとどまる事だ。
DPCMではある一定の時刻の信号振幅を予測して、予測値と入力値との差信号のみを量子化・符号化して伝送する。
予測にはすぐ前の数個の標本値をもとに差信号が最小になる予測を立てる。
差信号と予測値の和は量子化誤差を考えなければ入力信号と同じになる。
差信号の分布確率(予測値のはずれ具合)は差信号値が小さい部分に集中して、大きな外れは少ない。
だが、例えば音楽では、稀な急激な変化(突然な打楽器の音等)で誤差が起きやすい事があり、どこまで許容するかの問題となる。
アナログ信号で使われるフィルタにはローパスフィルタ(LPF)やハイパスフィルタ(HPF)などがあり、信号の周波数のどの部分を通過させるかで決まる、デジタルの分野でもデジタル信号のままで希望の通過帯域を実現できれば便利だ。
デジタルフィルタは、1標本化期間の遅延回路と係数乗算器の組合わせで作る、LPFでは遮断周波数以上の周波数帯域は通過しない、入力にパルスを入れると高周波成分が無くなったなまった波形になる。
入力にパルスを加える時に1標本ずつ遅延させて乗算器の係数を掛けてから加算してゆくと色々な特性のフィルタが作れる、それは音声の周波数特性を任意に変える事が出来る事になる。
デジタルフィルタの特徴は
・演算が正確で、温度や経年変化の少ない処理が可能。
・半導体技術進歩で、複雑なフィルタの作成が可能。
・IC技術で小型・低コスト化が可能。
・位相歪が少ないフィルタが可能。
CDの技術開発
デジタル信号はアナログ信号に対して利点は多い、逆としては欠点としての符号誤りの問題がある。
デジタル信号はその伝送時に1が0になったり、その逆になったりあるいは不明になる事がある。
この問題に対しての対処方法としては「誤り検出」と「誤り訂正」の課題がある。
一般にはデジタル化した信号に、誤り検出・訂正符号としてあらかじめに余分なビットを冗長ビットとして付加する事を行う、それによって、送信側でトータルでパターンを作り送信して、受信側でそのパターンと照合する事で誤りの有無を見つける。(例えば、偶数・奇数判定がある、ビット数をどちらかのパターンに冗長ビットを操作して揃える)
符号誤りの訂正は100%行う事は困難で僅かな訂正漏れが残る、これを誤り率と呼ぶ。
CDでは補間という操作を実行して、誤りで消失したサンプル値を前後のサンプル値の平均値で置き換えて、近似的に補正を行う。
誤り訂正符号を大きく分けると、ブロック符号とたたみ込み符号になる。
ブロック符号は、符号化・復号化がブロック単位で行われる、そこではkビットの情報に対して冗長ビットを加えてnビットのブロックになる事になる。
デジタル情報のビット誤りを自動的に訂正する誤り訂正符号はコンピュータや通信の信頼性向上に欠かせない技術として発達した、高密度メモリでは製造歩留まり改善に使われ、それがデジタル機器へ応用された。
たたみ込み符号は、いくつかのブロックを1つの単位として処理する、その中でブロック間で影響しあい連続mブロック間で相関性がある。
ブロック符号
ランダム誤り>ハミング符号・ゴーレイ
バースト誤り>ファィア符号・巡回符号
b-adjacent誤り訂正符号
たたみ込み符号
ランダム誤り>自己直交・ビタビ復号化・逐次復号化
バースト誤り>ハーゲルバーガー・ワイナーアッシュ・岩垂
デジタルオーディオに使用はブロック符号が多く、データ通信用はたたみ込み符号が多い
ハミングは情報理論から誤り訂正方法を考案した、そこからハミング符号と呼ばれる。
3ビットの符号の組み合わせは8種類あるので、正立方体の頂点に対応させる、そこでは各符号の距離は「頂点を結ぶ稜線の数」で定義して、それを「ハミング距離」と呼ぶ。
・ハミング距離が1の場合は1ビット誤りが生じてもその検出は出来ない。
・距離2では1ビットの誤りの検出が可能になる。
・距離3では1ビット誤り訂正、2ビット検出(向かいあった頂点)
・2K、K-1ビット誤り訂正、2K-1ビットまで検出可能。
ハミング符号は単一ビット誤りを訂正できるブロック符号であり、1ブロックについては1ビットの誤りを訂正する。
ハミング符号での誤り訂正は、情報4ビットに検査3ビットを加えて行う、任意の情報ビットに対して決められた方法で検査ビットを決めて付加する事で、誤り訂正が可能になる。
1982年にデジタルオーディオディスクとしてのCDが、ソニー・日立・日本コロンビアから発表された、その後に各社が参加した、その後普及が進み、1989年にソフトとしてのCDが90%を超えてLPレコードを上回って来た、
それは、1968年でのステレオ以来の革命と言われる。
アナログ技術でもSN比やひずみや周波数特性などは継続的に改良して来たが、それでも限界があると言われていた、デジタル技術の登場でアナログ技術の限界を超える事になった。
デジタルオーディオ全体では、デジタル技術としては、1972年にフィップスが光学式ビデオディスクを開発した、それを基にしてレーザーディスクが1977年にソニー・三菱・ティアック・日立・日本コロンビアが発表した。
その後の1979年にCDの原形のコンパクトディスクが発表された、1980年にフィップスとソニーがその規格を統一した事でCD時代に入った。
アナログ方式のレコードでは、渦巻き状に溝があり、針が溝をトレースする時に記録されている音声信号に応じて振動する、これがレコードの再生原理になった。
デジタル方式のCDでは、デジタル信号の0と1を記録して、その記録パターンにレーザー光を当てて反射光の変化から0と1の信号を読み取る。
この違いからハードウエアである録音工程や再生装置が本質的に異なる。
CDのディスクは直径12cmで片面60分以上録音可能で、それ以外に曲番・時間・曲数等の情報のユーザーズビットがある。
CDのディスクはレコードとは逆に内側から外側に時計回りに渦巻き状に音声データを記録する。
レーザー光線を反射するアルミ蒸着層にはビットまたはバンプと呼ぶ突起が作られ、音声データに従いビットの長さや間隔が変化する、反射板の表面は透明プラスチックで保護されている
ディスクの回転速度は一定でなく、線速度を一定にする、従い内周から外周に移動するとディスクの回転数は少なくなる。
CDのディスクの製造は基本はアナログレコードと似るが、PCM録音を行う事とマスター製造のカッティングにはレーザー光線を使用する事が異なる。
音声データは1と0の信号であり、誤り符号を使って再生時の符号誤りを訂正し、変調を掛けて記録する。
CDのカッティングはアナログレコードよりも高い精度が必要で、CDのトラック間隔は1.6ミクロンでレコードの1/50なので複雑で高価な装置が必要だ。
レーザーカッティングしてビットを作り、そこに銀メッキを行いさらにその上にニッケル電鋳メッキを行ってメタルマスターを製作する。
さらにマスターから数枚のメタルマザーを作り予備にする。
メタルマザーの上にニッケル電鋳メッキを行いスタンバ―を作る。
透明プラスチックを加熱して柔らかくしてその上にスタンバ―を押して型を取り、次にその透明プラスチックに反射面用のアルミ蒸着を行う、その上にプラスチックの保護膜を形成して完成する。