• 締切済み

データの圧縮って具体的にどうなるの?

動画ファイルなど、容量の大きなデータを抱えると圧縮することが多いですが、まず、圧縮ってコンピュータ側ではどういう原理でしてるのでしょうか? 単純にそれぞれの要素のデータ量を平均的に落とす? それとももっと高度に「この部分は多めに落としてもいいな。あっ、ここは重要だから劣化なしの方がいいな」など判断してるのでしょうか? また、圧縮した結果、人間が視聴する際にはどういった影響があるのでしょうか? 画質が落ちる(粗くなる)? 音質が落ちる? いろんな面でちょっとずつ落とす? そもそも人間の目でその差は認識できる? そのへんのこと詳しいかた教えてください。

みんなの回答

  • tama80ji
  • ベストアンサー率71% (2188/3068)
回答No.4

はじめまして。 他の圧縮に関しては説明がなされているので、動画や音声に関してのみ。 現実はアナログで、その階調は無限です。 が、それをそのままデジタル化したのではそれこそ膨大なデータ量となります。 そこでデータを圧縮します。 動画や静止画は基本的にRGB各色を8ビットずつ、計24ビットで表現する。Y、Cb、Crを各8ビット、計24ビットで表現するなど、この時点ですでに圧縮されています。 実はD1、D2、など放送用のビデオ(SD)でもすでに圧縮はされています。ただその度合が家庭用に比べると低いだけです。 家庭用で無圧縮の代表格のDV方式のビデオもありますが、これですら圧縮されています。主に圧縮の度合いが高いのは色帯域です。 これは人間の視覚能力の限界から、白黒の階調には敏感だけど色に関しては鈍感と言う点を応用し、色の帯域制限をしています。 アナログビデオ(VHSなど)でも、色帯域はかなり制限しています。 またDV方式の場合は解像度こそ352×240程度ですが、フレーム単位、つまり1枚1枚(352×240のブロックでデータの変化を監視)で圧縮しているので、データ量は大きくなります。その代わり動きへの適応性は高い利点があります。 DV方式が余りにも容量が大きいので開発されたのがMPEGです。MPEG1から始まり、MPEG2、MPEG4と変遷(圧縮効率の進化)しましたが、基本はフレーム相関の圧縮で15フレーム単位で動いていない部分は同じものと判断しデータ量を削減しています。なのでデータ量が増えるのは動いている部分だけとなります。欠点は15フレーム相関なので、それに準じていない動きには追従し切れず、画像破綻が発生しやすくなります。 当初はCBR(コンスタント・ビットレート)でスタートしたMPEGですが、急激な動きの変化に画像破綻しやすい欠点を回避するためにVBR(バリアブル・ビットレート)が採用されました。 MPEGは動いていない画面ではデータ量はかなり抑えられます。それこそ2Mbpsでも充分にキレイな絵を表現します。ところが動画は単一な映像を表示し続けるわけでなく、刻一刻と変化します。その変化している部分だけデータの転送量を高める、瞬間的に10Mbps近くまで割り当てる方式です(DVDの場合)。 ビデオCDはMPEG1、DVDはMPEG2PS、デジタル放送はMPEG2TS、WMVやDivx、Xvid、H264/AVCは全てMPEG4系列のフォーマットですので同様の弱点を抱えています。 が、大抵はVBRとノイズリダクションの併用などで誤魔化せます。 人間の視覚の特性として静止画よりも動画に関しては感覚が鈍るので、多少の破綻は認識できなかったりもします。 このように動画の圧縮に関しては人間の視覚特性を利用して、各部でかなりの圧縮をかけています。 音楽の圧縮も同様で人間の聴覚特性を利用し、マスキング(大きな音の前では小さな音は隠される)効果などを応用し、小さな音のデータ量を減らしたり、0にしたり、帯域制限でデータ量を削減して圧縮しています。 まぁCDの音声でも当時の技術的限界から、16ビットサンプリング周波数44.1KHz、帯域は0~20KHzの制限せざるを得なかったと言うのもあります。つまりこれでも自然の音を圧縮していると言うことです。 そのためにDVD-AUDIOやSACDが出たのですが、世の中の趨勢は低圧縮高音質大容量よりも、高圧縮小容量になったので結局普及しないとの状況となりました。 まぁ、これでもかなり大雑把な説明ですけど。

すると、全ての回答が全文表示されます。
  • Tasuke22
  • ベストアンサー率33% (1799/5383)
回答No.3

動画ファイルの圧縮の場合、正にデータを削り、画質、 音質ともに劣化し、圧縮したファイルから元に戻すこ とは出来ません。 人間の目で認識できるレベルの劣化かどうかは状況に よります。 極端な例えでは、VGA画質のモニターでハイビジョンの 映像を見ていたとし、ハイビジョンのファイルをVGAに 圧縮しても論理的には劣化がないと言えます。 ただ、ハイビジョンをVGAで見る場合と、ハイビジョンか らVGAに圧縮(これをエンコードといいます)した場合は エンコーダの能力により、画像が良くなる場合もありえます。 勿論、ハイビジョンのモニタで見た場合は画質は劣化します。 VGAのモニタで、VGA以下のデータ量に圧縮すると、画質の 劣化は否めません。よくあるパターンは、滑らかなカーブと かが四角いブロックに表示されます。荒さが目立ってきます。 そのような、映像の点の数を減らす方法や、1秒あたりのコマ の数を減らす方法があります。 なので、画質に関してはデータ量だけではなくてモニタの 能力との兼ね合いが重要になります。 音楽の圧縮に対する感受性は、映像のように機器の能力の問 題もありますが、個人によって大きく感想が異なります。 ただ、動画ファイルの場合、神経の多くが目に集中している ようで、音楽だけだったら我慢できない音質でも違和感なく 聞けるケースが多いです。 音楽だけですと、個人で一般的に入手できる最高音質はCDで すので、これを基準に話す場合が多いです。 CDが1141Kbpsというデータ量です。それに対して、128Kbps から384Kbpsまでの間でCDの音質と変わらないという人は 結構います。 私の知っている50過ぎの女性で歌謡曲専門の人が3~4年前に ケータイの48Kbpsでいい音だ、と言っていましたが、今では 安物のCDプレイヤーから音を出しているにも関わらず、全て のKbpsの違いが聞き分けられるようになり、CD音質で無ければ 不満を言うようになりました。彼女はKbpsとかの意味を理解 していません。耳だけで言っています。 訓練したら聞き分けが出来るようになるのだと思います。

すると、全ての回答が全文表示されます。
  • shintaro-2
  • ベストアンサー率36% (2266/6245)
回答No.2

一般的なデータ圧縮では、データを符号化することにより圧縮します。 例えば、fax他で利用されるランレンの場合 2値化された符号の1の連続する数をデータとして保存し圧縮します。 01110011だと、最初の0は0として、後は1の連続する数を3,0,0,2とします。 もし、001とか011とか特定のパターンが数多く出てくるのであれば、それを符号化して送ります。3ビットのデータを2ビットの符号に置き換えられるのであれば、最高2/3(当然符号化できないものもあるし、符号が何を示すかを情報として伝える必要がある)の圧縮率です。 もっと長いnビットデータの連続を、mビットの符号化にすれば、最高m/nの圧縮率になります。 >単純にそれぞれの要素のデータ量を平均的に落とす? >それとももっと高度に「この部分は多めに落としてもいいな。あっ、 ここは重要だから劣化なしの方がいいな」など判断してるのでしょうか? 2パターンあって、 元に戻せるものが、可逆圧縮 元に戻せないのが、不可逆圧縮です。 イメージされたのは、不可逆圧縮になります。 Woindows Mediaplayerでも、選択が可能です。 不可逆圧縮としては、JPEG,音楽系の各種符号化などが有名です。 JPEGの場合は、例えば8*8ドットの画像を単位に演算して、目立たない高周波成分を欠落させます。音楽の場合も耳に聞こえない周波数成分とか、小さな音とかを欠落させます。 LZHとか、LHAなどのファイル系の圧縮は、元のファイルが得られないと困るので、可逆圧縮です。

すると、全ての回答が全文表示されます。
回答No.1

基本的に、データ圧縮とは元のデータを別の符号に変換することにより全体のバイト数を減らす方法です。 その際、元データが持つ冗長性(繰り返し性)、法則性(予測可能性)、不要性という性質を上手に利用してデータを圧縮します.

参考URL:
http://www.snap-tck.com/room03/c02/comp/comp01.html#comp12
すると、全ての回答が全文表示されます。

関連するQ&A