槻ノ木隆の「BBっとWORDS」

バックナンバー

■	その116「DLNAの仕組み」 [2007/03/26]
■	その115「ドメインとActive Directory」 [2007/03/19]
■	その114「ワークグループができること」 [2007/03/12]
■	その113「WPSの仕組み」 [2007/03/05]
■	その112「Gopherの生い立ちと現在」 [2007/02/26]
■	その111「Wikiの使われ方」 [2007/02/19]
■	その110「文字コードとは」 [2007/02/05]
■	その109「IISの生い立ち」 [2007/01/29]
■	その108「NASの登場と一般への普及」 [2007/01/22]
■	その107「HomePNAのいろいろ」 [2007/01/15]
■	その106「Ogg Vorbisの成り立ち」 [2006/12/25]
■	その105「MIDIの原理とSMFの構造」 [2006/12/18]
■	その104「AIFFの構造」 [2006/12/11]
■	その103「WAVの構造と現状」 [2006/12/04]
■	その102「WMAの歴史」 [2006/11/27]
■	その101「AACの特徴」 [2006/11/20]
■	その100「MP3/MPEG Audioの仕組み」 [2006/11/13]
■	その99「HSDPAの仕組み」 [2006/11/06]
■	その98「H.264・MPEG-4 AVCの特徴」 [2006/10/30]
■	その97「IEEE 802.16e（モバイルWiMAX）の特徴」 [2006/10/23]
■	その96「TIFFの特徴」 [2006/10/16]
■	その95「PNGの現状と今後」 [2006/10/02]
■	その94「GIFの構造」 [2006/09/25]
■	その93「10GBASEの種類（2）」 [2006/09/11]
■	その92「10GBASEの種類」 [2006/09/04]
■	その91「GbEのいろいろ」 [2006/08/28]
■	その90「JPEGの特徴」 [2006/08/21]
■	その89「DivXの広がり」 [2006/08/07]
■	その88「MPEGの仕組み」 [2006/07/31]
■	その87「WMVのこれまで」 [2006/07/24]
■	その86「AVIの生い立ちとそのコーデック」 [2006/07/10]
■	その85「QuickTimeの変遷」 [2006/07/03]
■	その84「Realのこれまでと今後」 [2006/06/26]
■	その83「ShareとWinny」 [2006/06/19]
■	その82「DOCSISの仕組み」 [2006/06/12]
■	その81「SQLインジェクションの流れ」 [2006/06/05]
■	その80「RSSの動作」 [2006/05/29]
■	その79「Skypeの仕組み」 [2006/05/22]
■	その78「BitTorrentの特徴と今後」 [2006/05/15]
■	その77「Winnyの仕組みと現状」 [2006/05/08]
■	その76「WinMXの特徴」 [2006/04/24]
■	その75「Gnutellaの歴史と構造」 [2006/04/17]
■	その74「Napsterの歴史」 [2006/04/10]
■	その73「P2Pのいろいろ」 [2006/04/03]
■	その72「IEEE 802.11nの動向」 [2006/03/27]
■	その71「ActiveX Scriptingの動作」 [2006/03/20]
■	その70「Ajaxの仕組み」 [2006/03/13]
■	その69「DHTMLの動作」 [2006/03/06]
■	その68「Scriptの定義」 [2006/02/27]
■	その67「JavaScriptの仕組み」 [2006/02/20]
■	その66「Javaの動作」 [2006/02/13]
■	その65「RFCのプロセス」 [2006/02/06]
■	その64「ActiveX DocumentとActiveX Controlの違いと共通点」 [2006/01/30]
■	その63「ActiveX Controlの機能」 [2006/01/23]
■	その62「ActiveXを構成するもの」 [2006/01/16]
■	その61「Cookieの仕組みと用途」 [2005/12/26]
■	その60「malwareとその分類」 [2005/12/19]
■	その59「rootkitの動作」 [2005/12/12]
■	その58「CSSの役割」 [2005/12/05]
■	その57「HTMLの変遷」 [2005/11/28]
■	その56「PONとその種類」 [2005/11/21]
■	その55「FWAの仕組み」 [2005/11/14]
■	その54「DoSとDDoS」 [2005/11/07]
■	その53「SNMPとMIBの動作」 [2005/10/03]
■	その52「Jumbo Frameとフレームサイズ」 [2005/09/12]
■	その51「WPA2の仕組み」 [2005/09/05]
■	その50「WPAとWPA-PSKの違い」 [2005/08/29]
■	その49「WPAの仕組み」 [2005/08/22]
■	その48「WebDAVの動作」 [2005/08/08]
■	その47「OFDMAの仕組みとOFDMとの違い」 [2005/08/01]
■	その46「OFDMの仕組み」 [2005/07/25]
■	その45「WiMAXの特徴」 [2005/07/11]
■	その44「Wi-Fiの役割」 [2005/07/04]
■	その43「FTPの目的と動作」 [2005/06/27]
■	その42「UPnPの動作」 [2005/06/20]
■	その41「ネットマスクの仕組み」 [2005/06/13]
■	その40「ARPの機能」 [2005/06/06]
■	その39「DNSの原理」 [2005/05/30]
■	その38「デフォルトゲートウェイの役割」 [2005/05/23]
■	その37「MACアドレスの仕組み」 [2005/05/16]
■	その36「スイッチとその進化」 [2005/05/09]
■	その35「ルータによるメリット」 [2005/04/25]
■	その34「ブリッジの原理」 [2005/04/18]
■	その33「リピータの機能」 [2005/04/11]
■	その32「IPアドレスのクラス」 [2005/04/04]
■	その31「ブロードキャスト/マルチキャスト/ユニキャスト」 [2005/03/28]
■	その30「SMTP AUTHと認証の種類」 [2005/03/14]
■	その29「Submissionポートとスパムメール対策」 [2005/03/07]
■	その28「Outbound Port25 Blockingとは」 [2005/02/28]
■	その27「PGPの仕組み」 [2005/02/21]
■	その26「PKIと認証局」 [2005/02/14]
■	その25「公開鍵暗号方式とは」 [2005/02/07]
■	その24「共通鍵暗号とは」 [2005/01/31]
■	その23「SSHの仕組みと応用」 [2005/01/24]
■	その22「SSLの役割」 [2005/01/17]
■	その21「POP3とIMAP4の違い」 [2004/12/27]
■	その20「POP3の役割と機能」 [2004/12/20]
■	その19「SMTPの機能と問題点」 [2004/12/13]
■	その18「SPIとパケットフィルタリング」 [2004/12/06]
■	その17「LANの概念とその広がり」 [2004/11/29]
■	その16「SIPの役割」 [2004/11/15]
■	その15「プロキシの利用」 [2004/11/08]
■	その14「VoIPの仕組み」 [2004/11/01]
■	その13「イーサネットとは」 [2004/10/25]
■	その12「IP/TCP/UDP/ICMPとは」 [2004/10/18]
■	その11「DHCPの役割」 [2004/10/04]
■	その10「MIMOとは」 [2004/09/27]
■	その9「DMZとその効果」 [2004/09/13]
■	その8「ファイアウォールとは」 [2004/09/06]
■	その7「NATとNAPTの違いとIPマスカレード」 [2004/08/30]
■	その6「VPNとVPNパススルーの仕組み」 [2004/08/23]
■	その5「無線LANの問題とWEP」 [2004/08/09]
■	その4「IEEE 802.11a/b/gって何を意味しているの？」 [2004/08/02]
■	その3「ダイナミックDNSって？」 [2004/07/26]
■	その2「グローバルIPアドレスとプライベートIPアドレス」 [2004/07/12]
■	その1「PPPoEって何だろう？」 [2004/07/05]

その90「JPEGの特徴」

■ JPEGって何？

　その88でMPEGについて簡単に説明しましたが、今回はMPEGの基本ともなったJPEGについて説明したいと思います。

　JPEGとは、「Joint Photographic Experts Group」の略で、MPEGと同様に標準化団体の名前がそのまま規格の名前として使われています。JPEGの標準化作業は1986年に開始され、1992年に規格が定まります。ただ、最終的に「ISO10918-1」として標準化されたのは1994年のことです。

　これ以降も、さまざまな拡張が行なわれており、2001年には後継となるJPEG2000も標準化されましたが、両者の間に互換性がないこともあり、未だにJPEGが広く使われ、JPEG2000の普及は遅々として進まない状況にあります。

■ JPEGの特徴

　JPEGは、幅広い色空間をカバーし、また低解像度から高解像度まで利用できることを目指したフォーマットです。TIFFなどのフォーマットもすでに存在していましたが、これらはデータサイズが大きくなってしまうという欠点があり、このため効果的な圧縮方法をサポートすることが求められました。

　最終的にJPEGでは、複数の技法を組み合わせてデータサイズを削減する方法が採用されましたが、規格が1本化されるまでの間にはずいぶん紆余曲折があったようです。JPEGの中で核となる部分は「DCT（Discrete Cosine Transform:離散コサイン変換）」ですが、他に「VQ（Vector Quantization）」や「算術符号化（Arithmetic Codings）」なども有力な候補として出てきており、収拾にはずいぶん時間がかかったようです。

元画像

　さてそのJPEG、大きく分けて3つの方法で画像サイズを圧縮しています。

（1）色空間変換による間引き
　JPEGでは、よく使われるRGB（加色法）のほか、YMCK（減色法）、YUV/YCbCr（色差法）など数多くの表現方法をサポートしています。ここでは一例として、RGB→YUVの例をとってみたいと思います。

　RGBは画像の色をR（赤）/G（緑）/B（青）に分解してそれぞれ保持するというもので、一方のYUVはY（輝度）/U（青の差分）/V（赤の差分）に変換するというものです。このRGBとYUVは、ほぼ1:1で変換が可能になっています。

　それで、いま睡眠中のびびちゃんの写真を、まずYUVに変換します。RGBではRGBが各8ビット、一方、YUV444ではやはりYUVが各8ビットなので、このままではデータ量に差がありません。

　ところで、人間の目は輝度には敏感なのですが、色差はそれほど敏感ではありません。このため、例えば色差を半分（YUV422）にしても、ほとんど見分けがつきませんし、それほど高いクオリティでなければ4分の１（YUV411）に変換しても、それほど違和感を感じません。YUV422では元のデータと比較して3分の2、YUV411では2分の1までデータ量が減らせるため、これは効果的なデータ間引きの方法として利用されます。

図1：色空間変換による間引き

図2：DCTとQuantize

（2）DCT & Quantize

　一般的に人間の目は、細かいディテールはあまり目につきにくい、という特徴があります。例えば図2がその例になります。左上が元サイズで、そこから以下2分の1（縦、横ともに半分にした。データ量は4分の1）、4分の1（同16分の1）……と32分の1まで減らしていったものです。

　さすがに32分の1では原形を止めていませんが、それでも大雑把な輪郭はわかりますし、8分の1では寝ているびびちゃんだとちゃんと理解できます。この例は単純にピクセル数を減らしただけなので、必ずしも効率は良くないケースもあるのですが、もう少しちゃんと「ディテールを落とす」という処理を行なうのがこのDCTとQuantizeです。

　JPEGの場合、画像を8×8ピクセルのブロックに分解した上で、それぞれのブロックをDCTを使い空間周波数成分に変換します。空間周波数、というのは「その空間の細かさ」を示すものと考えれば良く、大雑把に言えば周波数が低いものは画像全体を、高いものは画像のディテールをそれぞれ示すものと考えれば良いでしょう。

　さて、図3はこれと量子化がどう絡むかというものです。まず左上は、まったく量子化を行なわないケースです。左が8×8ピクセルの画像、右がその成分を周波数別に並べたものです。

　量子化を行なわない場合、（変換誤差などを抜きにすれば）原理的にこの時点での画像の劣化はほとんどありません。ただし、周波数は無限に伸びてゆくので、適当なところでこれを打ち切っている関係で、現実には多少の劣化はあります。また、データ量も精度次第ですが、あまり減りません。ここで、この周波数成分を「量子化」します。要するに、適当な単位に四捨五入していく処理です。矢印が進むにつれて量子化を高くしており、それによってグラフの形状が次第に単調なものになっていきます。これにより画像はどんどん劣化していきますが、その反面、データ量も圧倒的に減っていくわけです。

図3：量子化の効果

（3）ハフマン符号化

　最後に登場するのがハフマン符号です。簡単に言えば「よく使われるデータを、サイズの小さな符号に割り当てることで全体のデータ量を減らす」という方法で、データをそのまま格納した場合と比較して数分の1サイズ（効率はデータにかなり依存します）に減らすことができます。

　以上の方法で、JPEGは圧倒的な圧縮率を確保することに成功しました。例えば、図2の元絵は800×600ピクセル、24ビットカラーですから、これを非圧縮で保存すると800×600×3＝1,440,000バイトが必要になります。

　しかし、実際のJPEG画像サイズは90,379バイト。たったの6.3％でしかないわけで、90％以上の圧縮に成功したわけです。JPEGの標準化がすんだのは、折りしもWWWが普及をはじめた時期にあたります。当時はまだ回線も細く、大きな画像ファイルを扱うのは大変に困難でした。そうしたこともあり、JPEGは爆発的に普及し、現在に至ります。

■ これからのJPEG

　そんなわけで標準的な画像フォーマットの地位を確立したJPEGですが、特許問題（あまり知られていませんが、JPEGには2種類の圧縮方法が標準化されており、片方は特許で保護されているため勝手に使えません）や、ブロックノイズ/モスキートノイズと呼ばれる独特のノイズ問題、あるいは、さらなる圧縮効果が望めないことなどの問題は標準化当時から問題視されていました。

　こうした問題に対して解決策を提示したのが、冒頭でも触れたJPEG2000です。JPEG2000は、さらなる画像圧縮の手段としてウェーブレット変換と呼ばれる技法を搭載し、JPEGと同様の画質であれば平均20％程度の圧縮率向上が期待できるとしました。

　しかし、このウェーブレット変換は従来のDCT方式と互換性がなく、アプリケーション側はJPEG対応に加えて、JPEG2000対応も行なわなければならなくなりました。実際Adobe Photoshopをはじめ、いくつかのアプリケーションはこのJPEG2000対応ルーチンを搭載しています。

　ただ、世の中に出ている大半のアプリケーションは、そもそもJPEGすら自前で処理していません。例えば、Windows系OSの場合、Internet Explorerで画像を表示するために、OSのカーネル（GDI）にJPEG処理ルーチンが含まれており、多くのアプリケーションはこれを呼び出して使っています。このため、OSなどがJPEG2000対応をしない限り、アプリケーション側でも対応できない、といった状態にあります。こうした背景もあって、今のところJPEGがJPEG2000などに置き換わる気配はなく、今後もJPEGは広く使われていくと思われます。

2006/08/21 10:55

槻ノ木隆
　国内某メーカーのネットワーク関係「エンジニア」から「元エンジニア」に限りなく近いところに流れてきてしまった。ここ２年ほどは、企画とか教育、営業に近いことばかりやっており、まもなく肩書きは「退役エンジニア」になると思われる。（イラスト：Mikebow）

Broadband Watch ホームページ