Broadband Watch logo
バックナンバー

その116「DLNAの仕組み」
[2007/03/26]
その115「ドメインとActive Directory」
[2007/03/19]
その114「ワークグループができること」
[2007/03/12]
その113「WPSの仕組み」
[2007/03/05]
その112「Gopherの生い立ちと現在」
[2007/02/26]
その111「Wikiの使われ方」
[2007/02/19]
その110「文字コードとは」
[2007/02/05]
その109「IISの生い立ち」
[2007/01/29]
その108「NASの登場と一般への普及」
[2007/01/22]
その107「HomePNAのいろいろ」
[2007/01/15]
その106「Ogg Vorbisの成り立ち」
[2006/12/25]
その105「MIDIの原理とSMFの構造」
[2006/12/18]
その104「AIFFの構造」
[2006/12/11]
その103「WAVの構造と現状」
[2006/12/04]
その102「WMAの歴史」
[2006/11/27]
その101「AACの特徴」
[2006/11/20]
その100「MP3/MPEG Audioの仕組み」
[2006/11/13]
その99「HSDPAの仕組み」
[2006/11/06]
その98「H.264・MPEG-4 AVCの特徴」
[2006/10/30]
その97「IEEE 802.16e(モバイルWiMAX)の特徴」
[2006/10/23]
その96「TIFFの特徴」
[2006/10/16]
その95「PNGの現状と今後」
[2006/10/02]
その94「GIFの構造」
[2006/09/25]
その93「10GBASEの種類(2)」
[2006/09/11]
その92「10GBASEの種類」
[2006/09/04]
その91「GbEのいろいろ」
[2006/08/28]
その90「JPEGの特徴」
[2006/08/21]
その89「DivXの広がり」
[2006/08/07]
その88「MPEGの仕組み」
[2006/07/31]
その87「WMVのこれまで」
[2006/07/24]
その86「AVIの生い立ちとそのコーデック」
[2006/07/10]
その85「QuickTimeの変遷」
[2006/07/03]
その84「Realのこれまでと今後」
[2006/06/26]
その83「ShareとWinny」
[2006/06/19]
その82「DOCSISの仕組み」
[2006/06/12]
その81「SQLインジェクションの流れ」
[2006/06/05]
その80「RSSの動作」
[2006/05/29]
その79「Skypeの仕組み」
[2006/05/22]
その78「BitTorrentの特徴と今後」
[2006/05/15]
その77「Winnyの仕組みと現状」
[2006/05/08]
その76「WinMXの特徴」
[2006/04/24]
その75「Gnutellaの歴史と構造」
[2006/04/17]
その74「Napsterの歴史」
[2006/04/10]
その73「P2Pのいろいろ」
[2006/04/03]
その72「IEEE 802.11nの動向」
[2006/03/27]
その71「ActiveX Scriptingの動作」
[2006/03/20]
その70「Ajaxの仕組み」
[2006/03/13]
その69「DHTMLの動作」
[2006/03/06]
その68「Scriptの定義」
[2006/02/27]
その67「JavaScriptの仕組み」
[2006/02/20]
その66「Javaの動作」
[2006/02/13]
その65「RFCのプロセス」
[2006/02/06]
その64「ActiveX DocumentとActiveX Controlの違いと共通点」
[2006/01/30]
その63「ActiveX Controlの機能」
[2006/01/23]
その62「ActiveXを構成するもの」
[2006/01/16]
その61「Cookieの仕組みと用途」
[2005/12/26]
その60「malwareとその分類」
[2005/12/19]
その59「rootkitの動作」
[2005/12/12]
その58「CSSの役割」
[2005/12/05]
その57「HTMLの変遷」
[2005/11/28]
その56「PONとその種類」
[2005/11/21]
その55「FWAの仕組み」
[2005/11/14]
その54「DoSとDDoS」
[2005/11/07]
その53「SNMPとMIBの動作」
[2005/10/03]
その52「Jumbo Frameとフレームサイズ」
[2005/09/12]
その51「WPA2の仕組み」
[2005/09/05]
その50「WPAとWPA-PSKの違い」
[2005/08/29]
その49「WPAの仕組み」
[2005/08/22]
その48「WebDAVの動作」
[2005/08/08]
その47「OFDMAの仕組みとOFDMとの違い」
[2005/08/01]
その46「OFDMの仕組み」
[2005/07/25]
その45「WiMAXの特徴」
[2005/07/11]
その44「Wi-Fiの役割」
[2005/07/04]
その43「FTPの目的と動作」
[2005/06/27]
その42「UPnPの動作」
[2005/06/20]
その41「ネットマスクの仕組み」
[2005/06/13]
その40「ARPの機能」
[2005/06/06]
その39「DNSの原理」
[2005/05/30]
その38「デフォルトゲートウェイの役割」
[2005/05/23]
その37「MACアドレスの仕組み」
[2005/05/16]
その36「スイッチとその進化」
[2005/05/09]
その35「ルータによるメリット」
[2005/04/25]
その34「ブリッジの原理」
[2005/04/18]
その33「リピータの機能」
[2005/04/11]
その32「IPアドレスのクラス」
[2005/04/04]
その31「ブロードキャスト/マルチキャスト/ユニキャスト」
[2005/03/28]
その30「SMTP AUTHと認証の種類」
[2005/03/14]
その29「Submissionポートとスパムメール対策」
[2005/03/07]
その28「Outbound Port25 Blockingとは」
[2005/02/28]
その27「PGPの仕組み」
[2005/02/21]
その26「PKIと認証局」
[2005/02/14]
その25「公開鍵暗号方式とは」
[2005/02/07]
その24「共通鍵暗号とは」
[2005/01/31]
その23「SSHの仕組みと応用」
[2005/01/24]
その22「SSLの役割」
[2005/01/17]
その21「POP3とIMAP4の違い」
[2004/12/27]
その20「POP3の役割と機能」
[2004/12/20]
その19「SMTPの機能と問題点」
[2004/12/13]
その18「SPIとパケットフィルタリング」
[2004/12/06]
その17「LANの概念とその広がり」
[2004/11/29]
その16「SIPの役割」
[2004/11/15]
その15「プロキシの利用」
[2004/11/08]
その14「VoIPの仕組み」
[2004/11/01]
その13「イーサネットとは」
[2004/10/25]
その12「IP/TCP/UDP/ICMPとは」
[2004/10/18]
その11「DHCPの役割」
[2004/10/04]
その10「MIMOとは」
[2004/09/27]
その9「DMZとその効果」
[2004/09/13]
その8「ファイアウォールとは」
[2004/09/06]
その7「NATとNAPTの違いとIPマスカレード」
[2004/08/30]
その6「VPNとVPNパススルーの仕組み」
[2004/08/23]
その5「無線LANの問題とWEP」
[2004/08/09]
その4「IEEE 802.11a/b/gって何を意味しているの?」
[2004/08/02]
その3「ダイナミックDNSって?」
[2004/07/26]
その2「グローバルIPアドレスとプライベートIPアドレス」
[2004/07/12]
その1「PPPoEって何だろう?」
[2004/07/05]

その95「PNGの現状と今後」


PNGって何?

 PNGとは「Portable Network Graphics」の略で、GIFにかわる画像フォーマットして開発されました。特徴としては以下のようなものが挙げられます。

・GIFに相当する8bit(256色)のほか、24bit(1,677万色)や48bit(280兆色)など、さまざまなフォーマットに対応
・特許問題の生じない圧縮フォーマットを採用しつつ、GIFよりも圧縮率が高い
・透過色に関して、αチャネルをサポートしている関係で半透明の表現なども可能
・アニメーションのサポートがない(これはPNGをベースとしたMNGフォーマットでサポートされる)
・古いWebブラウザや画像処理ソフトでは対応しない

 前回説明した通り、2000年にGIFの特許問題が出てきたことで、GIFの代替フォーマットとして急速に普及を始めたのがPNGフォーマットになります。そういう意味では、GIFなどに比べると、ずっと新しいフォーマットではあります。

 ただし、PNGが最初に登場したのは1995年のこと(当時は「Portable Bitmap Format(PBF)」と呼ばれていました)で、1996年10月にはW3CのRecommendationという位置付けになります。その後、1997年1月にはRFC2083としてRFCとなり、1999年8月にはversion 1.1がFix(*1)し、その後、version 1.2に変わっています。もっともこのversion 1.2もW3CとISO/IECの共同作業バージョンの開発進展により、2003年11月で作業が中止されるなど、いろいろと紆余曲折が見られます。

 最終的にISO/IEC 15948:2004として標準化が完了したのは2004年3月で、これが最新になります。改めて振り返ると、最初にPNGが登場してから10年以上が経過しているわけで、「新しめのフォーマット」というのは少し語弊があるかもしれません。正確に言えば「UNISYSの特許問題のお陰で急に有名になったフォーマット」というべきなのでしょう。

*1:これは正確には、version 1.2の作業により1.1の作業が中止された、というべきでしょう。


PNGの内部構造

図1:PNGの内部構造
 それではPNGの内部構造を簡単に説明していきましょう。まず、データ構造ですが、大雑把に言えばGrayScaleとIndex Color、True Colorの3種類があります(図1)。GrayScaleは、色情報を落として濃度のみにしたもので、2/4/16/256/65,536階調の5種類がカバーされます。

 次いで、Index Colorですが、こちらはGIF同様にパレットテーブルを別に設ける方式で、パレットの大きさを2/4/16/256種類の4つから選べます。パレットの大きさ=色の数なわけで、この方式だと最大256色になるわけです。

 最後がTrue Colorと呼ばれるもので、各ピクセルの色をRGB各8bit(合計24bit=1,677万色)ないし16bit(合計48bit=280兆色)で表現すべきものです。ただ、各色16bitに関しては以下のような制約もあり、あまり使われていることはないようです。

・16bitを扱うアプリケーションが非常に少ない
・正確に表現できるデバイス(=ディスプレイ、プリンタなど)も非常に少ない
・データ量は多くても、色の表現がRGBに限られるので、表現できる色空間が広がるわけではない(これはその後次第に拡張されてゆきましたが、基本はRGBであることに変わりはありません)

 True Colorの画像で比較した場合、単純にデータ量が倍になり、その割に得られるものが少ない(というか、事実上皆無)以上、使うべき理由もないということでしょう。

 さて、こうした画像データをどう圧縮するかですが、PNGでは以下にある3種類の方法があります。

・圧縮しない
・LZ77+静的ハフマン
・LZ77+動的ハフマン

 まず、LZ77ですが、GIFの回に登場したAbraham Lempel氏とJacob Ziv氏によるLZ法を指します。これを改良したLZ78は特許の対象になるわけですが、LZ77は対象に入らないというわけです。ちなみにLZ77は、他にもgzipの名前で知られる圧縮アルゴリズムで採用されています。実際、PNGのリファレンスプログラムでは、gzip用ライブラリを内部で呼び出しています。


 次に出てくるハフマンコードは、JPEGの回でも出てきましたが、もう少し具体的に説明しましょう。図2にあるイラストがIndex Colorで表現されているとします。仕様ではパレットの数が最大256なので、各イメージデータは8bitで表現しなければならないのですが、実際にはご覧のように5色しかないので、もう少し最適化することを考えます。5色ということは3bitあれば表現できますから、各ピクセルあたり3bitで3bit×64=192bitあれば実際にはこの絵柄が表現できます。

 ハフマンではここからもう1歩踏み込みます。まず、5色の出現順序を数えると、青が1番多くなります。そこで青には1番少ない“0”という1bitの値を与え、残りの4色はやはり現頻度の順に“10”、“110”、“1110”、“11110”をそれぞれ与えていきます。ちなみに5色なのでこれで済みますが、6色目は“111110”、7色目は“1111110”という具合に、色を示すのに必要なbit数はどんどん増えてゆくので注意してください。

 話を戻すと、この符号を使うと、この図形を表現するのに必要なbit数は138bitで済むことになります。1番出現頻度の多い青を1bitで表現できるために、これが実現できたわけです。

 ちなみにこの例では、いったん画像全体の出現頻度を調べてから最適な順に並べなおして符号化しており、これを静的ハフマンと呼びます。圧縮効果は高いのですが、1度画像全体をみる必要があるので、処理が重くなる欠点があります。一方、動的ハフマンは、データを検索しながら動的に符号の割り当てを行なってゆくので効率的ですが、静的ハフマンよりも圧縮効率が落ちる傾向にあります。


図2:ハフマンコード

図3:左のピクセルからの差分処理
 さて、このLZ77とハフマンだけでは十分な圧縮効率が期待できません。そこで次に登場するのがフィルタです。PNGの場合、以下の5種類が提供されます

・フィルタなし
・左のピクセルからの差分
・上のピクセルからの差分
・左と上のピクセルの平均値からの差分
・左と上、左上の3つのピクセルから予測値を計算し、それとの差分

 まずは「左のピクセルからの差分」の例を見てみましょう。図3はIndex Colorを例に取ったものです。1番左は差分がないので、Indexの00がそのまま入るわけですが、その先は左のピクセルのIndex値との差が算出されます。

 こうなると、図3のような図形では「左と同じ」パターンが非常に多いので、ハフマン化するとさらに圧縮ができます。差分だけをまとめたハフマン符号は合計83bitで済んでしまいます。実際は1番左のピクセルのIndex値(8bit×8)を加算する関係で合計147bitとやや肥大化してしまいますが、これは8×8という小さな図形なのが問題であって、もっと大きな画像であれば左端ピクセルの値を埋めてお釣りがくることが理解できるでしょう。

 もう1つ、GIFと異なる点として、インターレースの扱いがあります。GIFの場合、データを8ラインごとに分割して順次送ることで、次第に画像が完成していくという仕組みです。これは、現在と比較して以前は回線が遅かったので、画像がすべて表示されるまで時間がかかるという問題に対し、早いタイミングで画像の全体像を掴めるようにしよう、という配慮からです。図4ではちょっとわかりにくいかもしれませんが、具体的なびびちゃんの顔の変遷を見れば変化のイメージはつかめると思います(図5、6)。



図4-1、図5:インターレースGIFの例 図4-2、図6:インターレースPNGの例

PNGの現状と今後

 PNGは、GIFに取ってかわる形で急速に普及を始めましたが、UNISYSのLZ78特許失効に伴い、GIFが再び復権してきたことで普及に急速にブレーキがかかってしまいました。ブレーキがかかった理由は以下のものが考えられます。

・理論上はGIFよりも圧縮が効くが、そのためには最適なフィルタを選ぶ必要がある。必ずしも左のピクセルからの差分が効果的とは限らず、このあたりをアプリケーションが画像から判断するロジックが難しい
・圧縮/伸張に要する処理がGIFよりも重いため、軽快さを望むWebページでは敬遠されがち
・動かないGIF画像はPNGで置き換えが簡単にできるが、アニメーションGIF化されたバナーとかボタン、ロゴなどはPNGで置き換えできない。解決にはPNGの拡張させた「MNG(Multiple-Image Network Graphics)」を使う必要があるが、普及が進んでおらず、結果としてアニメーションGIFが捨てられない
・最近のWebブラウザではPNGをサポートしているタイプがほとんどだが、必ずしも全てのブラウザが“正しく”PNGを扱うとは限らない

・複数の画像変換ソフトは、圧縮を行なわなかったり、フィルタを一切使わずにPNGを生成する。このため、「PNGにするとファイルサイズが増える」という誤解が蔓延してしまった

 これらは以前からPNGにまつわる課題として挙げられていましたが、残念ながらGIFの復権までに課題を解決することができませんでした。そんなわけで、手軽に利用できるGIFが再び使用されるようになり、無理にGIFからPNGへ移行する理由がなくなってしまった、というのが実情でしょう。

 しかしながら、PNGは意外なところで人気を博しています。CG画像(特にアニメ塗りのものでこれが顕著)の場合、JPEGを使うとディテールを落としたことが非常にわかりやすくなるため、クオリティを重視する場合圧縮率を相当落とすか、TIFFなどのフォーマットで保存するといった対策が必要でした。

 ところがTIFFだと圧縮率が低いために嫌われていたわけですが、こうした用途にPNGは最適なフォーマットとして利用が進んでいます。また、一部可逆圧縮が必要な場合(例えば医療機器系で、レントゲン写真などをデータ化する場合など)、従来はLossless JPEGを使うといったことが多かったのですが、こうした用途にもPNGは利用され始めています。

 こちらもCG同様、原理的に完全可逆圧縮の割に圧縮率が高い、という利点を買われてのことです。以上のようなことから、PNGは当初の期待とは少し異なり、GIFの代替ではなくTIFFやLossless JPEGの置き換えという形で今後普及していくのではないかと思われます。


2006/10/02 10:53

槻ノ木 隆
 国内某メーカーのネットワーク関係「エンジニア」から「元エンジニア」に限りなく近いところに流れてきてしまった。ここ2年ほどは、企画とか教育、営業に近いことばかりやっており、まもなく肩書きは「退役エンジニア」になると思われる。(イラスト:Mikebow)
Broadband Watch ホームページ
Copyright (c) 2006 Impress Watch Corporation, an Impress Group company. All rights reserved.