槻ノ木隆の「BBっとWORDS」

バックナンバー

■	その116「DLNAの仕組み」 [2007/03/26]
■	その115「ドメインとActive Directory」 [2007/03/19]
■	その114「ワークグループができること」 [2007/03/12]
■	その113「WPSの仕組み」 [2007/03/05]
■	その112「Gopherの生い立ちと現在」 [2007/02/26]
■	その111「Wikiの使われ方」 [2007/02/19]
■	その110「文字コードとは」 [2007/02/05]
■	その109「IISの生い立ち」 [2007/01/29]
■	その108「NASの登場と一般への普及」 [2007/01/22]
■	その107「HomePNAのいろいろ」 [2007/01/15]
■	その106「Ogg Vorbisの成り立ち」 [2006/12/25]
■	その105「MIDIの原理とSMFの構造」 [2006/12/18]
■	その104「AIFFの構造」 [2006/12/11]
■	その103「WAVの構造と現状」 [2006/12/04]
■	その102「WMAの歴史」 [2006/11/27]
■	その101「AACの特徴」 [2006/11/20]
■	その100「MP3/MPEG Audioの仕組み」 [2006/11/13]
■	その99「HSDPAの仕組み」 [2006/11/06]
■	その98「H.264・MPEG-4 AVCの特徴」 [2006/10/30]
■	その97「IEEE 802.16e（モバイルWiMAX）の特徴」 [2006/10/23]
■	その96「TIFFの特徴」 [2006/10/16]
■	その95「PNGの現状と今後」 [2006/10/02]
■	その94「GIFの構造」 [2006/09/25]
■	その93「10GBASEの種類（2）」 [2006/09/11]
■	その92「10GBASEの種類」 [2006/09/04]
■	その91「GbEのいろいろ」 [2006/08/28]
■	その90「JPEGの特徴」 [2006/08/21]
■	その89「DivXの広がり」 [2006/08/07]
■	その88「MPEGの仕組み」 [2006/07/31]
■	その87「WMVのこれまで」 [2006/07/24]
■	その86「AVIの生い立ちとそのコーデック」 [2006/07/10]
■	その85「QuickTimeの変遷」 [2006/07/03]
■	その84「Realのこれまでと今後」 [2006/06/26]
■	その83「ShareとWinny」 [2006/06/19]
■	その82「DOCSISの仕組み」 [2006/06/12]
■	その81「SQLインジェクションの流れ」 [2006/06/05]
■	その80「RSSの動作」 [2006/05/29]
■	その79「Skypeの仕組み」 [2006/05/22]
■	その78「BitTorrentの特徴と今後」 [2006/05/15]
■	その77「Winnyの仕組みと現状」 [2006/05/08]
■	その76「WinMXの特徴」 [2006/04/24]
■	その75「Gnutellaの歴史と構造」 [2006/04/17]
■	その74「Napsterの歴史」 [2006/04/10]
■	その73「P2Pのいろいろ」 [2006/04/03]
■	その72「IEEE 802.11nの動向」 [2006/03/27]
■	その71「ActiveX Scriptingの動作」 [2006/03/20]
■	その70「Ajaxの仕組み」 [2006/03/13]
■	その69「DHTMLの動作」 [2006/03/06]
■	その68「Scriptの定義」 [2006/02/27]
■	その67「JavaScriptの仕組み」 [2006/02/20]
■	その66「Javaの動作」 [2006/02/13]
■	その65「RFCのプロセス」 [2006/02/06]
■	その64「ActiveX DocumentとActiveX Controlの違いと共通点」 [2006/01/30]
■	その63「ActiveX Controlの機能」 [2006/01/23]
■	その62「ActiveXを構成するもの」 [2006/01/16]
■	その61「Cookieの仕組みと用途」 [2005/12/26]
■	その60「malwareとその分類」 [2005/12/19]
■	その59「rootkitの動作」 [2005/12/12]
■	その58「CSSの役割」 [2005/12/05]
■	その57「HTMLの変遷」 [2005/11/28]
■	その56「PONとその種類」 [2005/11/21]
■	その55「FWAの仕組み」 [2005/11/14]
■	その54「DoSとDDoS」 [2005/11/07]
■	その53「SNMPとMIBの動作」 [2005/10/03]
■	その52「Jumbo Frameとフレームサイズ」 [2005/09/12]
■	その51「WPA2の仕組み」 [2005/09/05]
■	その50「WPAとWPA-PSKの違い」 [2005/08/29]
■	その49「WPAの仕組み」 [2005/08/22]
■	その48「WebDAVの動作」 [2005/08/08]
■	その47「OFDMAの仕組みとOFDMとの違い」 [2005/08/01]
■	その46「OFDMの仕組み」 [2005/07/25]
■	その45「WiMAXの特徴」 [2005/07/11]
■	その44「Wi-Fiの役割」 [2005/07/04]
■	その43「FTPの目的と動作」 [2005/06/27]
■	その42「UPnPの動作」 [2005/06/20]
■	その41「ネットマスクの仕組み」 [2005/06/13]
■	その40「ARPの機能」 [2005/06/06]
■	その39「DNSの原理」 [2005/05/30]
■	その38「デフォルトゲートウェイの役割」 [2005/05/23]
■	その37「MACアドレスの仕組み」 [2005/05/16]
■	その36「スイッチとその進化」 [2005/05/09]
■	その35「ルータによるメリット」 [2005/04/25]
■	その34「ブリッジの原理」 [2005/04/18]
■	その33「リピータの機能」 [2005/04/11]
■	その32「IPアドレスのクラス」 [2005/04/04]
■	その31「ブロードキャスト/マルチキャスト/ユニキャスト」 [2005/03/28]
■	その30「SMTP AUTHと認証の種類」 [2005/03/14]
■	その29「Submissionポートとスパムメール対策」 [2005/03/07]
■	その28「Outbound Port25 Blockingとは」 [2005/02/28]
■	その27「PGPの仕組み」 [2005/02/21]
■	その26「PKIと認証局」 [2005/02/14]
■	その25「公開鍵暗号方式とは」 [2005/02/07]
■	その24「共通鍵暗号とは」 [2005/01/31]
■	その23「SSHの仕組みと応用」 [2005/01/24]
■	その22「SSLの役割」 [2005/01/17]
■	その21「POP3とIMAP4の違い」 [2004/12/27]
■	その20「POP3の役割と機能」 [2004/12/20]
■	その19「SMTPの機能と問題点」 [2004/12/13]
■	その18「SPIとパケットフィルタリング」 [2004/12/06]
■	その17「LANの概念とその広がり」 [2004/11/29]
■	その16「SIPの役割」 [2004/11/15]
■	その15「プロキシの利用」 [2004/11/08]
■	その14「VoIPの仕組み」 [2004/11/01]
■	その13「イーサネットとは」 [2004/10/25]
■	その12「IP/TCP/UDP/ICMPとは」 [2004/10/18]
■	その11「DHCPの役割」 [2004/10/04]
■	その10「MIMOとは」 [2004/09/27]
■	その9「DMZとその効果」 [2004/09/13]
■	その8「ファイアウォールとは」 [2004/09/06]
■	その7「NATとNAPTの違いとIPマスカレード」 [2004/08/30]
■	その6「VPNとVPNパススルーの仕組み」 [2004/08/23]
■	その5「無線LANの問題とWEP」 [2004/08/09]
■	その4「IEEE 802.11a/b/gって何を意味しているの？」 [2004/08/02]
■	その3「ダイナミックDNSって？」 [2004/07/26]
■	その2「グローバルIPアドレスとプライベートIPアドレス」 [2004/07/12]
■	その1「PPPoEって何だろう？」 [2004/07/05]

その88「MPEGの仕組み」

■ MPEGって何？

　ここまでさまざまな動画フォーマットを説明してきましたが、肝心なMPEGについて触れていませんでした。本当はMPEGを説明する場合、JPEGについても触れなければいけないのですが、説明が長くなりすぎるのでこちらは別の機会に改めたいと思います。

　MPEGとは、「Moving Picture Experts Group」の略で、標準化を行なった団体そのものを示す用語だったりします。ただ、この団体が標準化した規格がMPEG-1/2などという名称を使った関係上、フォーマットそのものを指す言葉としても利用されています。

　さてそのMPEG、もともとは画像フォーマットのJPEGの標準化を行なっていたISOのJPEG WG（Working Group）内で検討が始まりました。JPEGを一口で言えば、「DCT（Discrete Cosine Transform：離散コサイン変換）と呼ばれる技法を使って画像を圧縮する方法」ですが、これを動画に応用したのがMPEGと言っても良いでしょう。

■ MPEGの仕組み

図1：非圧縮

　上ではMPEGを、DCTを使った動画圧縮方法と説明しましたが、これは不正確、というよりは不十分です。前々回のAVIでも出てきましたが、当初の動画フォーマットは静止画をただ蓄積していくもので、サイズが肥大化する関係で実用には耐えないものでした（図1）。

　これを改善するため、まず画像単位での圧縮を行なうことが考案されました（図2）。例えば、640×480ピクセル、24bitカラーの静止画は1枚900KBになりますが、JPEG圧縮など用いることで、1枚90KB程度まで縮小するのは容易です。つまり、フレームレートが30fpsの場合で毎秒27MBから2.7MBまで容量を減らすことが可能になりました。ただ、仮に音声を抜きにしても、毎秒2.7MBだとCD1枚（650MB）では240秒程度。フレームレートを15fpsに、画像を320×240ピクセルにまで落とし、カラーも8bitまで下げれば2,880秒、つまり、48分程度まで蓄積が可能ですが、ここまで画質を落としても48分にしかならないわけです。これではまだ圧縮が足りません。

　そこで次に考えられたのが、差分を送るという方法です。図3のようなケースで、中央のビビちゃんは動かず、周囲の色だけが変わるといったケースでは、ビビちゃんは毎回送り出す必要がありあません。そこでビビちゃんの映像は送らないようにすれば、その分データ量が減るという仕組みです。

図2：画像単位の圧縮

図3：差分のみの伝達

　ただし、これは検討されたもののすぐに放棄されてしまいました。というのは、静止画が続くもの（例えば、「そのまましばらくお待ちください」）では非常に効果的ですが、実際にはこうしたケースはむしろ稀です。スタジオの中でアナウンサーがニュースを伝えているケースでもアナウンサー自身やその周囲、あるいは背景にスーパーインポーズされた画面などは毎フレームごとに変わってきてしまうので、思ったほどの節約にはなりません。ましてやスポーツの中継などでは、ほとんど絶望的でしょう。

図4：動きベクトルの算出

　そこで考えられたのが、動き検索という方法です。ちょっと説明の都合上、簡単な画像を例に取ります（図4）。青の背景の手前に赤い玉がいるわけですが、この玉がゆっくり左から右へ移動していくケースを考えます。ここで、前フレーム画像（左側）と現フレーム画像（右側）を細かくブロックに分割した上で、ブロック単位で「このブロックはどこに動いたのか」を調べ、動きベクトルと呼ばれるものを算出します。

　図4の1番下の水色の矢印がこの動きベクトルです。この方式により、大幅に必要なデータ量を圧縮することが可能になりました（図5）。もっともこれは説明の半分だけです。図4のようなケースでは問題ありませんが、例えば赤い玉が段々小さくなるとか大きくなるといったケースでは、厳密な意味での動きベクトルは検出できません。よって、動きベクトル“だけ”では完全な再構成は不可能です。

　このため、1度前画像＋動きベクトルで再構成を行ない、それと現画像を比較した上で、差分を補正データという形で、動きベクトルの後に追加するのが実際のフォーマットです。ちなみにMPEGの用語では、動きベクトルの算出をME（Motion Estimation：動き検索）、算出後の画像補正をMC（Motion Compensation：動き補償）と呼びます。

　MPEGの場合、映像のクオリティはMCの精度とビットレートの両方で決まります。MEの精度が十分に高ければ、補正は最小で済みますから、MCのデータに高い圧縮をかける必要がありません。逆に言えば、MEの精度が低いとどうしてもMCのデータ量が増えて、データが肥大化します。これを一定のサイズに押さえ込むためにMCにも圧縮をかける（この方式がJPEGと共通の、DCTを用いたものです）わけですが、圧縮の度合いが過ぎるとどんどん画質が劣化します。ブロックノイズ、モスキートノイズなどという言葉を聞いたことがあるかもしれませんが、これらはいずれもMCのデータを圧縮しすぎるために発生します。

　ビットレートを上げれば、つまり、圧縮率を下げればこれは解決しますが、今度はデータサイズが肥大化するために、そう簡単にはできません。ではMEの精度を上げれば、ということになるわけですが、これも真面目にやると膨大な計算が必要になります。最近でこそ、MPEG-2の圧縮をCPUでやってもそれほど大きな負荷ではありませんが、例えばテレビのキャプチャ映像をリアルタイムMPEGに圧縮が可能になったのは、CPUの動作周波数が2GHzを越えたここ数年のことです。

図5：動きベクトルの利用時

■ いろいろなMPEG

　MPEGは、現時点では1番普及した映像フォーマットと言えるでしょう。前回まででご紹介した通り、QuickTimeやWMVも事実上、MPEG-4の方式を取り入れたものになっており、また最近流行のH.264もベースとなるのはMPEGです。そのMPEGですが、大別して以下のように3つのフォーマットがあります。

・MPEG-1
　最初に制定されたMPEGフォーマットです。これはビデオCDという規格に使われたもので、VHSビデオのクオリティを保ちつつ、CD-ROM1枚（650MB）に1時間分の映像を保つ目的で制定され、現在も広く利用されています。

・MPEG-2
　MPEG-1よりも高画質を目指したフォーマットです。基本的な構造に違いはありませんが、MPEG-1がプログレッシブ画像のみをターゲットにした規格なのに対し、MPEG-2ではインターレース画像にも対応したほか、プロファイルおよびレベルという概念を導入し、目的に応じて異なる符号化方法やビットレートを選べるようになっています。

・MPEG-4
　MPEG-4は、MPEG-2よりも低いビットレートで利用することを念頭に当初開発が進みましたが、その後拡張が行なわれ、単に動画圧縮方法のみならず、3Dグラフィックや音声合成までも含む広範な規格になりました。動画圧縮に限って言えば、より高い精度のMEやAC/DC予測、エントロピー符号化といった技術が盛り込まれました。

　ちなみにこのMPEG-4、動画に関連してはPart 2（1999年に規格化）とPart 10（2003年に規格化）されたパートがあり、後者をMPEG-4 AVC（Advanced Video Coding）と呼びますが、これがH.264として最近知られるようになった方式です。こちらについては、また項を改めて説明したいと思います。

2006/07/31 10:49

槻ノ木隆
　国内某メーカーのネットワーク関係「エンジニア」から「元エンジニア」に限りなく近いところに流れてきてしまった。ここ２年ほどは、企画とか教育、営業に近いことばかりやっており、まもなく肩書きは「退役エンジニア」になると思われる。（イラスト：Mikebow）

Broadband Watch ホームページ