バックナンバー
■
その116「DLNAの仕組み」
[2007/03/26]
■
その115「ドメインとActive Directory」
[2007/03/19]
■
その114「ワークグループができること」
[2007/03/12]
■
その113「WPSの仕組み」
[2007/03/05]
■
その112「Gopherの生い立ちと現在」
[2007/02/26]
■
その111「Wikiの使われ方」
[2007/02/19]
■
その110「文字コードとは」
[2007/02/05]
■
その109「IISの生い立ち」
[2007/01/29]
■
その108「NASの登場と一般への普及」
[2007/01/22]
■
その107「HomePNAのいろいろ」
[2007/01/15]
■
その106「Ogg Vorbisの成り立ち」
[2006/12/25]
■
その105「MIDIの原理とSMFの構造」
[2006/12/18]
■
その104「AIFFの構造」
[2006/12/11]
■
その103「WAVの構造と現状」
[2006/12/04]
■
その102「WMAの歴史」
[2006/11/27]
■
その101「AACの特徴」
[2006/11/20]
■
その100「MP3/MPEG Audioの仕組み」
[2006/11/13]
■
その99「HSDPAの仕組み」
[2006/11/06]
■
その98「H.264・MPEG-4 AVCの特徴」
[2006/10/30]
■
その97「IEEE 802.16e(モバイルWiMAX)の特徴」
[2006/10/23]
■
その96「TIFFの特徴」
[2006/10/16]
■
その95「PNGの現状と今後」
[2006/10/02]
■
その94「GIFの構造」
[2006/09/25]
■
その93「10GBASEの種類(2)」
[2006/09/11]
■
その92「10GBASEの種類」
[2006/09/04]
■
その91「GbEのいろいろ」
[2006/08/28]
■
その90「JPEGの特徴」
[2006/08/21]
■
その89「DivXの広がり」
[2006/08/07]
■
その88「MPEGの仕組み」
[2006/07/31]
■
その87「WMVのこれまで」
[2006/07/24]
■
その86「AVIの生い立ちとそのコーデック」
[2006/07/10]
■
その85「QuickTimeの変遷」
[2006/07/03]
■
その84「Realのこれまでと今後」
[2006/06/26]
■
その83「ShareとWinny」
[2006/06/19]
■
その82「DOCSISの仕組み」
[2006/06/12]
■
その81「SQLインジェクションの流れ」
[2006/06/05]
■
その80「RSSの動作」
[2006/05/29]
■
その79「Skypeの仕組み」
[2006/05/22]
■
その78「BitTorrentの特徴と今後」
[2006/05/15]
■
その77「Winnyの仕組みと現状」
[2006/05/08]
■
その76「WinMXの特徴」
[2006/04/24]
■
その75「Gnutellaの歴史と構造」
[2006/04/17]
■
その74「Napsterの歴史」
[2006/04/10]
■
その73「P2Pのいろいろ」
[2006/04/03]
■
その72「IEEE 802.11nの動向」
[2006/03/27]
■
その71「ActiveX Scriptingの動作」
[2006/03/20]
■
その70「Ajaxの仕組み」
[2006/03/13]
■
その69「DHTMLの動作」
[2006/03/06]
■
その68「Scriptの定義」
[2006/02/27]
■
その67「JavaScriptの仕組み」
[2006/02/20]
■
その66「Javaの動作」
[2006/02/13]
■
その65「RFCのプロセス」
[2006/02/06]
■
その64「ActiveX DocumentとActiveX Controlの違いと共通点」
[2006/01/30]
■
その63「ActiveX Controlの機能」
[2006/01/23]
■
その62「ActiveXを構成するもの」
[2006/01/16]
■
その61「Cookieの仕組みと用途」
[2005/12/26]
■
その60「malwareとその分類」
[2005/12/19]
■
その59「rootkitの動作」
[2005/12/12]
■
その58「CSSの役割」
[2005/12/05]
■
その57「HTMLの変遷」
[2005/11/28]
■
その56「PONとその種類」
[2005/11/21]
■
その55「FWAの仕組み」
[2005/11/14]
■
その54「DoSとDDoS」
[2005/11/07]
■
その53「SNMPとMIBの動作」
[2005/10/03]
■
その52「Jumbo Frameとフレームサイズ」
[2005/09/12]
■
その51「WPA2の仕組み」
[2005/09/05]
■
その50「WPAとWPA-PSKの違い」
[2005/08/29]
■
その49「WPAの仕組み」
[2005/08/22]
■
その48「WebDAVの動作」
[2005/08/08]
■
その47「OFDMAの仕組みとOFDMとの違い」
[2005/08/01]
■
その46「OFDMの仕組み」
[2005/07/25]
■
その45「WiMAXの特徴」
[2005/07/11]
■
その44「Wi-Fiの役割」
[2005/07/04]
■
その43「FTPの目的と動作」
[2005/06/27]
■
その42「UPnPの動作」
[2005/06/20]
■
その41「ネットマスクの仕組み」
[2005/06/13]
■
その40「ARPの機能」
[2005/06/06]
■
その39「DNSの原理」
[2005/05/30]
■
その38「デフォルトゲートウェイの役割」
[2005/05/23]
■
その37「MACアドレスの仕組み」
[2005/05/16]
■
その36「スイッチとその進化」
[2005/05/09]
■
その35「ルータによるメリット」
[2005/04/25]
■
その34「ブリッジの原理」
[2005/04/18]
■
その33「リピータの機能」
[2005/04/11]
■
その32「IPアドレスのクラス」
[2005/04/04]
■
その31「ブロードキャスト/マルチキャスト/ユニキャスト」
[2005/03/28]
■
その30「SMTP AUTHと認証の種類」
[2005/03/14]
■
その29「Submissionポートとスパムメール対策」
[2005/03/07]
■
その28「Outbound Port25 Blockingとは」
[2005/02/28]
■
その27「PGPの仕組み」
[2005/02/21]
■
その26「PKIと認証局」
[2005/02/14]
■
その25「公開鍵暗号方式とは」
[2005/02/07]
■
その24「共通鍵暗号とは」
[2005/01/31]
■
その23「SSHの仕組みと応用」
[2005/01/24]
■
その22「SSLの役割」
[2005/01/17]
■
その21「POP3とIMAP4の違い」
[2004/12/27]
■
その20「POP3の役割と機能」
[2004/12/20]
■
その19「SMTPの機能と問題点」
[2004/12/13]
■
その18「SPIとパケットフィルタリング」
[2004/12/06]
■
その17「LANの概念とその広がり」
[2004/11/29]
■
その16「SIPの役割」
[2004/11/15]
■
その15「プロキシの利用」
[2004/11/08]
■
その14「VoIPの仕組み」
[2004/11/01]
■
その13「イーサネットとは」
[2004/10/25]
■
その12「IP/TCP/UDP/ICMPとは」
[2004/10/18]
■
その11「DHCPの役割」
[2004/10/04]
■
その10「MIMOとは」
[2004/09/27]
■
その9「DMZとその効果」
[2004/09/13]
■
その8「ファイアウォールとは」
[2004/09/06]
■
その7「NATとNAPTの違いとIPマスカレード」
[2004/08/30]
■
その6「VPNとVPNパススルーの仕組み」
[2004/08/23]
■
その5「無線LANの問題とWEP」
[2004/08/09]
■
その4「IEEE 802.11a/b/gって何を意味しているの?」
[2004/08/02]
■
その3「ダイナミックDNSって?」
[2004/07/26]
■
その2「グローバルIPアドレスとプライベートIPアドレス」
[2004/07/12]
■
その1「PPPoEって何だろう?」
[2004/07/05]
その101「AACの特徴」
■
AACって何?
前回
の最後に少し触れましたが、今回はアップルのiTunesやiPodなどでも採用されている「AAC(Advanced Audio Coding)」をご紹介します。このAAC、前回も説明した通り、MPEG-2およびMPEG-4のAudioに採用されています。
基本的な構造(考え方)は、MP3とまったく同様ですが、ビットフォーマット的にはMP3との互換性を捨てています。この後方互換性を捨てたことで、思い切ってフォーマットを拡張できたため、より広いオプションを取り込むことができた、とも言えます。
圧縮率は(後述するプロファイルの関係で)まちまちですが、大雑把に言えば同音質のMP3の半分程度まで圧縮できる可能性があります。逆に言えば同一の圧縮率だとMP3よりも高音質になる可能性もあり、こうしたことからMP3の音質に飽き足りないユーザーを中心に、徐々に広がりつつあります。
■
AACの特徴
AACは、MPEG-2とMPEG-4の両方のAudioで採用されている関係で、「ISO/IEC 13818-7」として規定されている「MPEG-2 AAC」、それに「ISO/IEC 14496-3, Subpart 4」として規定されている「MPEG-4 AAC」の2種類があります。
このうち、MPEG-4 AACは、後から追加規格が入っているので厳密にはMPEG-2 AACと同じではないのですが、基本となるアルゴリズム自体は同一です。ビットフォーマットもほんのわずかに異なるだけなので、概ね同一のものとして取り扱われます。
また、MPEG-2 AAC/MPEG-4 AACとともに、「HE-AAC(High-Effiency Advanced Audio Codec)」という名称で「SBS(Spectral Band Replication)」と呼ばれる圧縮技術が追加されています。
ここからは、MPEG-4 AACをベースに説明を進めていきます。まず、AACの場合、Levelという概念はなくなりました。その代わり、Profileという概念が追加されています。AACに用意されているのは以下の4つで、MPEG-2やMPEG-4の動画にはMAINが、ポータブルオーディオプレーヤーなどにはLCが広く採用されています。
・Low Complexity(LC)
:1番簡単なProfile
・Main Profile(MAIN)
:LCにBackward predictionを追加したもの
・Sample-Rate Scalable(SRS)
:入力信号を「PQF(Polyphase quadrature filter)」と呼ばれる技術で4つのサブバンクに分割し、それぞれを独立にエンコードするというものです。これにより、データ量を増やさず周波数帯域を広く確保できる方法になります
・Long Term Prediction(LTP)
:MAIN ProfileにForward predictionを追加したものです
また機能面で言えば、以下のような項目も上げられるでしょう。
・単なる2chのステレオに留まらず、最大48chまでに対応(MP3はMPEG-2モードでも最大5.1ch)
・8kHz~96kHzまでのサンプリングレートに対応(MP3は16kHz~48kHz)
・符号化方式を「MDCT(Modified Discrete Cosine Transform)」から「DCT(Discrete Cosine Transform)」に切り替えることで、符号化効率を向上
・エンコード時にブロックサイズを最適化
・フィルタリングに「カイザー窓(Kaiser window)」と呼ばれる窓関数を使えるように変更
・16kHz以下の周波数の取り扱いを改善
・Joint Stereoの取り扱いを柔軟にした
・エラー検出・訂正を内蔵した
図1:元のソース
このほかにも前述したHE-AACと呼ばれるものもあります。ここに組み込まれているSBRは、
Coding technologies社
が提供する
もの
で、スペクトル分析の考え方を応用して、低ビットレートの環境で高い周波数再現性を確保するものです(図1~3)。これを使うと、例えばAACそのものは低い周波数(例えば12kHzまで)に限ってエンコードを行なうことでビットレートを減らし、それより高い周波数はSBRに再現を任せるなんてことが可能になります。
実はこのSBR、AACのみならずMP3にも応用が可能で、これを搭載した「mp3PRO」と呼ばれるものもあり、いくつかのプレーヤーではmp3PROの再生が可能だったりもします。もっとも、MP3の時代にはあくまでも“MP3を応用した方言”以上のものではなかったのですが、SBR自体は「ISO/IEC 14496-3:2001」の中で標準化も行なわれ、最終的にはHE-AACという形で規格化もされました。
図2:低ビットレートAACだけで再生
図3:AAC+SBR
その以外のものとして、「AAC-LD(Low Delay)」というものもあります。これは、特に双方向通信(例えばVoIPなど)に向けたもので、7kbpsないし15kbps(つまりISDNの1回線もしくは2回線)でステレオ音声を伝達できるような規格です。通常のAACだとDelay、つまり音声を入力してからそれがエンコードされて出てくるまで100ms~300ms(ビットレートに依存)かかるものが、AAC-LDでは25ms前後で済むため、双方向通信でも違和感なく利用できるようになっています。
さらに変わったものを探すと、「MPEG-4 SLS(Scalable to Lossless)」や「
MPEG-4 ALS
(Audio Lossless Coding)」というものもあります。前者はやはりISO/IEC 14496-3:2001の中で標準化が済んでおり、広義にはAACの1種と言える(SLSはAACの拡張のようになっている)のですが、このあたりは大分話が変わってくるのでこれ以上は触れないことにします。
■
これからのAAC
最近はポータブルオーディオプレーヤーでもAACに対応した製品が増えてきているほか、アップルコンピュータが積極的にAACを採用していることもあり、MP3に次ぐ標準の位置をほぼ確保した、というのが現状です。非常に長期的な視点で見れば、MP3の代替フォーマットとしてMP3を置き換えることも可能でしょうが、こればかりは市場の動向に影響されるので現時点ではどちらとも言えません。
問題点としては、例えばProfileの違いによる再生可否(Main ProfileでエンコードしたAACソースは、LCのみに対応したプレーヤーでは再生できない)などはありますが、これは規格当初から盛り込まれていた話であり、現実的に見ればそれほど問題になっていません。また、著作権保護メカニズムを持っていないという話も、他の著作権保護メカニズムと組み合わせることで解決しているので、こちらも事実上あまり問題視されていません。
ある意味、MP3でこうした問題はすべて議論され、その結果としてAACを別の著作権保護メカニズムと組み合わせて運用する形態が一般的になったからでしょう。また、特にMPEG-4 AACに関してはいくつかの特許が絡んでいますが、米Dolby Laboratoriesが関連特許を一括してライセンスする窓口を設けているので、これに関しての問題もほとんどありません。
強いて言えば、フリーのAACエンコーダ/デコーダが事実上存在し得ない(どうやっても特許に引っかかるので、特許料の支払いなしのエンコーダ/デコーダは作れない)程度でしょうか。ただし、これに関してもまだ完全なものではありませんが、
AudioCoding.com
)がフリーのMPEG-4 AAC用Codecを作ることを目標に作業が続けられています。
2006/11/20 11:16
槻ノ木 隆
国内某メーカーのネットワーク関係「エンジニア」から「元エンジニア」に限りなく近いところに流れてきてしまった。ここ2年ほどは、企画とか教育、営業に近いことばかりやっており、まもなく肩書きは「退役エンジニア」になると思われる。(イラスト:Mikebow)
Broadband Watch ホームページ
Copyright (c) 2006 Impress Watch Corporation, an Impress Group company. All rights reserved.