この記事は、シスコのコラボレーション テクノロジー グループのプリンシパル エンジニアである Thomas Davies によるブログ「Cisco Leap Frogs H.264 Video Collaboration with Real-Time AV1 Codec」(2019/6/26)の抄訳です。
Real-Time AV1 コーデックを活用したビデオ コラボレーション
シスコは本日、ニューヨークで開催中の「Big Apple Video Conference」において、ビデオ コラボレーション用に最適化されたリアルタイムの高品質 AV1 エンコーダを発表しました。コーデックにより使用帯域を削減し、次世代コンテンツを実現し、HEVC(別名 H.265)の展開を妨げてきた特許問題を回避できます。
過去 16 年間で多くのことが変化しました。たとえば、自動運転車、スマートフォン、ソーシャル メディア、仮想現実などが登場しました。しかしビデオ圧縮では未だに H.264 を使用しています。これは 2003 年に導入された圧縮技術で、現在となっては古さを隠せません。そこで登場したのが、次世代規格と目された HEVC(通称 H.265)ですが、Jonathan Rosenberg が詳述(関連記事 1、関連記事 2)したように、HEVC の使用には許容できない特許コスト、リスク、不確実性が伴います。
AV1 は、Google、Mozilla、シスコ、Microsoft、Netflix、Amazon、Intel の各社が 2015 年に設立した Alliance for Open Media(AOM)の製品で、今日では多数の大手テクノロジー企業が参加しています。AV1 の開発に際してシスコは AOM の参加企業と協力し、AV1 が将来のコラボレーション用途、特に低遅延、リアルタイム性、およびエラー耐性の面で必要な性能を満たせるよう努めてきました。
コラボレーション分野では、品質と新しいサービスへの要求がこれまで以上に高まり、ネットワーク負荷が日に日に増大していますが、AV1 はそれらの問題に対処しています。
次世代のビデオ圧縮技術
ネットワーク負荷の増大により、陳腐化した H.264 に代わる新しいコーデックの重要性が高まり続けています。
ただし AV1 は単なる HEVC の代替オプションではありません。コラボレーション分野では、品質と新しいサービスへの要求がこれまで以上に高まり、ネットワーク負荷が日に日に増大していますが、AV1 はそれらの問題に対処しています。ネットワーク負荷の増大により、陳腐化した H.264 に代わる新しいコーデックの重要性が高まり続けています。AV1 は非常に広範なツールセットにより現状では最大の圧縮率を実現します。ただし AV1 コーデックは非常に複雑なため、実用性に影響が出るとの懸念も上がっていました。これまでに AV1 の処理速度は大幅に増加していますが、リアルタイムに近い速度はまだ実現されていません。AV1 によるリアルタイムのエンコーディングは実現可能なのでしょうか?
それを実証したのが、本日の Big Apple Video Conference でご紹介したデモです。デモでは同僚の Xiaolin Shen と一緒に、ライブの Webex ビデオ会議でリアルタイムの AV1 エンコーディングを使用しました。カメラの映像は HD 画質(720p/30 fps)で、デスクトップ共有は高フレーム レート(1080p/30 fps)での伝送に成功したのです。これは世界初の試みです。デモの詳細は紹介記事をご覧ください。デモでは完全なクラウド メディア スタックを使用し、AV1 対応のスイッチング サーバをインターネット上に展開しました。これにより、完全なエンドツーエンドのコール シグナリングと耐障害性のあるメディア送信が実現したのです。
上記のような画質でエンコーダを実行すると、必然的にパフォーマンスが低下します。リアルタイムのエンコーディングはトレードオフの関係にあります。圧縮率を高めれば複雑さも上がるため、CPU の使用率や計算能力の面で現実的なレベルに留める必要があるからです。別の問題は、フレーム レートが高くてもシスコの AV1 コーデックにより圧縮率が大幅に上がるか、という点です。
答えは「上がる」です。デモでは、カメラのライブ映像(720p/30 fps)を H.264 と比べて半分の帯域幅でエンコードできたのです。デスクトップ共有を 1080p/30 fps の高フレーム レートでエンコードした場合でも、H .264 と 720p/30 fps の組み合わせと比べて約 2/3 の帯域幅に抑えられました。いずれの場面でも、使用されたのは市販のラップトップです。
つまり、一般的な環境で CPU が「普通に使える」状態でも、品質を大幅に向上させつつ帯域幅を節約できるのです。実環境における AV1 の圧縮率と CPU 使用率のトレードオフは優れており、HEVC よりも良好であることが判明しました。
AV1 の重要なメリットのひとつは、少数のプロファイル グループごとに、スケーラビリティ、画面コンテンツのコーディング、AR/VR 対応など、すべてのツールがサポートされていることです。HEVC や H.264 の場合、これらのツールが、サポートの貧弱な特殊プロファイルに含まれています。そのため新しいプロファイルの採用は、完全に新しいコーデックを採用するのと同じくらい複雑なのです。各ツールはパフォーマンスを大幅に向上させるために欠かせません。AV1 の簡素化されたプロファイルにより、より高度な機能をより広範に使用できるため、異なるベンダー間での相互運用性と一貫性が向上します。
本日のデモでは、コラボレーション システムに新しいコーデックを導入する際の課題についても触れました。課題とは、旧来システムの更新に時間がかかる点や、会議インフラを混合コーデックに対応させるには複雑な戦略が必要になる点などです。これらの課題は解決に時間と労力を要します。シスコでは、マルチストリームとトランスコーディングの組み合わせを活用して下位互換性を確保した上で、製品における AV1 の導入を進めていきます。AV1 がコラボレーション分野で浸透すれば、最も条件の厳しいネットワークであっても、より豊かで優れたエクスペリエンスを実現できるようになるでしょう。