Cisco Japan Blog
Share

Cisco Silicon One が 51.2 Tbpsの壁を突破


2023年8月1日


Rakesh Chopraこの記事は、Common Hardware Group の Cisco フェロー Rakesh Chopraによるブログ「Cisco Silicon One Breaks the 51.2 Tbps Barrier」(2023/6/20)の抄訳です。

 

シスコは 2019 年 12 月、今後どのようにインターネットの経済性を決定的に変え、前例のないスピードでイノベーションを推進していくかについて重大な発表をしました。この非常に野心的な発表に対し、当然、多くの人は、どうなるか成り行きを見守ってみようという反応でした。その発表以来、シスコはピッチを上げて次々とイノベーションを生み出し、お客様のニーズを満たす革新的なソリューションで業界をリードしています。

Cisco Silicon OneTM をリリースしてからわずか 3 年半しか経っていませんが、本日、早くも第 4 世代となるデバイスをリリースすることを、ここに発表いたします。第 4 世代のデバイスとは、現在お客様にサンプル提供を開始している Cisco Silicon One G200 と Cisco Silicon One G202 のことです。通常、新しい世代のシリコンは 18 ~ 24 か月間隔でリリースされるところを、シスコは通常のシリコン開発の 2 倍の早さでイノベーションを世に送り出しています。

Cisco Silicon One G200 は、シスコのユニファイドアーキテクチャのメリットを提供するデバイスです。このデバイスで特に重視しているのは、拡張されたイーサネットベースの人工知能/機械学習(AI/ML)と、 Web スケール規模のスパインネットワークです。Cisco Silicon One G200 は、5 nm プロセス、51.2 Tbps キャパシティ、512 X 112 Gbps のシリアライザ/デシリアライザ(SerDes)、独自のプログラムが可能、決定論的かつ低遅延のデバイスです。高度な可視性と制御機能が備わっているため、Web スケールのネットワークには理想的な選択肢となります。

50G SerDesの光モジュールを接続に使い続けたいと希望されるお客様には、Cisco Silicon One G202 が同様のメリットをもたらします。これは 5 nmプロセス、25.6 Tbps キャパシティ、512 X 56 Gbps の SerDes デバイスで、Cisco Silicon One G200 と同じ特性を備えていますが、キャパシティは半分です。

Cisco Silicon One のビジョンを実現するためにシスコにとって不可欠だったのは、キーテクノロジーへの投資です。7 年前、シスコは独自の高速 SerDes 開発への投資を開始しました。それから間もなくして SerDes の高速化が実現され、今では業界がアナログ・デジタル変換(ADC)ベースの SerDes に移行せざるを得ない状況となっています。ハイパフォーマンスのコンピューティングと AI のためのネットワークにおいて、SerDes は基本的な構成要素としての役割を果たします。本日、超高性能かつ低消費電力のシスコの次世代 112 Gbps ADC (アナログ・デジタル変換) SerDes を発表できることを大変嬉しく思います。このデバイスは、遠距離接続に対応可能な4 メートルのダイレクトアタッチケーブル(DAC)、従来のオプティクス、リニアドライブオプティクス(LDO)、コパッケージドオプティクス(CPO)をサポートしながらも、シリコンダイ面積と電力を最小化します。

図 1. Cisco Silicon One 製品ファミリ

図 1. Cisco Silicon One 製品ファミリ

Cisco Silicon One G200 および G202 が市場においてユニークな存在になると考えられます。それは、AI/ML ワークロードのパフォーマンスを最適化する高度な機能を備えていると同時に、ネットワークのコストと電力の節約、遅延の短縮を優れたイノベーションによって実現するからです。

Cisco Silicon One G200 がイーサネットベースの AI/ML ネットワークの理想的なソリューションとなる理由としては、次の点が挙げられます。

  • 業界で最大の、1 台のデバイスに 512 ポートの 100GE イーサネットポートを接続可能なスイッチです。したがって、2 階層ネットワークで 32,000 基の 400G GPU を備えた AI/ML クラスタを構築するために必要なオプティクスを 50%、スイッチはを40%、ネットワークレイヤは 33% 削減できます。つまり、AI/ML クラスタ環境のフットプリントは大幅に縮小されて、1 年あたり 900 万 kWh を節約できます。これは、米国環境保護庁によると 1 年あたり 6,000 メートルトン(=キログラム)を超える二酸化炭素(CO2e)排出量または 730 万ポンドの石炭燃焼量を削減することに相当します。
  • 高度な輻輳検知ロードバランシング技術により、ネットワークで発生する従来型の輻輳を回避できます。
  • 高度なパケット分散技術が採用されており、ネットワーク内で輻輳のホットスポットが生じるリスクを最小限に抑えられます。
  • ハードウェアベースの高度なリンク障害復旧機能を備えているため、障害が発生したとしても大規模な Web スケールのネットワーク全体にわたって最適なパフォーマンスを提供します。
図 2. 512 ポート × 100GEポート接続可能な 51.2 Tbps スイッチの利点

図 2. 512 ポート × 100GEポート接続可能な 51.2 Tbps スイッチの利点

Cisco Silicon One のイノベーション

Cisco Silicon One に関連する数々のイノベーションをいくつか詳しく説明します。

コンバージドアーキテクチャ

  • Cisco Silicon One は多様なネットワークに対して、1つのアーキテクチャの装置を導入出来るため、導入にかかる時間を大幅に短縮できます。例として、ルーティング装置としても、Web スケールのフロントエンドネットワークまたは Web スケールのバックエンドネットワークとしても利用可能です。コンバージド インフラストラクチャを実現することで、運用費用も最小限に抑えることもできます。
  • 共通のソフトウェア開発キット(SDK)と標準のSwitch Abstraction Interface(SAI)レイヤを使用して Cisco Silicon One の環境をネットワーク オペレーティング システムに移植することで、投資をさまざまなネットワーク環境で利用できます。
  • シスコのあらゆるデバイスと同様に、Cisco Silicon One G200 には大規模なパケットバッファが完全に統合されているため、大規模な Web スケールのネットワークでのバースト軽減とスループット最適化を行います。プライオリティフロー制御を生成する代わりにバーストを吸収することで、ヘッドオブライン ブロッキングを最小限に抑えます。

 

バリューチェーン全体にわたる最適化

  • Cisco Silicon One G200 のポート接続可能数は512 個の イーサネットであり、他のソリューションと比較して最大 2 倍です。そのため、お客様はネットワークレイヤを削減してネットワーク環境のコストと電力を節約し、遅延を短縮できます。
  • シスコの自社開発の次世代 SerDes テクノロジーを活用した Cisco Silicon One G200 デバイスでは、43 dB の遠距離チャネルを駆動できます。したがって、コパッケージドオプティクス(CPO)、リニア プラガブル オプティクス(LPO)、IEEE 規格を大幅に上回る 4 メートルの 26 AWGサイズのカッパーケーブルを利用可能とし、ラック内の接続を最適化できます。
  • すでに最適化されている Cisco Silicon One G100 デバイスと比べても、Silicon One G200 では電力効率が 2 倍以上高く、遅延が半減されます。
  • デバイスの物理的な設計とレイアウトには、システムレベルの設計を重視するアプローチを行っており、ファンの動作速度を低くすることが可能となるため、お客様はシステムの消費電力を大幅に削減できます。

 

革新的なロードバランシングと障害検出

  • Non-correlated, Weighted Equal-Cost Multipath(WECMP)および等コストマルチパス(ECMP)ロードバランシング機能をほぼ理想的な形でサポートし、大規模なネットワークの間でもハッシュ偏りが回避されるようになっています。
  • ステートフルな ECMP、フロー、フローレットの輻輳認識ロードバランシングにより、最適なフロー完了時間とジョブ完了時間(JCT, Job-Completion Time)でネットワークスループットを最適化できます。
  • 輻輳認識ステートレスパケット分散機能では、フローの特性を問わずに利用可能なすべてのネットワーク帯域幅を使用して、ほぼ理想的な JCT を実現します。
  • リンク障害時のハードウェアベースのパケットリディストリビューションのサポートにより、Cisco Silicon One G200 は実際の大規模ネットワークのスループットを最適化できます。

 

高度なパケットプロセッサ

  • Cisco Silicon One G200 は、業界初のカスタム P4 プログラマブル並列パケットプロセッサを使用しています。このプロセッサは、1 秒あたり 4,350 億件を超えるルックアップを実行できます。さらに、SRv6 Micro-SID(uSID)などの高度な機能もフルレートでサポートし、フルのrun-to-completionを複雑なフローに対しても実行します。この類を見ないパケット処理アーキテクチャが、柔軟性とともに決定論的な低遅延と低消費電力を実現します。

 

詳細な可視性と分析

  • プログラム可能なプロセッサにより、標準的、および新たな Web スケールの標準的インバンドテレメトリを提供し、業界をリードするネットワークの可視性を実現します。
  • 組み込みのハードウェアアナライザがマイクロバーストを検出し、一時的なフローのイベント前およびイベント後のログを記録します。そのため、ネットワークのオペレータはハードウェアレベルでのイベント時刻を基にネットワークイベントを事後分析できます。

 

次世代のネットワーク機能

業界がサイロ化されていた日々はもう遠い昔です。Cisco Silicon One は単一のユニファイド アーキテクチャにより、あまりにも長い間この業界を分断してきた境界線を消し去ります。過去の時点の想像力とテクノロジーの限界に起因するアーキテクチャ上の違いについて、お客様が懸念する必要はもうありません。現在、お客様のネットワークのすべてにわたり、Cisco Silicon One をさまざまな方法で導入できるようになっています。

シスコは Cisco Silicon One G200 および G202 デバイスという、スパインと AI/ML の展開を目的に最適化された高キャパシティのデバイスによって、Cisco Silicon One の適用範囲を拡大しています。お客様は必要な種類の効率化されたデバイスを導入することで、費用を節約できると同時に、遠距離接続対応の SerDes で新たなネットワークトポロジを構築できます。さらに、革新的なロードバランシングと障害検出技術によって AI/ML ジョブのパフォーマンスを向上させ、高度なテレメトリとハードウェアアナライザでネットワークのデバッグ機能を強化できます。

2019 年 12 月に初めて Cisco Silicon One を発表して以来、シスコの動向を見守っていたとすれば、これが始まりにすぎないことは明らかでしょう。シスコはお客様へのさらなる価値の提供を加速するべく、今後も開発に取り組んでいきます。

今後の Cisco Silicon One の開発によるさらに画期的な成果をお見逃しなく。

詳しい情報はこちら

Cisco Silicon One

アーキテクチャ、デバイス、利点

 

その他のリソース

Silicon One に関する私の最初のブログ「Cisco Silicon One を使用して AI/ML ネットワークを構築」をご覧ください。

Tags:
コメントを書く