DPU/SmartNICによるデータセンターアーキテクチャの変革。「DPU/SmartNIC を用いた高速化技術やユースケース」

今日の NIC には、広帯域化、高セキュリティ化、ストレージとの連携など多岐にわたる性能向上が求められています。従来の NIC では応えれらえない要求にも NVIDIA のスマート NIC や DPU はお応えできるかもしれません。

本動画ではネットワークアクセラレーションとはどのようなものか、詳しく解説いたします。

※本動画は 12 月 に開催された「NVIDIA テレコムウェビナー 2022」の一部を編集したものです。

 

【書き起こし】DPU/SmartNICによるデータセンターアーキテクチャの変革。「DPU/SmartNIC を用いた高速化技術やユースケース」

(00:02) はい NVIDIAでシニアソリューション アーキテクトをしております 野田隆と申します テレコムのお客様を中心に 主にネットワーキング製品を担当しており ます 本セッションでは dpu スマートニック製品を活用した高速化技術 や ユースケースについてご紹介します まず最初に 通信事業者で直面する 主な課題ということで 通信事業者様のデータセンターや クラウド環境において様々な課題があるか と存じます 5Gなどのサービスでは 厳しい性能要件や 品質要件が求められます ネットワーキングや コンピューティングリソース基盤も大規模 にスケールでアウトさせることも必要と なりそれと同時に セキュリティも強化する必要もあります また 既存の仮想マシン環境から クラウドネイティブへの技術シフト 新しい運用モデルも構築していく必要が
(01:07) あります 通信事業者への顧客の期待はこれまで以上 に高まってきています 昨今のソフトウェア定義された クラウドインフラにおいては ネットワーク ストレージ セキュリティ等のデータ処理をサーバーの CPUだけで処理するにはそろそろ限界が 来ておりアーキテクチャを最定義する時期 に来ていると言えます その中でこれからご紹介する スマートニックや DPの活用はますます重要になってくると 思われます まずその前にデータセンターのサーバーに 搭載される ネットワークアダプター スマートニックのトレンドを説明します 真ん中の円グラフは2021年における 25G以上の イーサネットアダプター スマートニックを含めた市場規模を表して います 異なるインターフェース速度で色分けされ
(02:10) ていますが 緑の25ギアが 全体の50%でそれについて 黄色の100ギアが29%となっています これらはハイパースケイラーや テレコムの5Cなど 皇帝液の肉の需要が 盛り上がってきていると言えます この2021年の時点で NVIDIAの25G以上のニックの シェアは 63%と ナンバーワンのシェアを持っています そして23年頃になると スマートニックの割合が1/3を占めると 予測されています 右側の円グラフは2025年3年後の予測 になりますがこの段階になりますと100 イヤーが全体の49%と広がり25 ギアは24%と低下します そして緑の 磨きが以上400gb800企業等の
(03:16) 割合が18%となり 抗体化が進んでいくと予想します これは割合ですので 金額ベースで見た場合2021年が 1.65 ビリオンユリストル 2025年が4.4 b4USドルですので 全体的に ビジネスの市場規模は広がっていきます で左側に3つのSがありますが データセンターにはますますスピードが 求められサーバー 側には高速にデータを取り込み処理する 能力が必要となります 100以外のように高速になると すべての愛用処理を ホスト側のCPUだけでは 処理には不十分となりますので 肉眼にスマートな機能 スマートニックやdpuが求められます またすべてのエンドポイントでの セキュリティを強化していく必要があり ます ここから
(04:21) 弊社のコネクテックスと呼ばれる スマートニックの説明になります 左側は 標準的なニックが搭載された 汎用サーバーのイメージですが 真ん中がですねコネクトX スマートニックが搭載されたイメージに なります このコネクテックスにデータ処理をオフ ロードし高速インストールするための a子やセキュリティなどのハードウェアさ れたエンジンが含まれています 従来はホストガーで処理されていた 仮想スイッチや セキュリティなどの様々なデータ処理を スマート肉側にハードウェアオフロード することができます それによって ホスト側のCPを削減し 効率化させることができます 例えば電力消費量等の オペックスの削減や 余ったCPUリソースを 別のワークルドに 復旧のフレームを受けることが可能となり ますし 物理サーバーを集約し 台数を減らすことも
(05:24) 可能となります この右上のコネクテックス6DXは200 gまで対応した スマートニックになります デュアルポートの100ギガにシングル ポート200キャラなどのタイプがあり ますが pcij4に対応し IPS TS asXSなどの 暗号化のオフロードにも対応しています 単にインターフェースが2上げがBPSに 対応しているだけでなく 内部A軸のスイッチング容量も200が ですので高度で高速なパケット処理が可能 となります 右下のコネクテックスはですね 7は最新のスマートニックですが 400ギガに対応しておりまして4ポート の2550gb デュアルポートの200キーが シングルポートの400gbなどのタイプ があります pcij5に対応し
(06:29) セキュリティについては MAX レイヤー2レベルの暗号化複合化の エンジンが新たに加わっています ハイパフォーマンスコンピューティング 用途での インフィーバンドに対応した コネクテックス7はすでに所用リリースさ れていますが イーサネットに対応したコネクタクス7は 来年1月に商用リリース予定となってい ます ブルーヒドDPの説明です dpuというのは データプロセシウムユニットの略ですが CPU GPUに続いて 第3のプロセッサーと呼ばれています 一般的には複数のプロセッサーコアを搭載 し ハードウェアアクセション機能と ネットワークインターフェースを備えた ものと 考えていただければと思います NVIDIAはですねブルーフィードと いう製品名で販売しています このブルヒドDPはコネクトXと同じ ハードウェアアクセレクション
(07:33) 機能に加えて アームコアのプロセッサーや レゲエンジンなどのアクセレーターなどが 追加されています 従来ホスト側で処理されていました ソフトウェア定義のインフラに 関するですね 管理機能 ネットワーキングセキュリティ ストレージ機能などのワークロードを Dピュー内のアームコアに オフロードさせ 且つハードウェアアクセレッターと連携さ せることができます これによって ホスト側では インフラクチャーに関連するワークを削減 し 余ったcpuseを 別のワーク度に割り当てることで ビジネスワーク度に 専念させることが 可能となります このブルーのDPを導入することでですね データプレーンだけでなくコントロール プレーンまで含めた プログラマーブルなオフロードや高速化 インフラストラクチャーと
(08:35) ビジネスワークロードの分離が可能となり ます セキュリティにセキュリティに関する処理 をDPがで実施することで分散 セキュリティという観点でも非常に有効と なります また dpu内のアームコアでハイパーバザーや OSが動作しますので ホスト側のOSに依存しない クラウド運用の合理化や データセンター全体でサイズの オーケストレーションが可能となります 今後も増税していく大量のデータを処理 する 次世代のDCアーキテクチャーにおいては dpuは 重要なコンポーネントになると 考えられます はい ブルーフィードの 詳細ですが2種類の世代がございます 左側が ブルフィード2と呼ばれる 現在発売されている製品となります 日課の部分については 先ほどご紹介しました 200キュアに対応したコネクテックス
(09:39) DXが 内蔵されていまして 8個のアームコアやDDR4のメモリが 含まれています 右側のブルフィード3についてはまだ リリース前ですがこの写真は SOCのチップの部分だけをお見せしてい ます 400gbで イーサネットおよび HPCで使用される インフィニバンドの両方をサポートした 業界安のdpuとなります 肉の部分については 先ほどご紹介した400企業に対応した コネクタクセブンが内蔵されています でアームコーアですね16個と2倍になっ て CPU処理能力も向上しています ブルフィード2と比較して4倍の コンピューティングリソースを持ってい ます また データパスアクセレータと呼ばれる 愛用処理をさらに高速化する アクセレーターも追加されています NVIDIAどうかですがこちらはDPを
(10:48) 使ったアプリケーション開発で使用される sdkのフレームワークになります どうかはオープンAPIと最適化された sdkなどを通じて データセンターのプログラミングを可能に していきます 先ほどご説明しました インフラストラクシャ処理のオフロード 高速化分離などの機能をハイパー スケーラーテレコムインフラ エンタープライズなどの領域に適用して いきます この銅貨自体は オープンに公開されているsdkですので 自由に開発をした 地点ですね使っていただけますがこの右上 にありますような 様々な SPプロバイダーと ソフトウェアベンダーと連携しましてどう かを使用して DPを組み込んだ製品をリリースで いただいています 今回のセッションではサイバー セキュリティからパラオトネットワークス プラットメインフラクタクシアから VAのソリューションを
(11:51) ご紹介します この銅貨はですね ファンワーキテクチャーとして ブルーフィード23などの世代をまたがっ ても 使っていただけるよう ソフトウェア互換性を考慮して 開発されています GPUのsdkとしては クーダと呼ばれるsdkが 認知されて 広く使われていますがこのDP用のsdk はどうかと覚えていただければと思います 次のスライドから実際にスマートニック DPを活用したユースケースをご紹介して いきます 最初のユースケースは nfvi向けの高速化された オープンスタックのユースケースです 通信事業者のnfviの環境では vnf バーチャルネットワーキング ファンクションの 仮想基盤として オープンスタックが広く使用されています 代表的なオープンスタック
(12:53) ディストリビューションである レタと オープンスタックプラットフォームや カノニカルの チャームドオブオープンスタックの コンピューティングプラットフォームで コネクテックス DXや ブルーフィード2を使っていただきます srobdpdk オーブsdpdkといった標準的な ネットワー機能はもちろんのことやはり肝 となるのは ovs に なります コネクトXブルーフィードの内部には ベーシックベースの組み込みスイッチが 入っており オープンVスイッチのフローエントリーを 動的に登録してパケット処理ができますの で VXランの延期アップでキャップや コネクショントラックトラッキングなどの ハードウフローズ処理も同時に行います ソフトウェアベースのwebs処理と比較 して 低遅延で高いパフォーマンス工場が見込め ますので nfviに限らずたくさんのお客様の
(13:57) オープンスタック環境で 欧米の導入実績がございます 国内でもテレコムのお客様の5Gメック等 で 商用実績が出てきております このスライドではですね オープンスタックのみに触れていますが レッドアートのオープンシフトなどの クワネテスをベースとする コンテナプラットフォームにおいても コネクテックスやブルフィードを 容易に管理 デプロイするための ネットワークオペレーターというツール なども 提供しております 次のユースケースは5Gのユーザープレー 機能 upfの高速化です 5Gコーネットワーク5GCの ネットワーク機能の一つである upfは5gネットワークの中心に 配置されます upfは5Gの基地局と インターネットの間で大量のユーザーを 収容しパケットのルーティングと転送
(15:02) パケット検査 QS処理などを含む ユーザーデータプレーンを処理します このため ソフトウェアのみのソリューションでは5 GFにupfに必要なスケールと パフォーマンスを提供するには 不十分になってきています 特にインターフェース速度が100キロの 場合は何かしらのハーディアアフロートが 必要になります こちらはまだ開発中のソリューションです ので upfの開発ベンダーと 積極的に効力協力してコネクテックスや ブルーフィードを使用した5gpgufp upfへの適用を加速しています upfパケット処理パイプラインの サンプルを 表していますが3gppで規定されている N3やN6 インターフェースの 入出力で必要とされるパケット処理の例を 表しています 細かい部分はご説明いたしませんがこう
(16:07) いった 従来はホスト側のCPUで処理されていた 様々なパケット処理の一部を スマートニックやDPAやオフロードする ことで CPUリソースを削減し 加入者水溶数の増大するプットを上げ られることが可能となります 次はGPUダイレクトrdmaによる高速 化ですこちらは GPUと組み合わせた高速化技術になり ますが ハイパフォーマンスコンピューティング メディアンドエンタテインメント5 gverなどのユースケースで使用されて います ブルーヒートの両方で 対応可能となります このGPUダイレクトRD名を使用すると ネットワークアダプターは GPメモリとの間で 直接 読み込み読み書きができるため システムメモリーでの不要なメモリコピー が 排除されます そしてCPUのオーバーヘッド及び
(17:11) PCIの体験も削減しますので 0.4低減させするプットも向上します こちらの絵ではですね2つの能力間の GPU管通信で HPC等でのヘルス処理を イメージしていますが ビデオスリーミングのですねユースケース では 対空が4k8Kカメラとのデバイスになり まして NVIDIAのリバーマックスと呼ばれる sdkを使用し高精細な動画を処理する際 にも活用されておりまして 多くの実績がございます このGPUダイレクトrdmaは CPUとGPUが複数のノード間で 構成されるような decbootcompiting分散 コンピューティングを実現する上で 重要な技術となります 次はサイバー病サイバー防御を強化する ユースケースです
(18:15) ネットワークセキュリティベンダーとして テレコムのお客様でも 実績がございますパラルトネットワークと の 典型 連携ソリューションです パルアートネットワークスの バーチャルネクトジェノファイアールで あります VMシリーズに インテリジェントトレックオフロード ITOと呼ばれる機能が PowerOS10.1で追加されてい ます この機能を使うことで 検査が必要なトラックは ホスト側のVMシリーズで処理し ビデオデータや 暗号化されたデータなど 検査が常に必要でない特定のフローは DPがにお風呂として ヘアピンドリカエスクことによって 全体のパフォーマンスを100gbps まで上げることは可能です このvmcと dpuの間はgrpcを使って セッション情報を常にやり取りしており ましてこの dpu内部には セッションテーブルを保持していますので
(19:19) セッションテーブルをロックアップし 該当セッションにセッションにマッチする パケットが 到達している場合には オフロード処理となり 別な棒とから出力されるような形になり ます この例ですと20%が 常に検査が必要なフロー 80%が オフ ロードされたフローで5倍の高速化となっ ています このオフロードについてはあらかじめ決め られたポリシーに応じて 動的に処理されます こちらが最後のユースケースですが 9月に行われました 弊社イベントのdgc 並びに vmairさんのイベント Vメアエクスプロアでも大々的に アナウンスされましたので ご存知の方も 多いかもしれません まず最初にですねこちらは従来の VMや vsフェアでのイメージですけどもこの
(20:23) x86Force上に essiのバイザーが搭載し NSXなどの インフラクチャーのワークロードも エクサーチ6コース上で動作しています そしてこの9月にリリースされました vmarVスペアの8.0で ブルフィード2のdpuがサポートされ ました このイメージにもありますように dpuのこのアームコア上にですね usfサイが動作し 従来は x86ホスト上で動作していた NSXのネットワーキングやセキュリティ V3のストレージ ホスト管理など インフラストラクチャーに関するワーク ロードが オフロードできるアーキテクチャが追加さ れています これは プロジェクトモントレーという名前で2 年間の開発を得て Vスフィアディストリビテッドサービス エンジンとして一般提供されました V
(21:28) スペアの8.0では フェーズ1ということでまず NSXのネットワーキングや セキュリティの部分が オフロードできるようになりましてこの V3の ストレージのフォルトについては 来年を予定しています ますまたベアメタルのサポートも 計画されております こういったDPを導入した環境において 様々なワークで 単一の安全な運用モデル ライフサイクルマネジメントを Vスピア上で提供できます そして インフラタクシーアドメインから ワークロードドメインを分離し 様々なインフラクターサービス機能を DPにオフロードして ホスト側のCPU処理を削減しかつ高速化 させることができます こちらは Vスペア
(22:31) 8.0とブリヒート2の環境にて オープンソースのインメモリデータベース である デリスのキーバリューストアのデータ処理 を ブルーフィードDPA オフロードした時のベンチマークテストに なります ホスト上では 64個のCPU4が搭載されておりまして この左側ですね グレーの グラフの標準的なニックの場合ですと x36ホスト側で12個のですねCPU コアが レディースのデータ処理で使用されてい ました そのワークロードを depu側に オフロードさせることによって ホスト側では12個のCPUコアを 削減でき 20%のコアが 節約節約できました そして CPUコアの削減だけでなくこの 右側のですねこの緑のグラフになります ようにする プットが 8.8 ミリオントランザクションパーセックだっ たものが12
(23:34) ミリオントランザクションパーセックと いうことで 36%のパフォーマンス向上も 達成できています このベンチマークテストは分散型データ ソースのユースケースですが システム全体のパフォーマンスを向上させ ながら大幅なコアな切削を実現する dpuの価値を表しています その他のユースケースでは スループットや遅延に敏感なハイ パフォーマンスコンピューティングや5G パケットコアも 想定されています NVIDIAでは ランチパッドと呼ばれる ポック トライアルプログラムを用意して 提供していまして Vスフィア8と ブルーフィートDPの環境では2つの ハンズンラボも開始されています その中で ブルーフィードDPを活用したデータパス オフロード 先ほどのベンチマークテスト結果でご説明
(24:38) した リリスワークロードのパフォーマンス アクセレーションも含まれています 今後のご提供についてはですね 基本的には 認定されたサーバーベンダーからのご提供 となります 第1弾は出るからで12月から デルさんのパワーエッジサーバーや VX システムにブルーフィドDPをあらかじめ 搭載して ご提供という形になります その次は Lenovoがですね 来年の 第1四半期中にご提供という流れとなり ます それでは DPのロードマップについて少し触れます ブルド2はすでにリリース済みでブレイド 3はですね2023年3月リースを予定し ています ブルフィード4ですがこちらは800 GPSの帯域でアームコア数の増やし コンピューターも増大したDPとなります リリースは2020年
(25:44) 以降を予定しています またこちらには載っていませんが ブルフィード2にですねアンペア GPUのA30またはA100が搭載され た A30x A100xと呼ばれる コンバージョンアクセレーターも販売して います そちらはvlineやaiベースの栽培 セキュリティなどで 活用されていきます 最後のまとめとなりますが NVIDIAは今後も テレコムデータセンターの変革を目指して いきますそして 通信事業者が AI5G5Gの可能性を最大限に実現 できるようご支援してまいります DPベンダーは 増えてきており 選択肢も増えつつありますが NVIDIAのブルーヒドDPは クラス最高のパフォーマンス 効率及びセキュリティを提供していきます スマートニックDPのご利用については 弊社のパートナーエコシステムを活用して いただき
(26:48) クラウドからエッジまで セキュアで高速なコンピューティング プラットフォームを展開できるよう今後も サポートさせていただきますと幸いで ございます それでは本セッションは以上となります ご参加いただきましてありがとうござい ました

…………………………………………………………….
【関連リンク】
https://www.nvidia.com/ja-jp/networking/ethernet-adapters/
https://www.nvidia.com/ja-jp/networking/products/data-processing-unit/

関連記事一覧