概要
さくらインターネットでは、2025年9月に発表したマネージド型HPCサービス「さくらONE」をはじめ、多数のGPUクラウドサービスを展開しています。
お客様にコンピューティングリソースを提供するクラウド事業者として、
ネットワークにおけるマルチテナンシーを確保しつつ、高性能なサービスを迅速に提供することが責務となります。
その要件を満たすため、当社では以下のような新たなネットワークアーキテクチャの採用に挑戦してきました。
・シャーシ型スイッチ中心の構成から、EVPN/VXLAN を用いた Clos トポロジーへの試行
・GPU基盤におけるSONiC(ホワイトボックス)の導入
いずれも業界においては一般的な技術ではありますが、Lossless Networkを前提とする大規模 GPU 基盤へ本格導入するのは、今回が初めての試みでした。
これらの技術に挑戦したことで、従来とは異なる強み・弱みが明確になりました。
また、マルチベンダー構成や台数の多い Clos トポロジー、さらにはマルチテナント要求を安定して運用する上では、
オペレーションの自動化、構成管理、監視基盤の標準化が不可欠であることも見えてきました。
本セッションでは、これらの課題を解決しながら GPU 基盤を運用してきた経験を共有するとともに、より良いアーキテクチャがどのようなものなのかを議論したいと思います。
議論ポイント
・アーキテクチャの選定基準やメリット、デメリットについて
・GPU基盤におけるマルチベンダー選択を行うことについて
・増大する運用コストに対する解決アプローチについて
場所
本会議場2 グラングリーン大阪北館6F 6-1
日時
Day1 2026年2月11日(水) 16:00~16:40 (40分)
発表者
Kiyohiro Kurosawa
公開資料
各種情報
| ストリーミング配信 | 実施する |
| アーカイブ配信 | 実施する |
| SNSやSlackでの議論 | 制限しない |
| プログラム種別 | 登壇者から応募のあったプログラムです |
アーカイブ配信
本会議終了後、順次配信予定です
