概要
ChatGPTの登場や普及によって生成AIという言葉が広まり、スマホさえあればAIを利用できる時代になってきました。ニーズが高まっている生成AI向けのインフラ基盤のパブリックサービスを提供するために、さくらインターネットではどのように設計構築したこと(そして困りごとも)、2024年にリリースしたGPUサービスをどのように運用していること(そして困りごとも)を本プログラムで共有し、皆さんと議論したいです。
- 生成AIインフラ基盤のパブリックサービスに取り組んだきっかけ
- 生成AIインフラ基盤のご紹介
- グローバルやローカル回線のネットワーク構成
- インターコネクト回線のネットワーク構成
- 配線設計
- 接続規格
- 今後のチャレンジ
- 今までに経験してこなかった規格外(想定外)の構築や運用
- スケジュール
- 構築人数と期間
- 電力/空調対策
- 騒音対策
- ケーブルやパーツの落とし穴
- 「話しあいたい」テーマ
- ラックの設計や配置で工夫したことありますか?(特に高負荷)
- 電源設備やPDUまわりで苦労した経験ありますか?
- 大規模構築のときはどのような体制ですか?
- 水冷ラックのネットワーク装置どうしますか?
- 配線どうしてますか?工夫していることありますか?
- サードパーティ製 トランシーバの選定/検証ってどうしてますか?
ネットワークを中心としたAIインフラ設計・構築・運用に関する課題や苦労を共有するとともに、会場の皆さんと「話しあい」で今後のAIインフラ基盤のあり方につないでいきましょう。
場所
JPRSホール (コンベンションホールA)
日時
Day2 2024年7月4日(木) 10:15~11:15(1時間)
発表者
井上 喬視
さくらインターネット株式会社
高峯 誠
さくらインターネット株式会社
平田 大祐
さくらインターネット株式会社
公開資料
Slackチャネル
会期中や会期終了後の議論にお使いください
#janog54-sakura-生成ai向けパブリッククラウドサービスをつくってみた話
アーカイブ配信
- YouTube
Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on Yo...