JANOG49ミーティング 企画編成委員の岡田です。

みなさまお待たせしました!プログラム紹介第3弾は、Day2(2022年1月27日)の10:00から川商第一ホールにて行われる「Clos Network Topologyを運用するために、どのような取り組みをしていますか」の発表者である梅原 潤さんにお話を伺いました。

プログラムに応募したきっかけを教えてください

2015年に LT で参加し、日本のインターネットを支えている人たちが
一堂に会するイベントだということは知っていました。
JANOG はそんな方たちのリアルな知見を得られる場所だと思っています。
会社にフィードバックできるような知見が得られるのではないかと思い今回応募しました。

普段の業務や立ち位置は?

「さくらの専用サーバ」のインフラチームという単位でチームが構成されており、私はここに所属しています。
私は、「さくらの専用サーバ PHY」にてコンテナによるアプリケーション実行基盤やメトリクスス管理・監視基盤、ログ管理・監視の基盤など、サービスを支えるシステム基盤を整備する業務を主導しています。
( 具体的にどのようなことをしてきているかは、 https://d.zinrai.net/ に公開しているので、よければ参照ください。 )

「さくらの専用サーバ PHY」にて実装されている Clos Network Topology は、我々インフラチームの管理下にあります。
我々のチームの管理下にある Clos Network Topology は1人運用の状態となっています。
上記の通り、私は普段、ネットワークに携わるような業務ではありませんが、
健全とは言い難い Clos Network Topology の運用に今後、携わっていきたいと考えている人になります。

今回Clos Network Topologyに取り込もうと思われたきっかけは?

インフラエンジニアとしてサービスを支えている様々なシステムを目にしたり、その運用に携わってきました。
サーバーの uptime が 6500日オーバーでこれが停止すると4つのサービスが提供できなくなるバッチが5分おきに起動していて、サーバーを再起動する時間が無いといったようなシステムを目にし、その運用に携わってきました。
このようなシステムを運用し続けるのは心身ともに疲弊していくことを身を持って経験したことにより、「サーバーを止めてもサービスは稼動する」「サーバーを止めてもサービスへの影響範囲は限定的」なインフラを作るということが
自分がインフラエンジニアである使命だと強く思い、インフラ作りに携わっています。

このような思いを持っているなかで、Clos Network Topology をたまたま見かけ、これも「止めてもサービスは稼動するインフラ」の1つなのではないかということに興味を持ちました。
所属のチームにて1人運用の事実を自分が観測し、Clos Network Topology に興味があったという2つが重なった結果が、今回の取り組みとなっています。

いつから実際の運用にジョインしていく予定ですか?

具体的に何月から等は決まってはいませんが、2022年7月以降になると思います。

最後に参加者と議論したいことなどをお願いします

「運用に携わる」という状態が漠然としているため、それがどのような状態であるのかをすり合わせ、そこに到達するまでの具体的な動きを一つ一つ積み上げていく必要があるということは思っています。
しかし、我々チームにはその知見が一切無いため頭を抱えている状態です。
「運用に携わる」ために「学習」「教育」という切り口にて、
他の組織は具体的にどのよう取り組みをしているのかを時間の許す限り議論していけたらと思っています。
議論した内容をもって、我々チームにて「運用に携わる」の解像度を上げ、
一つ一つ積み上げるための具体的な動きに落とし込んでいきたいと考えています。

また時間の都合により発表の内容には含めていない、
学習のために実装した Clos Network Topology の話は、
サーバー1台で動かす Clos Network Topology」というタイトルで公開しています。
興味がありましたら、ぜひ読んでください。

インタビューにご協力いただきありがとうございました。