【プログラム紹介】機器監視のためのZabbixを、DB含めてL3冗長化した話

JANOG54企画編成委員の山田です。

Day2(2024年7月4日)15:30~16:30に開催される「機器監視のためのZabbixを、DB含めてL3冗長化した話」の発表者の小山 拓海さん(株式会社Jストリーム)と今井 宏謙さん(株式会社Jストリーム)に、本プログラムについてお話をお伺いしました。

発表者の今井さん(左)と小山さん(右)

Q:監視対象ネットワークの規模はどれぐらいですか?

A:1000台行かないぐらいです。

Q:構築を進めていく中で沼にハマってしまったことはありますか?

小山さん:DBのレプリケーションの張り方で3カ月詰まりました。最終的には、MySQLからPostgresに変更して解決しました。

今井さん:拠点をまたぐとVIPが使えないのでそこの解決が難しかった。また、ネットワークのレンジの問題もありました。L2だと切れたら相手が死んだと分かるのですが、今回の構成のように、L3だと途中のネットワーク障害の可能性もあるのでその部分が難しかったです。

Q:構築している中で特に印象に残っていることは?


小山さん:基本設計が一番印象に残っています。今までの監視システムは継足しの繰り返しで設計などは無かったが、今回はプロジェクトメンバーで議論しながら1から設計し、きれいに作ることができました。

今井さん:実際に動いた時です。ドキュメントなどを見てこうやればうまくいくではなく、自分たちで理論や設計を考えて、構築してみて実際に動いたところが非常に良かったです。

JANOG54の参加者への期待、議論のポイント

  • 監視ツール何使ってますか?
  • 監視の冗⻑化、監視のサービスレベルどんな感じですか?
  • 監視ホストの登録の方法
  • 監視アラートがなった時の通知方法
  • 資産管理情報と監視ツールの紐づけ
\このページをシェアする/