概要
複数のISPからフルルートを受信して運用していましたが、障害などで経路の収束にかかる時間が徐々に延びていました。
扱う経路数が多くなったためであり、収束時間の短縮を目的としてISPからの受信経路を変更(フルルートをやめてデフォルトルートのみに)しました。
今回の対応で、ユーザーが満足する時間内での経路収束を実現できました。
また、障害が実際にユーザーに与えている影響を監視する方法が不足していることも、対応を通じて自覚しました。
扱う経路数が多くなったためであり、収束時間の短縮を目的としてISPからの受信経路を変更(フルルートをやめてデフォルトルートのみに)しました。
今回の対応で、ユーザーが満足する時間内での経路収束を実現できました。
また、障害が実際にユーザーに与えている影響を監視する方法が不足していることも、対応を通じて自覚しました。
議論ポイント
・障害発生時のサービス影響をどうやって監視してますか?
起きた障害だけでなく、ユーザーにどういう影響があったかを通知したいのですが、その監視方法を検討しています。
・フルルート運用やめた皆さんと運用上の課題を共有したいです。
Janog34(2014年)でのフルルートやめた話が、対応において大変参考になりました。ありがとうございます。
私たちと同様のチャレンジをされている方々の体験談など、うかがいたいです。
場所
第3展示場B
日時
Day2 2025年1月23日(木) 16:00~16:45(45分)
発表者
古野 竜
Ryu Furuno
NRIセキュアテクノロジーズ株式会社
重根 克彦
Katsuhiko Shigene
NRIセキュアテクノロジーズ株式会社