伝送装置における障害対応自動化の取り組み

概要

伝送装置(WDM)で障害が発生した場合、NOCの監視画面は大量のアラームで埋め尽くされます。
これらのアラームの中から具体的にどの部分で問題が発生しているのか、つまり障害の根本原因を特定することは非常に難しく、熟練のスキルを要します。
しかしながら、組織における人の循環を考慮すると、経験に関わらず「迅速かつ正確」に対応できるようにすることが極めて重要です。
これを実現するためソフトバンクでは、熟練のスキルを落とし込む形で障害対応の自動化に取り組んでいます。

本発表では(あまり語られることのない?)伝送装置(WDM)の自動化に関して、以下の取り組みについてお話します。

  1. マルチベンダー環境におけるアラーム監視画面の統合
  2. RCA(Root Cause Analysis)によるアラーム集約
  3. 正常性確認の自動化
  4. ダッシュボードによる情報集約

最後に今後の展望として、ダッシュボード活用によるIPレイヤーとの業務融合の可能性についてお話します。

議論ポイント

■伝送装置障害の自動化ってやってますか?
・自動リセットなどの自動復旧措置はやっているか
・収容回線への実影響確認はやっているか
・装置のPM(パフォーマンス)データを活用しているか

■伝送トポロジーのデータ管理および可視化について
・装置内のパッケージ間の接続などデータ管理できているか
-どこが壊れても影響回線をすぐに出せる?
・トポロジーを可視化しているか、IPレイヤーとの紐づけはしているか

■伝送レイヤーの運用は今後どうなっていくと考えますか?
・OpenZR+などで機能分離されていくが、その際の運用はどうしていくか
-OpenZR+(トランシーバー)の保守はIP担当?伝送担当?

場所

大展示場1/1F

日時

Day2 2025年7月31日(木) 11:15~12:00(45分)

発表者

小紫 慎哉
Shinya Komurasaki
ソフトバンク株式会社
萩原 賢治
Kenji Hagiwara
ソフトバンク株式会社
甲斐 龍之介
Ryunosuke Kai
ソフトバンク株式会社

公開資料

後日追加予定

その他

本プログラムはストリーミング配信予定です。

アーカイブ配信

本会議終了後、順次配信予定です。