監視稼働削減のためのアラームコリレーションについて

概要

我々NTTフィールドテクノ 及びNTT-MEのNOCでは, 24時間365日大規模なNW設備の監視・運用保守を行っており, 大規模かつ成長し続けるインフラネットワークを限りある人員で保守するため, 生成AI等を活用したNetwork Automation(運用自動化)による業務の生産性向上に取り組んでいます.

NOCオペレータにとって最も負荷となっていることのひとつとして, 刻々と発生するNWデバイスからのアラーム(syslog, SNMP TRAP等)の監視にかかる稼働があり, 以下のような状況に頭を悩ませています.

・無視してもかまわないアラームが頻繁に発生しオペレータの注意力を継続的に削ぐ
・NW障害の際に, 周辺装置からも波及的にアラームが大量発生し根本原因が分析しづらくなる
・原因切り分けに他社網 NOC(FT⇔MEなど)や保守ベンダとのやり取りが必要で手間と時間がかかる

これらの問題の解決のために, アラーム間の関係性を分析することでアラームを集約・フィルタすることを可能にする「アラームコリレーション」についてNTT-FT, ME及びNWデバイス保守ベンダとしてNECという監視保守業務で縁(en)の深い3社が連携し試行錯誤しています.
従来アラームコリレーションツールの適用範囲は限定的なものでしたが, 昨年末より生成AI(LLM)エージェントの拡張に関する標準化プロトコル(MCP, A2A)が提案され, これを活用することでより幅広いケースへの対応が可能になると考えました. 下記のようなアプローチを紹介させていただき, アラーム監視に関わる課題感やアラームコリレーションの実現性について議論させていただければと思います.

■MCP(Model Context Protocol)を活用したコリレーションツールのアンサンブル コリレーションに用いることのできるツールやAIは既に多くのものがありますが, 単独で用いるだけではカバーできないケースが残ります.
そこでLLMエージェントがLLMとツール間連携の標準化プロトコルであるMCPを介し複数のツールを呼び出し組み合わせる(アンサンブル)ことで対応ケースの拡張を図りました.

■A2A(Agent2Agent Protocol)によるNOC業務における他社間エージェントの連携 ネットワークトラブルに関するネットワークオペレータとベンダのやりとりなど他社間のコミュニケーションは, 状況が様々であることやシステムの運用環境の違いから自動化が難しく, 現状オペレータがメール等でやりとりせざるを得ません. これをこれを異なる環境間のLLMエージェント同士の連携の標準化プロトコルであるA2Aを用いることで, 他社間の対応をデジタルレイバー(労働者)同士の やり取りに置き換えることで自動化を試みました.

議論ポイント

・アラーム監視に関する課題感について
・アラームを削減するためにどのようなアプローチをとっていますか など

場所

大展示場1/1F

日時

Day1 2025年7月30日(水) 16:00~17:00(1時間)

発表者

佐藤 亮介
sato ryosuke
株式会社NTTフィールドテクノ
荒井 新太郎
arai shintaro
株式会社エヌ・ティ・ティ エムイー
関谷 郵政
sekitani yusei
日本電気株式会社
白井 嵩士
shirai takashi
株式会社NTTフィールドテクノ

公開資料

各種情報

ストリーミング配信 実施する
アーカイブ配信 実施する
SNSやSlackでの議論や情報共有 制限しない

アーカイブ配信

公開終了しました。