English information here
概要
ネットワークで発生する障害やオペレーションミスを自動で素早く検知したい。異常検知を精度よくすることは
問題発生時のネットワークへの影響の広がりを事前に抑えることができます。
一方で、ルータは大量の経路情報を持ち、またベンダー製品を主に利用することから詳細な情報を短時間で取得する手段に制限があります。また近年、サーバや仮想化の分野では詳細な情報をLinux kernelから取得する手段としてextended Berkley Packet Filter(eBPF)が注目されています。
IPネットワークにおいても、SONiCをはじめとするソフトウェアルータのようなLinuxベースのプロダクトが使用されるようになり、
eBPFデータをルータで利用して上記課題の解決ができないかを検討していきます。本LTでは、SONiC上にeBPFを取得するアーキテクチャを提案し、プロトタイプの実装と評価を行いましたので、その内容を報告いたします。
eBPFデータとして経路情報の変動やBGPプロトコルの挙動を監視するためにTCPメトリックを取得しています。
プロトタイプにおける障害検知精度の評価として、ヒューマンエラーを含むオペレーションとパケロス起因によるBGPネイバーダウンを発生させ、その検知精度をAI/MLを用いて評価しました。
eBPFデータが異常検知への適用できることは、ネットワーク運用における監視や自動化の品質向上に繋がると思いますので、内容や結果を共有できればと思います。
場所
1F 会議室101
日時
Day1 2023年7月5日(水) 17:30~18:00(うち05分)
発表者
Minato Sakuraba(KDDI Research, Inc.)
採点結果
有益性 18 (平均3.8)
新発見 21 (平均4.2)
インパクト 21 (平均4.2)
合計 60 平均4.0
公開資料
eBPFを用いたIPネットワークにおけるAI/ML異常検知手法(桜庭)