はじめに
紹介する講演:「深層学習による時系列異常検知手法の課題点」
「SIG-SMSHM: スマートマニュファクチャリングとシステム健全性管理研究会」の第1回研究会イベントが開催されたので参加してきた。この際,「深層学習による時系列異常検知手法の課題点」という講演があり,とても興味深かったので紹介する。なお詳細な内容は,講演の前刷り論文に記載されている。
研究の概要
この研究では,性能評価の妥当性(評価用の公開データセットや評価指標)および古典手法との性能比較の点で,深層学習による時系列異常検知は問題があると指摘し,そのうえで問題設定を重視するべきと主張している。
先行研究との比較
公開データセットの問題点
異常検知問題の代表的なデータセットには,
- trivialな異常が含まれている
- 間違った異常ラベルがある
- 異常個所の割合が多い
といった問題がある。
評価指標の問題点
異常個所の割合が多いデータセットでは,ランダムな予測をするアルゴリズムでもよい評価値が得られることがある。
古典手法との性能比較
古典的な手法であるtime series discord系の計算手法によって,深層学習ベースの手法よりも高い性能が得られている。
先行研究では,故障検知や故障診断の手段である異常検知が目的化している。そのため,公開データセットと評価指標に問題がある。
この研究の主張
問題設定を重視する
根本的な問題として,異常検知の手法の探求が目的となっており,故障検知や故障診断といった異常検知の目的や前提が顧みられなくなっていることが挙げられる。
(※註:故障検知は,システムが壊れたことを検知することである。一方異常検知は,システムが普段と異なっている状態(壊れているとは限らない)を検知することである。)
時系列異常検知の研究をより深い意義のものとするために,
- 対象とするシステム
- 対象とする故障モード
- 得られるデータ
- 異常検知後の対応(原因特定・機能回復など)
という4つの観点で問題設定を絞り込んでいくべきである。
私見と考察
問題設定の重要性に言及している点が,付加価値が高い
故障診断の実務に取組んでいる人からすると,上記4つの問題設定の観点が重要であることは直感的に理解できていると考えられるが,このことを明文化して主張している点が,この講演の付加価値が高い点だと考える。
たとえば,お客様先に収めた製品の故障診断を行なう場合,「単にいつもと違う挙動(=異常)を検知するだけでは不十分で,実際に壊れている箇所を見つけて補修するためのアクションアイテムを決める」ことまで求められることがある。この場合は,単に多変量の数値ベクトルから異常を見つけるだけではなく,異常個所推定まで行う必要が出てくる。
単に異常検知の性能を高めていくだけではなく,問題設定をきちんと行なうことで,実務上でも有益な技術開発ができるようになることが望ましいと考えられる。