異常検知は大きく分けて外れ値検出・変化点検出・異常行動検出の3つに分けられます。それらの特徴を捉えた上で異常検知を勉強する上でオススメできる本を3つご紹介します!
 
 
 

はじめに

こんにちは!
大学院2年で専攻は統計科学です.
院生なのに専門的な記事をあまり書いていなかったので今回はそれっぽい記事を書きたいと思います.
 
大学院では,田口先生が考案したタグチメソッドという手法群にベイズ的アプローチを取り入れることを研究しています.
 
タグチメソッドは聞き馴染みのない方が多いと思うので,今後またそれについての記事も書きたいと思います.
でもここらへんの本を読んどけば割と一発なので気になる方は読んでみて下さい.
 

■タグチメソッド入門 

立林先生が執筆したタグチメソッドをひろーくあさーく説明した書籍です.
これを読めば大体の雰囲気が分かると思います.めっちゃ薄くて190ページほどしかないので全体感をつかみたい方には是非オススメです.
 
 

■入門タグチメソッド

こちらは題名が似ていますが,内容はより高度になってます.
数式を用いて説明している部分も結構多いのでより深く知りたい方はこちらも合わせて読むと良いと思います.
機械学習手法に比べればそれほど煩雑な手法ではないので読みきるのに苦労しないと思います.
 
修論の最終的なアウトプットとしてはMT法RT法(タグチメソッド)という異常検知手法にベイズ更新を用い,即時的に変化点を検出するという方向に固まりつつあります(修論やばめ笑)
 
ただ,他にも即時的変化点検知の手法は多々あるので,それらを包括的に勉強しています.
 

異常検知って?

 
異常検知と一口に言っても結構奥が深いんですよねぇ...
 
そこで今日は異常検知に関してオススメの本を紹介したいと思います!
 
そもそも異常検知には3つの種類(パターン)があります.知ってました!?
 
・外れ値検出
・変化点検出
・異常行動検出
 
外れ値検出はデータを記録する上で生じてしまった人為的なミスやありえないサンプルなど.統計的にいって明らかにおかしい値っていうイメージ.
変化点検出は,ある時点を経てデータの構造が変化してしまうような状況.
異常行動検出はぶっちゃけ良く分かってないです笑
外れ値や変化点検出が一時点での変化で判断するのに対して,異常行動はある幅単位での行動の異常を検出するイメージだと思います(勉強不足)
 
あと,単変量データなのか多変量データなのかの違いもありますよね!
 
まあ色々気にしなくちゃいけない要素はあるのですが,僕自身見ての通り,異常検知にそれほど詳しいわけじゃないんです.ただ,初学者としてそれなりに勉強したので,これだけ読んでおけば大体分かるよ!っていうレベルのアドバイスはできると思います.
 
 

オススメの本3選

ということで異常検知のオススメ本をご紹介したいと思います!
 

■入門機械学習による異常検知ーRによる実践ガイド

この本は入門と書いているだけあって本当に分かりやすい.
分かりやすく丁寧で,それでいて数式など理論的なところもしっかり説明されている.
Rによる解析例なども載っているので実践的にも非常に役立ちますね.
ただ,載っている手法が多すぎてどれがどのような状況で有用なのか分かりくい笑
 
 

■異常検知と変化検知(機械学習プロフェッショナルシリーズ)

これは 入門機械学習による異常検知ーRによる実践ガイドの続編ですね.
こちらの方は少し応用編で難しい手法なども載っています.
正直,かぶっている内容などもあるので前編読んどけば良い説はありますね笑
ただ,方向統計学における異常検知や最近流行のChange Finderの理論になっている混合分布における逐次更新型異常検知も載っているのでより高度に勉強したい方は絶対オススメです!
 
 

■データマイニングによる異常検知

こちらは,Change Finder考案者の山西健司先生が執筆している書籍です.
現代のデータマイニングにおける様々な異常検知手法が載っています!
山西先生は論文もいくつか執筆していてそちらを読んでみてから興味があれば書籍の方を読んでみるというのも良いと思います.
論文はこちらから誰でも読むことができますよ!
 
 
まあこれらさえ読んでおけば間違いはないでしょう!完璧!!
もっと高度な本はありますが統計周りをかじっている大学院生にはちょうど良いレベル感がこのへんだと思います.
てかこれ以上難しいと無理笑
僕が扱っているMT法も 入門機械学習による異常検知ーRによる実践ガイドに載っています.ホテリングのT^2とほとんど同じ位置づけです.
修論にむけて必死に研究に励みます!
それではまた今度!