こんにちは!
完全に私事になってしまいますが,,,
とうとう僕の論文が正式に論文誌に投稿されることになりました!!
嬉しいのでブログにてご報告致します笑
 
学部4年生の時から研究していたテーマで,修士1年の時に国際学会で発表し,そこで評価されて査読を通り,とうとう論文誌に載りました!
結構長い道のりでした!
 
ということで簡単に僕の論文を説明しときます.
 
X-means法によるクラスタリングとランダムフォレストを組み合わせてパラメトリック手法である線形回帰分析の精度を上げよう!というものです.
 
従来の線形回帰分析は非常に簡易的で結果も分かりやすいですが,理論の根本にデータは正規分布に従うという前提があります.
つまり正規分布に従わないデータには適さないのですね!
それを解決するために一般化線形回帰や一般化混合線形回帰があるわけです.
これらはパラメトリック手法の典型です.
パラメトリック手法とは背後にある特定の分布を想定した手法です.
 
一方,背後に特定の分布を想定していない手法群はノンパラメトリック手法と呼ばれます
X-means法やランダムフォレストはノンパラメトリック手法の1種です.
これらは,分布を想定しないので基本的にどんなデータに対しても使えますが,結果が分かりにくかったりどの変数が影響を与えているのかが分かりにくかったりします.
 
ひたすら予測精度を追い求める状況や大量の複雑なデータがある状況などはノンパラメトリック手法が用いられますが,実装も簡単で可視化しやすいパラメトリック手法は実務の場で依然として根強い人気を誇っているのが事実です.
 
それならどちらからもいいとこどりでしちゃえ!ノンパラメトリックで背後に存在する要素を見つけ,最終的にはパラメトリックでアウトプットすれば良いじゃん的なことをやっていました!
まあ結構先行研究に勝てなくて苦労したのですが笑
正直今考えると,階層ベイズなどの既存手法もアプローチが似ているので比較すべきだったなと思ってます.
今後の課題ということで!
 
今は全く違うテーマで修論に取り組んでいるのでそちらを頑張りたいです!
それではまた!