DEVELOPER’s BLOG
技術ブログ
2分類SVMモデルの活用事例
1.SVMの定義
SVMとは、パターン認識の手法を用いて物事を分類することである。 パターン認識は事前に学習したデータを用いて、 新たなデータがどこに属すものかをあてはまる手法である。
2.分類する線を引くイメージ
集めたデータを元に最も適した線を引く。 クラス1に分類するものとクラス2に分類するものの間に 識別境界線を引くことで2つのクラスを分けることができます。 
3.識別境界線を引く方法
では、どのような基準で識別境界線を引くことができるのであろうか。 ハードマージンと呼ばれる関数が最大値になるベクトルが識別境界線となる。 つまり、マージンは、2クラスのデータの中で最も他クラスと近い位置にいるもの (これをサポートベクトルと呼ぶ)と識別境界f(x)=0との間のユークリッド距離のことです。 ただマージンを最大化して境界線を引くだけでは、境界線が平行移動すれば片方のクラスが 大きくなり、もう片方のクラスが小さくなる問題が生じる。 そのため下のグラフの赤いサポートクラスをd1と置き、青いサポートクラスをd2と置く。 そしてd1とd2を2で割れば最適点oが導かれる。この最適点oを通る識別境界線が クラス1とクラス2を分類するための最も適当な線となる。
4.識別境界線を用いて分類することができる例
- 迷惑メールと通常のメールの区別
- 郵便番号を認識して分類する
- 顔認識ができる。事前に画像ピクセルから出された値から顔を否かを識別できる。
5.私見
私見では、SVMを応用することであらゆる画像を認識して対象のものか否かを区別できる 便利なツールとして用いることができる。 近年のアマゾン問題における過度な労働から機械化を進める大きな要因になると考える。 例えば、画像認識を用いれば、ダンボールの位置や向きやサイズの状態を画像が判別して振り分け作業が可能となる。 この技術が発展すれば人手が多く必要な工場では機械が導入され労働状況の改善や企業の生産力の工場に寄与することとなる。