Machine Learning (機械学習) (1)

Step1:機械学習で何が出来るのか

  • 分類(classification)
  • 回帰(regression)
  • クラスタリング(clustering)
  • 推薦(recommendation)
  • データの次元数の削減(dimensionality reduction)

■分類

データの分類。例えばある果物を見せた時、それが「リンゴ」か「ミカン」かを判定すること。

■回帰

過去のデータから未来の予測。過去の株価から、未来の株価の予測など。

■クラスタリング

データを似たものの集合に分類。分類では予め決まった項目に分類するが、クラスタリングではデータを似たものに区分けする点が異なる。

■推薦

データの関連情報を導く。ネットショッピングで、ユーザの嗜好から別の商品を推薦するなど。

■データの次元数の削減

データの特徴を残して削減。例えば、食品に含まれる様々な成分を分析したデータを二次元のグラフ上に表現するのは物理的に不可能だが、次元を削減することでグラフに描画が可能となる。

Step2:機械学習の種類

  • 教師あり学習(Supervised learning)
  • 教師なし学習(Unsupervised learning)
  • 強化学習(Reinforcement learning)

■教師あり学習

事前に与えられたデータを先生からの例題と見なして、それを元に学習する手法。

一般的にデータを入力する際、そのデータが何に分類されるのか、答えとなるラベルとデータをセットで与える。そして機械は学習し、モデルを構築する。モデルを構築したら、未知のデータに対しても予測結果を返すことができる。

「分類」は教師あり学習。

■教師なし学習

「出力すべきもの」が予め決まっていないという点で大きく異なる。データの背後に存在する本質的な構造を抽出するために用いられる。

「クラスタリング」は教師なし学習。

■強化学習

現在の状態を観測し、取るべき行動を決定する問題を扱う。

教師あり学習に似ているが、教師から「完全な答えが提示されない」という点で異なる。

強化学習では「エージェント(行動の主体)」と「環境(状況や状態)」が登場する。

エージェントにとって未知のものに対し、どのようにすれば最良の結果が得られるのか、トライアンドエラーを繰り返しながら学習していく。