Step1:機械学習で何が出来るのか
- 分類(classification)
- 回帰(regression)
- クラスタリング(clustering)
- 推薦(recommendation)
- データの次元数の削減(dimensionality reduction)
■分類
データの分類。例えばある果物を見せた時、それが「リンゴ」か「ミカン」かを判定すること。
■回帰
過去のデータから未来の予測。過去の株価から、未来の株価の予測など。
■クラスタリング
データを似たものの集合に分類。分類では予め決まった項目に分類するが、クラスタリングではデータを似たものに区分けする点が異なる。
■推薦
データの関連情報を導く。ネットショッピングで、ユーザの嗜好から別の商品を推薦するなど。
■データの次元数の削減
データの特徴を残して削減。例えば、食品に含まれる様々な成分を分析したデータを二次元のグラフ上に表現するのは物理的に不可能だが、次元を削減することでグラフに描画が可能となる。
Step2:機械学習の種類
- 教師あり学習(Supervised learning)
- 教師なし学習(Unsupervised learning)
- 強化学習(Reinforcement learning)
■教師あり学習
事前に与えられたデータを先生からの例題と見なして、それを元に学習する手法。
一般的にデータを入力する際、そのデータが何に分類されるのか、答えとなるラベルとデータをセットで与える。そして機械は学習し、モデルを構築する。モデルを構築したら、未知のデータに対しても予測結果を返すことができる。
「分類」は教師あり学習。
■教師なし学習
「出力すべきもの」が予め決まっていないという点で大きく異なる。データの背後に存在する本質的な構造を抽出するために用いられる。
「クラスタリング」は教師なし学習。
■強化学習
現在の状態を観測し、取るべき行動を決定する問題を扱う。
教師あり学習に似ているが、教師から「完全な答えが提示されない」という点で異なる。
強化学習では「エージェント(行動の主体)」と「環境(状況や状態)」が登場する。
エージェントにとって未知のものに対し、どのようにすれば最良の結果が得られるのか、トライアンドエラーを繰り返しながら学習していく。