訓練データの性質によって「教師あり学習」「教師なし学習」「強化学習」の3つに大別できます(※強化学習を教師なし学習に含めることもあります)。
教師あり学習
訓練データとして、ラベル(正解)付きデータを使用する学習方法。入力に対する正しい出力の例を与えることで、入力と出力の関係を学習させる。
教師なし学習
訓練データとして、ラベルなしデータを使用する学習方法。クラスタリングなどのためにデータ構造を学習させる。
強化学習
正解データの代わりに、与えられた環境における個々の行動に対して得点や報酬を与える学習方法。一連の行動に対して評価値を与えることで、高い得点を取る、すなわち最良の行動を自律的に学習させる。
教師あり学習と教師なし学習の違いは、入力データに対する正しい答え(出力)が与えられているかどうかです。
教師あり学習による分類では、正解となる分類先があらかじめ定義されていますが、教師なし学習の分類では、与えられた入力データ同士の類似度分析などを通してシステム自らがグループを定義し、グルーピングします。クラスタリングは教師なし学習の代表的な活用事例です。