AI第3次ブームを支えた機械学習・深層学習について。
目次
機械学習
「機械学習」とは、AIプログラム自身がデータから学習する仕組みのことです。
ビッグデータ
- AIは、その構造上、サンプルデータの数が多ければ多いほど望ましい学習結果が得られる
- 1990年、インターネット上にWebページが作られ、データの蓄積が容易となった
- 十分なデータを蓄積されるまでは”ルールベースの手法”になるが、ルール設定そのものが困難であったり、ルール外の想定しない状況には柔軟に対応することが難しいデメリットがあった
- 2000年以降、インターネットが普及し、「ビッグデータ(インターネット上に蓄積された大容量のデータ)」が注目される
- レコメンデーションエンジン、スパムフィルタ→機械学習によって実用化されたアプリ
統計的自然言語処理
- インターネット上のWebページの増加が、統計的自然言語処理という分野の研究を進展させた
- 複数の単語をひとまとまりにした単位(句・文単位)で用意された膨大なデータから最も正解の率の高いものを選択する
- コーパス(対訳データ)の大量保有により、確率の高い選択肢を選ぶことができる
特徴量設計
- 「注目すべきデータの特徴の選び方」が性能を決定づける
- 「特徴量」→「注目すべきデータの特徴」を量的に表したもの
- 「特徴量学習」→特徴量そのものを機械学習自身に発見させるアプローチ
- 「ディープラーニング(深層学習)」→特徴量学習を行い機械学習アルゴリズムの1つである
- ディープラーニングは、与えられたデータの特徴量を階層化し、組み合わせることで問題を解く
- ディープラーニングでは、ニューラルネットワーク自身が、複数ステップのコンピュータプログラムを学習できる
- 与えられた問題を解くために必要な処理に役立つ情報が特徴量として抽出されていると考えられる
- ディープラーニングは、自動的に特徴量を抽出することから、ブラックボックス型のAIといわれる