機械学習の手法のうち「ナイーブベース」「ニューラルネットワーク」について。
目次
AI・ディープラーニングの全体像
- 人工知能
- 機械学習
- ディープラーニングの基本・応用
- ディープラーニングの研究
- AIプロジェクト
- AI社会実装に伴う法律・倫理
機械学習(教師あり学習)の手法⑤ナイーブベース
- 「ナイーブベイズ(Naive Bayes)」
→特徴量同士が無相関という単純化仮定を置いている
→各特徴量(説明変数)が、独立的に予測対象に影響を与えているものと仮定したうえで、与えられたデータから考えられるすべての確率を計算し、「事後確率」が最も高いクラスに観測データを分類する - 「単語の出現頻度」にのみ注目し、「単語同士の関連性」については考えない
- 特徴的な語句の出現頻度を分析の特徴量とし、互いに無相関と仮定する
- すべての関係性を考慮して確率を計算すると、膨大な計算量になってしまうため、速度を維持するために無相関としている
- 並列分散処理が可能→高速なリアルタイム処理に強い
- シンプルな手法であり精度は高くない
- 文章分類など低リスクな用途に限られる
機械学習(教師あり学習)の手法⑥ニューラルネットワーク
- 「ニューラルネットワーク」→ディープラーニングの基本となるアルゴリズム(画像認識、音声認識など)
- 人間の脳神経系システムを模倣し数理モデル化したもの
- 「人工ニューロン」の集合体
- 3種類のレイヤー(入力層・隠れ層(中間層)・出力層)から構成
- 「入力層」→非構造化データを受け取る
- 「隠れ層」→データから識別に必要な特徴量を学習する
- 「出力層」→予測結果を出力する
※分類問題の場合、予測クラスの数だけノードの数があり、出力値は各クラスに属する確率を示す - 結合の強さ(重み)→入力と出力の関係性を示す
- 学習→正しい予測を出力できるよう、ニューロン間の結合の強さを最適化する作業