AIプロジェクトを進めるにあたってのプロセスについて。
目次
AIプロジェクトのプロセス
- データ収集方法と利用条件の確認
- 学習可能なデータの収集
- データの加工
- 開発・学習環境を準備する
- AIモデルの学習
- 推論を行う
5)AIモデルの学習
- 初期段階から「モデルの調整」により、大きな精度向上が見込める
- さらに精度向上を目指す
→①最新論文を参考にモデルを改善、②データ量を増やす、③一度の学習で回すループ数を増やすなど
→コストがかかりやすいため、ビジネス目標に対して精度とコストとの折り合いをつける - 既存の学習済みモデルを用いて転移学習する
※「転移学習」→あるタスクで学習されたモデルと新しいタスクに適用する手法
※少数データしかなくとも、ゼロから学習するよりも学習が安定・精度の向上が見込める
→元のタスクと、解きたいタスクとの関連性に気をつける - 学習に用いたデータ以外のテストデータを用いて検証する
- 「バリデーションデータ」を用意し、最終的な性能評価のみテストデータで行うことが推奨される
- 「データリーク」に気をつける
→モデルが学習時に本来知るべきでない情報にアクセスしてしまう現象
→モデルの評価が過度に高くなってしまう原因となり、予期しない誤差を生む可能性がある
6)推論を行う
- モデルを用いて実際の推論を行う
- モデルの最適化・軽量化が必要となることがある
- 定期的にデータを再収集し、モデルを再学習・微調整することが推奨される