AIプロジェクトを進めるにあたってのプロセスについて。
目次
AIプロジェクトのプロセス
- データ収集方法と利用条件の確認
- 学習可能なデータの収集
- データの加工
- 開発・学習環境を準備する
- AIモデルの学習
- 推論を行う
1)データ収集方法と利用条件の確認
- AIプロジェクトにおいては、「データの質と量」が重要
- 「オープンデータセット」→企業や研究者が公開しているデータセット
(ImageNet、PascalVOC、MS COCO、WordNet、SQuAD、DBPedia、LibriSpeechなど) - 「自身で集める」→センサを利用し、環境の情報を計測するアプローチ
- 「外部から購入」
2)学習可能なデータの収集
- AIプロジェクトにおいては、「AIモデルを訓練できるデータとなるよう留意」する必要あり
- 認識すべき対象の情報が十分に含まれている必要あり
- データの偏りをなくす必要あり(十分な量を収集する)
- データの網羅性が重要(可能な限り広い状況を網羅できるように準備)