AIの社会実装、特にビジネスでの利活用における”AIを開発するプロジェクト”の進め方について。
目次
CRISP-DM
- 「CRISP-DM」(Cross-Industry Standard Process for Data Mining)
- データマイニングのための産業横断型標準プロセス
- 主にデータ分析にテーマを置き、6ステップに分割
- 事業理解(Business Understanding)
- データ理解(Data Understanding)
- データ準備(Data Preparation)
- モデリング(Modeling)
- 評価(Evaluation)
- 展開(Deployment)
CRISP-ML
- 「CRISP-ML」(Cross-Industry Standard Process for Machine Learning)
- Business UnderstandingとData Understandingが統合され、Monitoring and Maintenance(監視・保守)が追加され、改めて6ステップに
- 事業・データ理解(Business and Data Understanding)
- データ準備(Data Preparation)
- モデリング(Modeling)
- 評価(Evaluation)
- 展開(Deployment)
- 監視・保守(Monitoring and Maintenance)
MLOps
- 「MLOps」→Machine LearningとOperationsを統合した造語
- AIを本番環境で開発しながら運用するまでの概念
- 「DevOps」→DevelopmentとOperationsを統合した造語
- AIモデルの構築部分は全体のAIプロジェクトのなかできわめて小さいもので、周辺領域がとても大きく、この全体の仕組みをシームレスに連携し、実際の本番環境でAIを活用するための仕組みやシステムなどが概念に横断的に組み込まれている
- AIをビジネス活用しようとする際、すべてのプロセスを1回だけやればよいというのではない
→システム運用時でも継続してプロセスを回し、より推論精度が高く、安定したシステムとすべき - ①推論を行う環境、②継続的なデータ蓄積の環境、③再学習のための環境
- クラウド:所定の推論用サーバを立ち上げ、利用時はサーバ上のAPIにアクセスすること等でモデルを動かす。サーバの数の検討(少なすぎると不安定、多すぎるとコスト増)が必要。
- エッジ:1台に1つのモデルを割り当てるため、計算負荷は固定。モデルをアップデートする場合には、遠隔で更新する仕組みの開発・装置が故障した場合の運用体制が重要。
進めるためのアプローチ
- 産学連携により、プロジェクト構成メンバーを分散
- 外部のアイデアや技術を統合し、オープンイノベーション化を計る
※欧州:”Triple Helix model”が一般的だったが、”Citizen(ユーザー)”も参画する概念も浸透してきている
AIシステム作成後、教訓を、運用改善・システム改修・次の開発へと循環させていくサイクルが重要
- このAIシステムのメリットや影響を受けるのは誰か
- 想定外のユーザーはいないか
- 判断や最適化を行うときの基準は何か
- 判断や最適化を機械で行うことの正当性の根拠
- AIシステムを悪用される危険性はあるか、防止策は取られているか