ひとことで生成AIといっても、テキストを生成するのか、画像を生成するのかなど、何を生成するかによってカテゴリーがあります。
一般社団法人生成AI活用普及協会(GUGA)監修「生成AIパスポート テキスト&問題集」(日本能率協会マネジメントセンター)で学ぶ!
※イラストは、AIツール(DALL-E3)を使用して作成しています。
目次
生成AIのカテゴリー
生成AIの種類 | 内容・特徴 |
---|---|
テキスト生成AI | ・「自然言語処理」と「機械学習」によりテキストデータを自動生成 ※「自然言語処理(Natural Language Processing)」とは、コンピュータに人間の言葉を理解させるための技術 |
画像生成AI | ・画像を自動生成 ※手法 ①「GAN(敵対的生成ネットワーク)」 →ネット上の画像データを学習し、画像のリサイズ・正規化・データ水増し等により前処理。生成器と識別器を競わせて高品質な画像を生成。 ②「VAE(変分自己符号化器)」 →エンコーダで情報を圧縮し潜在ベクトルにし、デコーダで復元 ③「CNN(畳み込みニューラルネットワーク) |
音楽生成AI | ・音楽を自動生成 ※「MIDIファイル」等から学習し、連続性データ処理に適する「RNN」等でデータ水増しして生成。 |
音声生成AI | ・音声を自動生成 ※「教師あり学習」が一般的に用いられる |
動画生成AI | ・静止画像を連続結合し、動画を自動生成 ※「GAN」・「VAE」を用いる ※各フレーム間の一貫性を保つため、連続性データ処理に適する「RNN」が用いられる。 |
ディーブフェイクとは
ディーブフェイクとは、「深層偽造」と訳され、ディーブランニングを活用し、人の顔や動きを再現する技術のこと。
写真や動画の加工に使用され、ディーブランニングモデルである「GAN」や「VAE」などが用いられる。
本物かフェイクかの判別が難しくなり、虚偽の映像が生成され、拡散されてしまうリスクや、詐欺や情報操作に利用されるリスクが懸念されている。
メリット・デメリット
メリット
デメリット