YouTube動画の情報を素早く理解したいと思ったとき、AIがどのように要約できるかを試してみました。
その結果、3つのAIで試したところ、Geminiのみが可能という結果に。
Youtubeの内容をいち早く知りたい
Youtubeは、エンタメ的要素もあり、セミナー的要素もあり、情報収集的要素もあります。
情報を短時間で理解しようと思うと、要約できる方法を知っておきたいものです。
方法として最もよく使っているのは、「Mapify」というAIツールを使うとマインドマップ化してくれるというもので、とても便利です。
他に何かないかと考え、以下の3つのAIで要約できるか試してみることにしました。
3つのAIでYouTube要約に挑戦してみた結果
チャット型AIとして主要な「ChatGPT」、「Gemini」、「Claude」の3つのAIを使い、YouTube動画要約能力を比較してみました。
※結論から言うと、Gemini圧勝です。
ChatGPT
そもそもリンクを開くことが難しいようです。
リンクや動画などを直接処理する能力には限界がありそうです。
Claude
ChatGPTと同じく、リンクを開くことが難しいようです。
リンクや動画などを直接処理する能力には限界があるようです。
Gemini
しっかりと要約してくれました!(名前の漢字は間違ってはいましたが、、)。
Geminiだけが要約できた理由は?
なぜGeminiだけがYouTubeの内容を要約できたか。
同じGoogle系サービスだからと思いきや、それだけではない可能性もありそうです。
当事者のGeminiにも聞いてみました。この部分のファクトチェックは私には難しいので、ハルシネーションの可能性もありますが参考程度に、、
そもそもの技術基盤の違い
Google DeepMindの技術を活用したAIで、マルチメディア処理に強みがあるとされます。
特に動画や視覚情報の理解において強力な機能を持っているようです(マルチモーダル処理能力が高い。)。
このことが、動画や音声を理解する点で非常に有利に働いているといえそうです。
データ学習
そもそも、Geminiは、YouTube動画に関するデータで訓練がされているようです。そのため、動画の要約において高い性能を発揮しているといえます。
どう活用する?
- ビジネス動画:マーケティングや教育の動画要約で、短時間でポイントを把握
- レビュー動画:長いレビュー動画を簡単に要約してくれるため、興味のある部分だけを効率よく知る
結論
YouTube動画要約においては、Geminiが他のAIよりも優れていました(というよりGeminiのみができた。)。
同じGoogle系サービスだからという点も関係していますが、それに限らず、どうやらGeminiの持つそもそもの能力(マルチモーダル処理能力)などによるということにも説得力があります。
今後、他のAIが進化する可能性はありますが、現時点では、GeminiのみがYoutube動画要約の面では唯一頼りになるといえます。