2024年12月11日にリリースされた「Gemini 2.0 Flash」を試してみました。
GeminiとのPC画面共有や画像解析といった画期的な機能があり、とても興味深いです。
目次
Gemini 2.0とは
「Gemini 2.0 Flash」は、2024年12月11日にリリースされたGeminiの新型モデルで、以下のような特徴があると説明されています。
- 高速
→もともとの高速軽量モデルである「Gemini 1.5 Flash」を基に構築されており、「Gemini 1.5 Pro」の速度の2倍を上回るとされています。 - 強力なマルチモーダル対応
→強力にマルチモーダル対応されており、入力面と出力面ともに、テキスト、画像、動画など複数の種類の情報との統合がなされています。
Gemini 2.0でできること
「Gemini 2.0 Flash」は、2024年12月13日現在でも、Google AI Studioで試すことができます。
以下に、とても興味深いその機能を整理してみました。
Gemini 2.0 Flashで主にできること
- Create Prompt
・通常のテキスト生成(速さが体感できます、、)」 - Stream Realtime
・Talk to Gemini(Geminiと音声会話)
・Show Gemini(Geminiとテレビ電話)
・Share your screen(GeminiとPC画面共有しながら音声会話) - Starter Apps
・Spatial Understanding(画像の物体認識)
・Video Analyzer(動画の文字起こし、翻訳字幕作成など)
・Map Explorer(GoogleMap探索)
など
特に感心したのは、以下です。
Share your screen(GeminiとPC画面共有しながら音声会話)
PC操作で分からないことがあるときなど、Geminiと会話しながら対処することができます。
Spatial Understanding(画像の物体認識)→画像解析
画像内の文字や記号を自動で解析し、テキストデータを自動表示してくれます。
業務活用の可能性
Gemini 2.0の機能、経理業務など様々な場面で活用していけそうな気がします。
- 高速かつ高品質なレスポンスの活用
- PC画面共有を利用し、PCを見ていて分からないことをサポートしてもらう
- 画像解析機能を利用し、請求書やレシートから効率的に経理に必要な情報を拾う
(様々なレイアウトの読取りが不要になる) - 英語動画の日本語での把握(情報収集の多様化、効率化)
- データやレポートの作成アシスト