Gemini 2.0 Flashの魅力とは?PC画面共有と画像解析で広がる可能性

2024年12月11日にリリースされた「Gemini 2.0 Flash」を試してみました。
GeminiとのPC画面共有や画像解析といった画期的な機能があり、とても興味深いです。

目次

Gemini 2.0とは

「Gemini 2.0 Flash」は、2024年12月11日にリリースされたGeminiの新型モデルで、以下のような特徴があると説明されています。

  • 高速
    →もともとの高速軽量モデルである「Gemini 1.5 Flash」を基に構築されており、「Gemini 1.5 Pro」の速度の2倍を上回るとされています。
  • 強力なマルチモーダル対応
    →強力にマルチモーダル対応されており、入力面と出力面ともに、テキスト、画像、動画など複数の種類の情報との統合がなされています。

Gemini 2.0でできること

「Gemini 2.0 Flash」は、2024年12月13日現在でも、Google AI Studioで試すことができます。

以下に、とても興味深いその機能を整理してみました。

Gemini 2.0 Flashで主にできること
  • Create Prompt
    ・通常のテキスト生成(速さが体感できます、、)」
  • Stream Realtime
    ・Talk to Gemini(Geminiと音声会話)
    ・Show Gemini(Geminiとテレビ電話)
    ・Share your screen(GeminiとPC画面共有しながら音声会話)
  • Starter Apps
    ・Spatial Understanding(画像の物体認識)
    ・Video Analyzer(動画の文字起こし、翻訳字幕作成など)
    ・Map Explorer(GoogleMap探索)

など

Share your screen(GeminiとPC画面共有しながら音声会話)
Spatial Understanding(画像の物体認識)
Map Explorer(GoogleMap探索)

特に感心したのは、以下です。

Share your screen(GeminiとPC画面共有しながら音声会話)

PC操作で分からないことがあるときなど、Geminiと会話しながら対処することができます。

Spatial Understanding(画像の物体認識)→画像解析

画像内の文字や記号を自動で解析し、テキストデータを自動表示してくれます。

業務活用の可能性

Gemini 2.0の機能、経理業務など様々な場面で活用していけそうな気がします。

  • 高速かつ高品質なレスポンスの活用
  • PC画面共有を利用し、PCを見ていて分からないことをサポートしてもらう
  • 画像解析機能を利用し、請求書やレシートから効率的に経理に必要な情報を拾う
    (様々なレイアウトの読取りが不要になる)
  • 英語動画の日本語での把握(情報収集の多様化、効率化)
  • データやレポートの作成アシスト

この記事が気に入ったら
いいね または フォローしてね!

  • URLをコピーしました!
目次