Gemini 2.0とコード実行機能の紹介
Google AI Studioに新たに登場したGemini 2.0は、その高度な機能の一つとして「コード実行」を提供しています。この機能により、GeminiモデルはPythonサンドボックス環境で直接コードを実行することができ、その結果を学習することが可能です。例えば、計算を行ったり、複雑なデータセットを分析し、そのデータをもとに瞬時に視覚化を行ったりすることができます。これにより、ユーザーの質問に対してより良い回答を提供できるようになります。
コード実行がもたらす新しい可能性
Gemini 2.0のコード実行機能を有効にするには、Google AI Studioの「ツール」パネル内のトグルを使用するか、Gemini APIでツールの変数として設定します。以下は、その具体的な方法です。
from google import genai
from google.genai import types
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
model='gemini-2.0-flash',
contents="""最初の50の素数の合計は何ですか?計算のためのコードを生成して実行してください。""",
config=types.GenerateContentConfig(
tools=[types.Tool(code_execution=types.ToolCodeExecution)]
)
)
コード実行がツールとして追加されると、モデルは最大30秒間、最大で5回再プロンプトすることなくコードを実行するサンドボックスにアクセスできます。この環境には、NumpyやPandas、Matplotlibなどのライブラリが含まれており、グラフを描画することが可能です。対応しているライブラリの全リストはAPIドキュメントで確認でき、今後もサポートライブラリが増える予定です。
ファイル入出力とグラフ出力の新機能
Gemini 2.0では、コード実行ツールが更新され、ファイルの入力とMatplotlibを用いたグラフやチャートの出力が可能になりました。これにより、コード実行が動作するシナリオの幅が広がります。以下のようなことが可能です:
- ユーザーがアップロードした複雑なファイルの論理的分析を行う。
- Matplotlibを用いてデータを視覚化する。
- ローカルコードファイルのデバッグを行う。
- [実験] マルチモーダルライブAPIを用いてリアルタイム機能を試す。
- [実験] Google検索を基にしたグラウンディングツールとコード実行を組み合わせる。
- [実験] Thinking Modeでのコード実行を活用する。
コード実行の実践例
ここでは、実際のコード実行の応用例を二つ紹介します。
リアルタイムデータ分析と視覚化
Geminiのモデルを用いて、トム・クルーズの映画リストを取得し、その上映時間でランク付けして、Matplotlibを使ってデータを視覚化するデモを実施しました。Geminiモデルは、これらのタスクを実行するためのPythonコードを生成し、その後のリクエストに基づいてバーの色を変更したり、チャートを更新したりします。
複雑な問題解決への挑戦
次のデモでは、Gemini 2.0 Flash Thinking Experimentalモデルとコード実行を使い、5つのスペインの都市を訪問する営業マンの最短ルートを求めるという古典的な最適化問題を解くシナリオを体験しました。Geminiは、Pythonコードを生成し、初期のライブラリエラーを修正しながら距離を計算し、最終的にMatplotlibグラフ上に最適なルートを視覚化しました。
Gemini 2.0でのコード実行を始めよう
この新しいコード実行機能を試してみたい方は、Colabノートブックで直接体験することができます。また、GitHubにも多くの例やデモが掲載されています。更なる情報や使用事例の確認は、Gemini APIドキュメントをチェックしてください。
また、Gemini APIの開発者フォーラムに参加することで、自身の使用事例を共有したり、コード実行の改善に関するフィードバックを提供できます。短期的には、ライブラリのサポートの拡張やPDFなど他の入力形式のサポート、マルチツールの使用なども検討されています。楽しい開発をお楽しみください!