Gemini 1.5 Flash-8B、Google AI Studioで生産準備完了

Googleの新しいAIモデル「Gemini 1.5 Flash-8B」が本番環境用に準備完了

2024年10月3日、GoogleのGemini APIとGoogle AI StudioのシニアプロダクトマネージャーであるLogan KilpatrickとグループプロダクトマネージャーのShrestha Basu Mallickから、最新のAIモデル「Gemini 1.5 Flash-8B」が生産準備が整ったことが発表されました。この新しいモデルは、開発者が利用するための多くの魅力的な機能を提供しています。ここでは、その主な特徴をご紹介します。

主な特徴

  • 価格が50%低下 – 従来の「1.5 Flash」と比較して、製品コストが大幅に削減されました。
  • レートリミットが2倍 – 1.5 Flashと比べて、リクエスト数の制限が2倍に増加しました。
  • 小さなプロンプトのレイテンシが低下 – 短い指示文に対して、より迅速な応答が可能になっています。

開発者は、Google AI StudioとGemini APIを通じて「gemini-1.5-flash-8b」に無料でアクセスすることができます。

軽量モデルの進化

今年のI/Oイベントで発表されたGemini 1.5 Flashは、効率性とスピードに特化した軽量モデルです。その後数ヶ月の間に、Google DeepMindは開発者からのフィードバックを基に、1.5 Flashの改善に努めてきました。先月には、実験的な「Gemini 1.5 Flash-8B」がリリースされ、より小型で迅速なバージョンとして注目を集めました。本日、一般向けに本番利用が可能になったことを嬉しく思います。

パフォーマンスの向上

Flash-8Bは、5月に発表された1.5 Flashモデルとほぼ同等のパフォーマンスを示しており、多くのベンチマークテストでその実力を証明しています。特に以下のようなタスクにおいて素晴らしいパフォーマンスを発揮しています:

  • チャット
  • 転写
  • 長文の言語翻訳

驚異的なコストパフォーマンス

Gemini 1.5 Flash-8Bの安定版リリースに伴い、同社は「Geminiモデルの中で最も低コストのインテリジェンス」を発表しました。その価格は以下の通りです:

  • $0.0375 (1百万入力トークンあたり、プロンプト
  • $0.15 (1百万出力トークンあたり、プロンプト
  • $0.01 (1百万トークンあたり、キャッシュされたプロンプト

有料プランの開発者にとって、課金は2024年10月14日から始まります。この新しい価格設定は、1.5 Flashや1.5 Proを通じて、開発者のコストを引き下げるために行われた取り組みの一環です。これにより、開発者が世界を前進させる製品やサービスを自由に構築できることを目指しています。

レートリミットの向上

Gemini 1.5 Flash-8Bは、シンプルで高ボリュームのタスクに最適化されています。このモデルをさらに便利にするために、1.5 Flash-8Bのレートリミットが倍増し、開発者は1分あたり最大4,000リクエストを送信することが可能になりました。

開発者へのメッセージ

開発者には、新たなモデルを活用してさらに素晴らしいアプリケーションを構築していただければと思います。Googleでは、今後も新しい機能やアップデートをお届けしていく予定ですので、ぜひ楽しみにしてください。

これからのAIの進化を共に見守り、各々の創造力を活かしていきましょう!