Googleの新しいAIモデル「Gemini 1.5 Flash-8B」が本番環境用に準備完了
2024年10月3日、GoogleのGemini APIとGoogle AI StudioのシニアプロダクトマネージャーであるLogan KilpatrickとグループプロダクトマネージャーのShrestha Basu Mallickから、最新のAIモデル「Gemini 1.5 Flash-8B」が生産準備が整ったことが発表されました。この新しいモデルは、開発者が利用するための多くの魅力的な機能を提供しています。ここでは、その主な特徴をご紹介します。
主な特徴
- 価格が50%低下 – 従来の「1.5 Flash」と比較して、製品コストが大幅に削減されました。
- レートリミットが2倍 – 1.5 Flashと比べて、リクエスト数の制限が2倍に増加しました。
- 小さなプロンプトのレイテンシが低下 – 短い指示文に対して、より迅速な応答が可能になっています。
開発者は、Google AI StudioとGemini APIを通じて「gemini-1.5-flash-8b」に無料でアクセスすることができます。
軽量モデルの進化
今年のI/Oイベントで発表されたGemini 1.5 Flashは、効率性とスピードに特化した軽量モデルです。その後数ヶ月の間に、Google DeepMindは開発者からのフィードバックを基に、1.5 Flashの改善に努めてきました。先月には、実験的な「Gemini 1.5 Flash-8B」がリリースされ、より小型で迅速なバージョンとして注目を集めました。本日、一般向けに本番利用が可能になったことを嬉しく思います。
パフォーマンスの向上
Flash-8Bは、5月に発表された1.5 Flashモデルとほぼ同等のパフォーマンスを示しており、多くのベンチマークテストでその実力を証明しています。特に以下のようなタスクにおいて素晴らしいパフォーマンスを発揮しています:
- チャット
- 転写
- 長文の言語翻訳
驚異的なコストパフォーマンス
Gemini 1.5 Flash-8Bの安定版リリースに伴い、同社は「Geminiモデルの中で最も低コストのインテリジェンス」を発表しました。その価格は以下の通りです:
- $0.0375 (1百万入力トークンあたり、プロンプト
- $0.15 (1百万出力トークンあたり、プロンプト
- $0.01 (1百万トークンあたり、キャッシュされたプロンプト
有料プランの開発者にとって、課金は2024年10月14日から始まります。この新しい価格設定は、1.5 Flashや1.5 Proを通じて、開発者のコストを引き下げるために行われた取り組みの一環です。これにより、開発者が世界を前進させる製品やサービスを自由に構築できることを目指しています。
レートリミットの向上
Gemini 1.5 Flash-8Bは、シンプルで高ボリュームのタスクに最適化されています。このモデルをさらに便利にするために、1.5 Flash-8Bのレートリミットが倍増し、開発者は1分あたり最大4,000リクエストを送信することが可能になりました。
開発者へのメッセージ
開発者には、新たなモデルを活用してさらに素晴らしいアプリケーションを構築していただければと思います。Googleでは、今後も新しい機能やアップデートをお届けしていく予定ですので、ぜひ楽しみにしてください。
これからのAIの進化を共に見守り、各々の創造力を活かしていきましょう!