GoogleのGenerative AIを活用した「Best Phones Forever: AI Roadtrip」の制作方法
最近、Googleは新たなキャンペーン「Best Phones Forever」を展開しました。このキャンペーンは、PixelとiPhoneのキャラクターが友情を育みながら冒険を繰り広げるというもので、視聴者からの応援もあり、これまでに17エピソードが制作されています。
Generative AIの力でファンとの繋がりを強化する
Googleのクリエイティブチームは、このキャンペーンを通じてファンのコミュニティとの直接的な交流を大切にしています。昨年のシリーズ開始時には、GPTベースの大規模言語モデル(LLM)を使い、ファンからのコメントに対して友情をテーマにした反応を生成しました。しかし、生成技術の急速な進歩に伴い、さらなるリアルタイムエンゲージメントを促進する機会を見出しました。
こうして誕生したのが「Best Phones Forever: AI Roadtrip」です。このプロジェクトでは、ファンがキャラクターたちをリアルタイムで応援できる仕組みを整えています。
プロジェクトの実際の流れ
プロジェクトの基本的な流れは以下の通りです。
- ファンのコメントの受け取り:ファンがロケーションのアイデアをコメントします。
- カスタムビデオの生成:専用のツールを使って、数分内にカスタマイズされた動画を作成します。
- 生成された動画の投稿:作成した動画をInstagram Reelsに投稿し、ファンと共に楽しみます。
AIを用いたクリエイティブプロセス
この取り組みでは、Googleの様々なAIモデルを活用しています。具体的には、以下の3つのプロセスに分けられます。
- スクリプトの生成:Gemini 1.5 Proを使用して、ファンが提案したロケーションに基づいたスクリプトを生成します。
- 画像の生成:Imagenを用い、スクリプトに合った背景画像を作成します。
- 音声の生成:Cloud Text-to-Speechを使い、生成されたスクリプトを音声化します。
スクリプト生成の詳細
Geminiを使用する際には、単に命令を与えるだけではなく、数多くの実例を提供することが効果的です。チームの作業者は、PixelとiPhoneのキャラクターが様々な場所で交わす会話についての短いスクリプトを作成しました。これにより、Geminiは生成するスクリプトの長さや形式を正確に設定することができ、より多様なダイアログを生み出すことが可能になります。
画像生成の工夫
Imagen 2を利用して生成された背景画像は、さまざまなロケーションとスタイルに対応できるように設計されています。ただし、単にロケーションを指定しただけでは、スタイルや構図に一貫性が欠けることがあります。それを防ぐために、Geminiが生成するプロンプトを用いることで、より一貫性のある背景画像を作成できるのです。
音声生成の工夫
スクリプトが完成したら、各行をCloud Text-to-Speechに送信して音声を生成します。このプロセスは、キャラクターの特性を考慮に入れた音声を出すためにも重要です。また、シーンにリアリティを加えるために、環境音や効果音も使用します。
クリエイティブな仕上げと次のステップ
生成されたすべてのアセットは、自動的にUnreal Engineにインポートされ、3Dシーンに合成されます。これにより、キャラクターの動きや、シーンがダイナミックに変わる様子を表現することができます。
このように、Generative AIの活用によって、従来の制作プロセスよりも迅速に、しかもファンとのインタラクションを強化した形で新しいコンテンツが生み出されています。最終的には、数百のオリジナルエピソードを一日に生成することも目指しています。
今回の試みは、Googleの最新技術を活用することで、クリエイティブな領域での新たな可能性を示しています。興味がある方は、同様の技術を利用して自分自身のクリエイティブな目標について考えてみてはいかがでしょうか?