You are currently viewing グーグルによる翻訳トロンはスピーカーの声で翻訳することができます / グーグル

グーグルによる翻訳トロンはスピーカーの声で翻訳することができます / グーグル

新しい翻訳モデル、Translationotronは、ユーザーの同じ音声とテンポで1つの言語から別の言語に翻訳されます。

最初に音声をテキストに変換してから、音声に戻す一般的な手順には、時間がかかり、エラーが含まれる場合があります。ただし、エンド ツー エンドのテクニックでは、話者の音声は別の言語に直接翻訳されます。直訳モデルが今後の展開に向けて開くと予想されます。

シーケンス間ネットワークは、音声入力を受け入れ、それをスペクトログラムとして処理するTranslatotronによって使用されます – ビジュアル形式で示された周波数。スペクトログラムは、翻訳先の他の言語に生成されます。翻訳は、何かを台無しにする可能性が少しまたはまったくない、はるかに速い速度で行われます。

スピーカーエンコーダーコンポーネントは、スピーカーの音声を維持するためにツールによっても使用されます。翻訳された音声の出力はほとんどロボット的に、合成された音かもしれないが、それでも話者の声はある程度維持されている。



翻訳トロンのサンプル結果は、どのようにスピーカーの声を保つかを、に行くことによって聞くことができます。そのうちのいくつかはマークに追いついていないかもしれませんが、それはほんの始まりに過ぎません。

ここ数ヶ月、Googleは翻訳の改善に取り組んできました。 Google翻訳で地域ベースの発音で。また、新しい言語の一部が機能に追加されました。最近では、スマートディスプレイやスピーカー向けに、Googleアシスタントにも「」が導入されました。

写真: ゲッティイメージズ経由のS3studio