You are currently viewing Googleは拡散モデルの世界に飛び込んだ後、CDMとSR3の2つの新しい技術を作成 / Google

Googleは拡散モデルの世界に飛び込んだ後、CDMとSR3の2つの新しい技術を作成 / Google

Googleは、技術の世界の見通しを変えるために知られている最も驚くべき機能を考え出すことは知られており、再びハイテク大手は、彼らがテストしているいくつかの新しいAIでドアを突破しています。

同社は「」というコンセプトで遊んでおり、同社はそれに向けて取り組んでいたが、ここ数年の最優先事項ではなかったが、これは今変わったようだ。同社はGoogle AIブログに、スーパー解像度画像の概念について議論する記事を掲載した。これは基本的に、AI技術の助けを借りて、低解像度とぼやけた画像をより完成させ、鋭い外観を与えることを意味します。

同社の新しいベンチャーの最初のステップと技術は、SR3技術、つまり繰り返し洗練による超解決です。この技術はノイズ分解能に基づいています。低解像度の画像を入力として取り込み、純粋なノイズだけが残り、画像が高解像度のイメージになるまで、ノイズを徐々に追加します。この機能は、ノイズを突破し、通常の低解像度の形式で画像を返すことによって、概念を逆にする機能を備えています。

SR3は、同じ側面の他の形態の技術よりも非常に優れていることが証明されており、8Xの高級画像で使用すると50%の混乱率を示しましたが、他の同様の既存の技術は34%の割合しか示せていません。これは、Googleによってこの技術がどれほどうまく進歩しており、画像により写真の現実的な効果を与えることができるように、同社がこれを作成する上でどれほど懸命に取り組んできたかを示しています。

しかし、これはすべてではなく、SR3の素晴らしい結果と結果の後、同社は同じ作業ラインで別の機能に向けて取り組み始め、クラス条件付き拡散モデルとも呼ばれる新しいCDM機能を導入しました。

CDM は ImageNet のプリンシパルで動作しますが、ImageNet ははるかに複雑なデータセットですが、CDM はより便利な使用になります。この技術は、ユーザーが大きなカスケードで画像化された低解像度のサイズを強化し、ピクセルが壊れることなくより明確な外観を提供するのに役立ちます。イメージは32 x 32から64 x 64のサイズ、そして256 x 256のサイズから拡張され、そして最後に最も大きいサイズは1024 x 1024である。

新たに導入された技術の両方が素晴らしいですし、Googleはこのような素晴らしい仕事を通して来て、彼らが拡散モデルの世界で達成できる他のものを見るのを待つことができないチームを誇りに思っています。