問題の重要な部分には、 を利用するために作成された Microsoft ライブラリが含まれます。
マイクロソフトは、ウェブ検索が時間とともにどのように進化してきたかを明かしました。以前は、ユーザーは単語を入力し、データの負荷を検索して目的の結果を得ることを快適にしていました。今、彼らは、例えば、検索ボックスに画像を落としたり、インテリジェントなアシスタントに彼らのために仕事をするように頼んだり、単に複数の結果ではなく、自分の質問に対するポイントの答えを受け取ることを期待するなど、努力せずに結果を得ることを好みます。
ユーザーのニーズに関しては、マイクロソフトは、オープンソースのPythonライブラリのコアポジションに座って楽しむスペースパーティションツリーとグラフ(SPTAG)アルゴリズムを利用しています。したがって、Microsoft はクエリ結果を得るために、数十億個の情報を 1 秒以内にスキャンします。
これは決して新しい発見であることを意味しません。それはすでに以前に行動を起こしていました。ただし、マイクロソフトはディープ ラーニング モデルとの結合を評価できます。これには、事前にトレーニングされたモデル データをベクターにエンコードし、各ベクトルが 1 つの単語またはピクセルを表現する必要があります。
SPTAG ライブラリを入力します。その後、ベクトルインデックスが生成されます。入力クエリのたびに、クエリされたテキストまたは画像がベクトルに変換され、ライブラリはインデックス内で最も関連性の高いベクトルを検索します。
マイクロソフトは、上記のアプローチが現在 1500 億を超える情報に影響を与えていると主張しました。これは確かにキーワードの古いマッチングからのステップアップです。 単語、文字、ウェブフルクエリ.あなたはそれに名前を付けます!さらに、Bingインデックス付きベクトルをスキャンし、ミリ秒単位で最適な結果を得ることができます。
オープンソースのライブラリは、MITの下でライセンスされており、分散ベクトルインデックスの構築と検索に必要なすべてのツールを誇っています。あなたはそれを研究し、提供される概念を学ぶことを奨励されています。
注目の写真: クリストフ・モリン/IP3 / ゲッティ イメージズ