開発者を支援するために、Microsoft は、その例外的なBing検索サービスの背後にあるクリエイティブなアプローチをオープンソース!/ マイクロソフト

検索Bingクエリの結果をフラッシュで取得する方法を疑問に思ったことはありますか?Microsoft では、開発者がこのテクノロジを学習し、ドメイン内のデータのヒープの中から必要な項目を検索する必要があるユーザーに実装することを望んでいます。したがって、Bing検索サービスが検索結果を迅速に取得する方法の重要な部分を既にオープンソース化しています。

問題の重要な部分には、を利用するために作成された Microsoft ライブラリが含まれます。

マイクロソフトは、ウェブ検索が時間とともにどのように進化してきたかを明かしました。以前は、ユーザーは単語を入力し、データの負荷を検索して目的の結果を得ることを快適にしていました。今、彼らは、例えば、検索ボックスに画像を落としたり、インテリジェントなアシスタントに彼らのために仕事をするように頼んだり、単に複数の結果ではなく、自分の質問に対するポイントの答えを受け取ることを期待するなど、努力せずに結果を得ることを好みます。

ユーザーのニーズに関しては、マイクロソフトは、オープンソースのPythonライブラリのコアポジションに座って楽しむスペースパーティションツリーとグラフ(SPTAG)アルゴリズムを利用しています。したがって、Microsoft はクエリ結果を得るために、数十億個の情報を 1 秒以内にスキャンします。

これは決して新しい発見であることを意味しません。それはすでに以前に行動を起こしていました。ただし、マイクロソフトはディープラーニングモデルとの結合を評価できます。これには、事前にトレーニングされたモデルデータをベクターにエンコードし、各ベクトルが 1 つの単語またはピクセルを表現する必要があります。

SPTAG ライブラリを入力します。その後、ベクトルインデックスが生成されます。入力クエリのたびに、クエリされたテキストまたは画像がベクトルに変換され、ライブラリはインデックス内で最も関連性の高いベクトルを検索します。

マイクロソフトは、上記のアプローチが現在 1500 億を超える情報に影響を与えていると主張しました。これは確かにキーワードの古いマッチングからのステップアップです。単語、文字、ウェブフルクエリ.あなたはそれに名前を付けます!さらに、Bingインデックス付きベクトルをスキャンし、ミリ秒単位で最適な結果を得ることができます。

オープンソースのライブラリは、MITの下でライセンスされており、分散ベクトルインデックスの構築と検索に必要なすべてのツールを誇っています。あなたはそれを研究し、提供される概念を学ぶことを奨励されています。

注目の写真: クリストフ・モリン/IP3 / ゲッティイメージズ

おすすめ

マイクロソフトは、Windows 11のためのその最初のメジャーアップデートを起動し、それはいくつかの大きな変更が含まれています / マイクロソフト

マイクロソフトは、大規模な大衆のプッシュバックと抗議の真っ只中でそのアプリストアの計画を停止/マイクロソフト

マイクロソフトは、その最新のWindowsバージョンが適切に更新するために約8時間を必要とすると言う / マイクロソフト