【Bing】すべての機能をバイナリにする検索の関連性を向上させるためのスパースニューラルネットワーク。

記事
IT・テクノロジー
【Bing】すべての機能をバイナリにする検索の関連性を向上させるためのスパースニューラルネットワーク。MEBは、純粋なセマンティクスを超えた関係を理解することにより、Bingが検索意図に近づくのに役立ちます。

Bingは、本番のTransformerモデルを補完して検索の関連性を向上させる大規模なスパースモデルである「MakeEvery feature Binary」(MEB)を発表しました。

現在、すべての地域と言語でBing検索の100%で実行されているこの新しいテクノロジーにより、上位の検索結果のクリック率が2%近く増加し、手動によるクエリの再編成が1%以上削減されました。ページ付けのクリック数が1.5%減少します。

MEBが行うこと。MEBは、単一のファクトを機能にマップします。これにより、個々のファクトのより微妙な理解を実現できます。MEBの背後にある目標は、人間の精神が潜在的な答えを処理する方法をよりよく模倣することであるように思われます。

これは、「______が飛ぶことができる」の空欄に記入するときに過度に一般化する可能性のある多くのディープニューラルネットワーク(DNN)言語モデルとは対照的です。Bingは例として提供しています。ほとんどのDNN言語モデルは、「鳥」という単語で空白を埋める可能性があります。

「MEBは、各ファクトを機能に割り当てることでこれを回避します。そのため、ペンギンとツノメドリなど、飛ぶ能力を区別する重みを割り当てることができます」と、Bingは発表の中で述べています。鳥、またはそのことに関する任意のエンティティまたはオブジェクトを特異にする特性。

「鳥は飛ぶことができる」と言う代わりに、トランスフォーマーモデルと組み合わせたMEBは、「ダチョウ、ペンギン、およびこれらの他の鳥を除いて、鳥は飛ぶことができる」と言って、これを別のレベルの分類に変えることができます。

隠された意図を見極める。「MEBが学習した主要な機能を調べたところ、クエリとドキュメントの間に隠された意図を学習できることがわかりました」とBing氏は述べています。
SnapCrab_NoName_2021-8-5_16-40-19_No-00.png
MEBは、「Hotmail」が「Microsoft Outlook」と強く相関していることを知ることができましたが、2つは意味的な意味で密接ではありません。HotmailはMicrosoftOutlookとしてブランド名が変更され、MEBはこの関係を理解することができました。

同様に、「Fox31」と「KDVR」の間の接続を学習しました(2つのフレーズの間に明白なセマンティック接続はありませんが)。ここで、KDVRはFox31というブランドで動作するTVチャンネルのコールサインです。

MEBは、フレーズ間の負の関係を識別することもできます。これは、特定のクエリでユーザーが見たくないものを理解するのに役立ちます。Bingが提供した例では、「野球」を検索するユーザーは、どちらも人気のあるスポーツであるにもかかわらず、通常「ホッケー」について話しているページをクリックしません。同じことが瑜伽(ヨガ)や歌舞(ダンスと歌)を含むドキュメントにも当てはまります。 )。

トレーニングと規模。MEBは、5,000億を超えるクエリ/ドキュメントのペアを含む3年間のBing検索のトレーニングを受けています。Bingは、検索インプレッションごとに、ヒューリスティックを使用して、ユーザーがクリックした結果に満足しているかどうかを判断します。「満足のいく」ドキュメントはポジティブサンプルとしてラベル付けされ、同じ印象の他のドキュメントはネガティブサンプルとしてラベル付けされます

次に、各クエリ/ドキュメントペアのクエリテキスト、ドキュメントURL、タイトル、本文からバイナリフィーチャが抽出され、スパースニューラルネットワークモデルに入力されます。Bingは、公式発表でMEBがどのように機能するかについてより具体的な詳細を提供しています。

SnapCrab_NoName_2021-8-5_16-41-22_No-00.png

Bingに実装された後でも、MEBは、最新の毎日のクリックデータを継続的にトレーニングすることで毎日更新されます(上記を参照)。古い機能の影響を軽減するために、各機能のタイムスタンプがチェックされ、過去500日間に表示されなかったタイムスタンプが除外されます。更新されたモデルの毎日の展開も完全に自動化されています。

Bing検索の意味。上記のように、Bingの製品TransformerモデルにMEBを導入すると、次のような結果になります。

・下にスクロールしなくても、上位の検索結果(スクロールしなければ見えない位置)のクリック率が約2%向上します。

・手動クエリの再定式化が1%以上削減されました。

・ページ付けのクリック数が1.5%以上減少しました。

検索の関連性が向上したということは、ユーザーがクエリを再定式化することなく、結果の最初のページで探しているものをより早く見つける可能性が高くなることを意味します。マーケターにとって、これは、検索結果の2ページ目にいる場合、コンテンツが検索に関連していない可能性があることも意味します。

MEBのコンテンツに対するより微妙な理解は、検索結果の関連性が高まる可能性があるため、ブランド、企業、出版社へのトラフィックを増やすのにも役立つ可能性があります。また、MEBが相関フレーズ(「Hotmail」や「Microsoft Outlook」など)と否定的な関係(「baseball」や「hockey」など)を理解しているため、マーケターは顧客が実際に探しているものに集中するのではなく、より多くの時間を費やすことができます。

上位にランク付けするために適切なキーワードに固執するには検索業界にとって、これはBingがその地位を維持するのに役立つ可能性があります。GoogleはすでにMUMのビジョンを示しており(その潜在能力を十分に発揮できるとは言えませんが)、MEBはBingの従来の検索機能を強化する可能性があります。これにより、業界のリーダーや他の検索エンジンとの競争を続けることができます。
サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す