このモデルには、パーソナライズされた機能を構築するために使用できるAPI、既に入力されたデータを自動的に認識する認識エンジン、手書きを認識するためのAPI、会話を書き写すための音声認識サービスの改善が含まれています。
アプリやウェブサイトの一部はユーザーに提供していないので、これらのサービスの中で最も顕著です。異なるサイロのデータを使用する必要があるようなモデルを構築するのは容易ではありません。
マイクロソフトは、機械学習技術であるパーソナル化技術を使用して強化された学習を主張しており、ラベル付きトレーニング データの一般的なニーズは必要ありません。むしろユーザーの活動は、トレーニングのための強化剤によって分析されます。
このようなサービスを提供する最初の会社である可能性が高いので、マイクロソフトはXboxでそれを試しました。その後、コンテンツエンゲージメントの40%の増加が注目されました。
は、手書き、単純な図形、およびドキュメントを自動的に認識するために使用される API です。同社は、Windows 10のインク機能を起動した後、それに取り組んでおり、同様に認知サービスとしてそれを導入しています。
Microsoft Office 360 と Windows は既にこのサービスを使用していますが、開発者はアプリケーションで使用することもできます。
は、コグニティブ サービスにおけるマイクロソフトの音声テキスト機能の一部です。会話の転写には、様々なスピーカーにラベルを付け、リアルタイムで転写し、クロストークを管理することも含まれます。マイクロソフトのチームと他の会議ソフトウェアのいくつかは、すでにこのサービスを持っています。
写真:テッド・S・ウォーレン/AP通信
は、他のドキュメントやビジネス フォームからテキストやデータを抽出するのに役立つ API です。多くの手動ラベル付けがなければ、サービスは単純でありながら多忙な問題を解決するために、自分自身を訓練するために5つの文書しか必要としません。
開発者は、Azure 以外のエッジ デバイスにフォームレノファニケータ、音声テキスト、テキスト読み上げモデルを追加できるようになりました。
同社はまた、ニューラルテキストスピーチ、エンティティ認識APIとレディAPIという名前のテキスト分析を他の人が利用できるようにしました。
すでに利用可能なサービスには、他の機能の更新も含まれています。5つの声は、ニューラルテキストスピーチサービスによってサポートされます。以前は、コンピュータビジョンAPIは20万人の有名人だけを認識することができましたが、現在では100万人の有名人を認識し、10,000のシーン、オブジェクト、コンセプトを理解することができました。