最近行われたAIアルゴリズムは、子供の教育ビデオを厄介な大人の言語コンテンツに変換できることを実証しました。この問題に関する研究を行っている間、7,000以上のビデオが研究され、24以上の異なる子供のチャンネルに属していました。その結果、コンテンツの40%が1300以上のタブーワードを持ち、他の人は非常に不適切な語彙を持っていたことが示されました。一般的な例には、カニをがらくたに置き換え、バスターを野郎に置き換えることがあります。
ロチェスター研究所の助教授であるアシケ・クダブフシュは、この発見の背後にある研究者の一人です。アシケは、この問題を不穏なものとして言及して彼の発言を共有しました。
YouTube Kidsオプションを持っているにもかかわらず、多くの親は実際のアプリケーションを好みます。ピュー・リサーチ・センターの調査では、11歳未満の子供の80%以上の親が子供にYouTubeコンテンツを見ることを許可しているのに対し、これらの子供の50%以上が日常的にコンテンツを見ていることが示されました。
アプリケーションのスポークスマンであるジェシカ・ギビーは、プラットフォームがキャプションを子供のための安全な場所にするために取り組んでいることを皆に保証しました。年齢制限のある単語との紛らわしい言葉は、子供のコンテンツだけでなく、他のコンテンツにも限定されます。ある記者は、オーディオ転写ソフトウェアTrintがかつてNegarという名前を誤解し、不適切なNワードに置き換えたことを発見しました。
テキストに対するスピーチで満たされる多くのギャップがまだ残っています。これらのギャップを埋めるためにアルゴリズムに完全に依存することは、望ましくない問題を引き起こす可能性がありますので、賢明な選択ではありません。システムが青年期を含む不適切な性的コンテンツを書き起こしていたことが判明した後、スタートアップが直面したものなど。
すべてのシステムにデータを供給する必要があります。多くの場合、オーディオデータは通常大人によって追加されますが、子供はそれほどデータを追加できません。また、ファイルを追加しても、アクセントはネイティブではなく、混乱を招きます。
言語学者で、この研究の共同執筆者であるレイチェル・タットマンは、キャプションのチューニングがエラーを減らすのに役立つかもしれないと示唆しましたが、それは簡単な作業ではありません。
アシケ・クダブフシュと彼のチームもこの状況に対する可能な解決策に取り組んでいます。彼らはAmazonなどの他のソフトウェアを介してオーディオを実行し、同じ問題も持っていることを発見しました。Amazonの広報担当者は、アプリ開発者がコンテンツで単語をフィルタリングする方法に関する可能な解決策について、この問題を調べてもらいました。