
非営利の Mozilla Foundation は、オープンソースの音声認識用スポーク データベースに取り組んでいます。 共通の声。 大手 (Google、Facebook など) とは異なり、このデータセットと関連する翻訳モデルは誰でもアクセスでき、(オープンソース) アプリケーションで無料で使用できます。
の オランダのデータセット ただし、まだ小さすぎて役に立たない たくさんの 若者に偏りすぎ。
ただし、素晴らしい点は、誰でもテキストを録音し、記録されたテキストを確認できることです。
オランダのデータセットを拡張して、大企業だけでなく誰もが正確な音声認識にアクセスできるようにしてください。
Mozilla が人口統計の違いを修正できるように、最初にアカウントを作成することをお勧めします。 (年齢、性別など)
Mozilla Common Voice は、実際の人々がどのように話すかを機械が学習できるようにする取り組みです。
スピーチは自然であり、スピーチは人間的なものです。 だからこそ、私たちはマシンに使える音声テクノロジーを開発することに興奮しています。 しかし、音声システムを作成するには、開発者は非常に大量の音声データを必要とします。
大企業が使用するデータのほとんどは、ほとんどの人が利用できません。 それがイノベーションの妨げになると私たちは考えています。 だからこそ私たちは、音声認識をオープンで誰もが利用できるようにするプロジェクト Common Voice を開始しました。
「方法、内容、理由」の詳細: https://commonvoice.mozilla.org/nl/about
オタク向け: