Higgs Audio v2
ストックにはログインが必要です
リアルな感情表現を持つ音声生成
Artificial Intelligence
GitHub
Open Source
Audio
プロダクト概要
Higgs Audio v2は、BosonAIによって開発された新しいオープンソースのオーディオ基盤モデルです。本モデルは、以下の特長を持っています。
- リアルな音声生成: 多話者の対話や長尺音声をリアルに生成します。
- 感情表現への強いこだわり: EmergentTTS-Evalベンチマークの感情カテゴリにおいて、gpt-4o-mini-ttsを75.7%の勝率で上回る実績。
- オープンソース: 誰でもアクセス可能で、開発しやすい環境が整っています。
- 軽量モデル: 小型モデルはJetson Orin Nanoでも動作可能で、幅広いデバイスで利用可能です。
このように、Higgs Audio v2は開発者にとって非常に価値のあるツールであり、感情豊かな音声生成の可能性を広げてくれます。
投票数: 4