Higgs Audio v2 logo

Higgs Audio v2

リアルな感情表現を持つ音声生成

Artificial Intelligence GitHub Open Source Audio

プロダクト概要

Higgs Audio v2は、BosonAIによって開発された新しいオープンソースのオーディオ基盤モデルです。本モデルは、以下の特長を持っています。

  • リアルな音声生成: 多話者の対話や長尺音声をリアルに生成します。
  • 感情表現への強いこだわり: EmergentTTS-Evalベンチマークの感情カテゴリにおいて、gpt-4o-mini-ttsを75.7%の勝率で上回る実績。
  • オープンソース: 誰でもアクセス可能で、開発しやすい環境が整っています。
  • 軽量モデル: 小型モデルはJetson Orin Nanoでも動作可能で、幅広いデバイスで利用可能です。

このように、Higgs Audio v2は開発者にとって非常に価値のあるツールであり、感情豊かな音声生成の可能性を広げてくれます。

投票数: 4
← 投稿一覧に戻る