Octave 2 by Hume AI logo

Octave 2 by Hume AI

次世代の多言語テキスト・トゥ・スピーチモデル

Artificial Intelligence Audio

Octave 2とは?

Hume AIが新たにリリースした「Octave 2」は、次世代のテキスト・トゥ・スピーチモデルです。これにより、より自然で表現力のある音声合成が可能です。

主な特徴

  • 多言語対応: 11以上の言語で流暢に話すことができます。
  • 高速化: レイテンシは200ms未満で、従来のOctave 1よりも40%早く、コストも50%削減。
  • 会話機能: 複数の話者による自然な会話が可能です。
  • 発音精度: より信頼性の高い発音を提供。
  • 新しい編集機能: 声の変換や音素の編集が可能になりました。

詳細な機能が加わり、ユーザーのニーズに応える新しい音声技術が実現しました。10以上の言語に対応し、自分自身の声をクローンしたり、新しい声をデザインしたりすることもできます。

投票数: 88
← 投稿一覧に戻る