Speech AI Platform logo

Speech AI Platform

150MB で実現する発音評価、STT&TTS — AIエージェント向け

Artificial Intelligence Developer Tools Education

概要

Speech AIは発音評価・STT・TTSの3APIを統合した音声処理プラットフォームです。発音評価とSTTは同一の17MBモデルを共有。TTSはKokoro-82M(115MB)を使用し、英語12ボイス。3機能はMCPサーバに8ツールとして同梱され、AIエージェントからのツール呼び出しで統合利用が可能。REST APIとAzure Marketplaceも利用可能。

特長

  • 小型モデルで低コスト・低遅延
  • 単一APIキーで3機能を管理
  • Claude・GPT等のエージェント統合対応

デモと今後

  • HuggingFaceスペースのデモを提供
  • 追加機能の検討を歓迎
投票数: 3
← 投稿一覧に戻る