AssemblyAI logo

AssemblyAI

音声エージェント向け、ストリーミング対応で最も正確な音声認識モデル。

Artificial Intelligence Developer Tools Audio

概要

Universal-3 Pro Streamingは、音声エージェント向けのリアルタイムSTTで最も正確です。エンティティ検出・話者ラベル・コードスイッチングを備え、難所である不発話・英数字・ノイズ環境にも対応します。1つのAPIで99言語以上をサポート。新機能としてリアルタイム話者ディアリゼーションとグローバル言語対応を追加しました。従来のストリーミングでは解決できなかったエッジケースを網羅します。

投票数: 76
← 投稿一覧に戻る