Mercury 2
ストックにはログインが必要です
即時のプロダクションAI向けに設計された、最速の推論LLM
Artificial Intelligence
API
Development
概要
Mercury 2は逐次デコードを捨て、並列リファインメントで生成を行う拡散LLM。1,000トークン/秒超の推論速度により、エージェントループの遅延を大幅に抑える。APIはOpenAI互換で、コードを書き換えず導入できる。Diffusion系の新世代として注目される。
特徴
- 並列生成により低遅延を実現
- 推論品質を維持しつつ高速化
活用シーン
- マルチステップのエージェントループ、リアルタイム音声アプリなど、遅延が課題となるケースに有効
投票数: 91