Mercury 2

ProductHunt 製品ページ

即時のプロダクションAI向けに設計された、最速の推論LLM

Artificial Intelligence API Development

Mercury 2

Mercury 2 - 画像 2

概要

Mercury 2は逐次デコードを捨て、並列リファインメントで生成を行う拡散LLM。1,000トークン/秒超の推論速度により、エージェントループの遅延を大幅に抑える。APIはOpenAI互換で、コードを書き換えず導入できる。Diffusion系の新世代として注目される。

特徴

並列生成により低遅延を実現
推論品質を維持しつつ高速化

活用シーン

マルチステップのエージェントループ、リアルタイム音声アプリなど、遅延が課題となるケースに有効

投票数: 141

← 投稿一覧に戻る