MiniCPM-o 4.5
ストックにはログインが必要です
デバイス上でリアルタイムに動作する、フルデュプレックスのマルチモーダルAI
Artificial Intelligence
GitHub
Open Source
デバイス上でリアルタイムに動作する9BパラメータのオムニモーダルAI。視覚・聴覚・発話を同時に処理し、全二重ストリーミングを実現。ローカル実行が可能で、llama.cppとOllamaをサポート。GPT-4oを視覚ベンチマークで上回るとされる。著者は対話の自然さとオフライン運用の利点を強調している。
投票数: 10