MiMo-Audio logo

MiMo-Audio

オーディオ言語モデルは少数ショット学習者です

Artificial Intelligence GitHub Open Source Audio

概要

XiaomiのMiMo-Audioは、オープンソースの音声知能において重要な進展をもたらしました。これまでの依存関係からの脱却を図り、1億時間以上のデータを用いてプレトレーニングされています。最近の出現と文脈内学習機能を持つオーディオモデルとして、新たな時代を築いています。

特徴

  • 少数ショット学習: 大規模ラベル付きデータセットの制約を克服し、効果的なパフォーマンスを発揮。
  • 新しいアーキテクチャ: 最新のプレトレーニングアーキテクチャを採用。
  • オープンソース: トークナイザーや評価スイートなど、全スタックがオープンソース。

これにより、「LLaMAの瞬間」と呼ばれる新しい可能性がオープンソースオーディオモデルにもたらされ、今後の展開が期待されています。興味のある方はリンクからぜひ体験してみてください。

投票数: 7
← 投稿一覧に戻る