Sovereign-Lila-E8  logo

Sovereign-Lila-E8

スケーリングは死んだ。幾何学が新しいスケールだ。

Artificial Intelligence GitHub

概要: E8 ルート系格子を用いたGeometric Attention Transformerの新機軸。従来のスケーリングは追加パラメータだが、LILA-E8 は多様体のパッキング密度を高める。8D版は40MパラメータでSOTAに挑戦。200kステップで訓練損失0.37・検証0.44、1000トークン以上の安定性。著者コメントは「幾何学的共鳴」の実現。

投票数: 4
← 投稿一覧に戻る