Forge Agent logo

Forge Agent

遅い PyTorch を高速な GPU カーネルに変えるスウォームエージェント

Artificial Intelligence Developer Tools Hardware

概要

Forge は PyTorch モデルを自動で最適化された CUDA および Triton カーネルへ変換します。32 台のエージェントが並列に最適化を試し、ジャッジが正確性を検証してからベンチマークします。

特徴

  • 任意の PyTorch モデルに対応
  • 1 カーネルの無料トライアル

実績

  • Llama 3.1 8B: torch.compile より 5x高速
  • Qwen 2.5 7B: 4x高速
  • SDXL UNet: 3x高速
投票数: 97
← 投稿一覧に戻る