Sarathi AI Agent logo

Sarathi AI Agent

オープンソースの DOM ベース AI ブラウザエージェント

Artificial Intelligence GitHub Open Source Chrome Extensions

製品概要

  • オープンソースの DOM ベース AI ブラウザエージェント。DOM 推論を使い、スクリーンショットを前提としません。
  • Gmail の返信、複雑なフォームの自動入力、EC の購買フローのナビゲーション、マルチステップのブラウザ操作を支援します。
  • Chrome 拡張として動作。画面上の要素に一意のIDを注入し、構造化 DOM のスナップショットを作成。LLM がクリック・タイプ・ナビゲート・ホバー・待機などの決定論的なアクションを返します。
  • 現在のサポート: Gmail のリプライドラフト、知的なフォーム入力、EC フロー、ホバー操作。実験段階で、認証リダイレクトや anti-bot の境界事象を想定しています。
投票数: 3
← 投稿一覧に戻る