Lightning Rod: Training Data From News logo

Lightning Rod: Training Data From News

ニュースからトレーニングデータを自動生成、手動ラベルは不要

Artificial Intelligence Developer Tools GitHub

概要

  • ニュースを活用した自動データ生成ツール。手動ラベルは不要で、トピックと基準を指定するだけでラベル付きデータを自動作成します。
  • 各レコードには出所が紐付けられ、監査性と再現性を確保。
  • 自動スコアリングとフィルタリングで品質を担保。低信頼性サンプルを除外。
  • 実世界データを使ったスケーラブルな監督アプローチで、LLMのファインチューニングや評価のデータコストを削減。
  • データ源はニュース、公開記録、自社ドキュメントなど。ユースケースも多岐に対応。
投票数: 0
← 投稿一覧に戻る