Lightning Rod: Training Data From News
ストックにはログインが必要です
ニュースからトレーニングデータを自動生成、手動ラベルは不要
Artificial Intelligence
Developer Tools
GitHub
概要
- ニュースを活用した自動データ生成ツール。手動ラベルは不要で、トピックと基準を指定するだけでラベル付きデータを自動作成します。
- 各レコードには出所が紐付けられ、監査性と再現性を確保。
- 自動スコアリングとフィルタリングで品質を担保。低信頼性サンプルを除外。
- 実世界データを使ったスケーラブルな監督アプローチで、LLMのファインチューニングや評価のデータコストを削減。
- データ源はニュース、公開記録、自社ドキュメントなど。ユースケースも多岐に対応。
投票数: 0