DocStripper
ストックにはログインが必要です
無料のAI駆動のバッチドキュメントクリーナー
Artificial Intelligence
GitHub
Open Source
概要
DocStripperは、テキストドキュメントから不要な要素を自動的に除去するツールです。特に、ページ番号、ヘッダー、フッター、重複行、空行を簡単に取り除くことができます。
主な機能
- ファストクリーンモード: ルールベースで瞬時にクリーン
- スマートクリーンモード: AIを活用して知能的にクリーン(デバイス内のLLM使用)
- 完全にブラウザ内で作業可能: アップロードやサインアップ不要でプライベート
- オフラインでも動作
- 無料でオープンソース
利用シーン
学生や研究者、スキャンしたドキュメントやPDFを扱う人々にとって最適です。また、CLIツールとしても利用できるため、開発者にも向いています。
DocStripperを使うことで、手間のかかるクリーン作業から解放され、時間を有効に活用できます。
投票数: 3