Template

Clean up that MetaDataMess

Find a file Use this template

sebastian f3eb9e1c87 tiny md glitch corrected		2025-02-19 22:00:01 +00:00
.gitignore	Initial commit	2025-02-19 21:35:10 +00:00
LICENSE	Initial commit	2025-02-19 21:35:10 +00:00
metadata_reviewer.py	metadata_reviewer.py hinzugefügt	2025-02-19 21:58:18 +00:00
metadata_writer.py	metadata_writer.py hinzugefügt	2025-02-19 21:53:01 +00:00
pdf_processor.py	V6 - with metadata connector	2025-02-19 21:55:20 +00:00
README.md	tiny md glitch corrected	2025-02-19 22:00:01 +00:00

pdf-mass-cleanuptools v6

Clean up that MetaDataMess

Needs:

before running: export ANTHROPIC_API_KEY='your-api-key-here'

python pdf_processor.py -i /path/to/pdfs -o /path/to/output

python pdf_processor.py -i /path/to/pdfs -o /path/to/output --test

python pdf_processor.py -i /path/to/pdfs -o /path/to/output --pattern "magazine_*.pdf"

python pdf_processor.py -i /path/to/pdfs -o /path/to/output --no-cleanup

python pdf_processor.py -i /path/to/pdfs -o /path/to/output --write-metadata

python pdf_processor.py -i /path/to/pdfs -o /path/to/output --write-metadata --no-backup

python metadata_reviewer.py results/processing_results.json

python metadata_reviewer.py results/processing_results.json --write

python metadata_reviewer.py results/processing_results.json --debug