313fd8717e
Elimina conversione/ (9 stadi PyMuPDF) e tests/ (tutti unit/integration). Il repository gestisce ora solo: pulizia MD, chunking, vettorizzazione e RAG. Aggiorna CLAUDE.md e .gitignore per il nuovo flusso MinerU-first. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
33 lines
411 B
Plaintext
33 lines
411 B
Plaintext
# Variabili d'ambiente — contiene chiavi API, non committare mai
|
|
.env
|
|
|
|
# Virtual environment
|
|
.venv/
|
|
|
|
# PDF originali — file pesanti, non versionare
|
|
sources/
|
|
|
|
# Output pipeline — generati dagli script, non versionare
|
|
processed/
|
|
chroma_db/
|
|
|
|
# Python
|
|
__pycache__/
|
|
*.py[cod]
|
|
*.pyo
|
|
|
|
# Editor
|
|
.vscode/
|
|
.idea/
|
|
*.swp
|
|
*.swo
|
|
|
|
# OS
|
|
.DS_Store
|
|
Thumbs.db
|
|
|
|
|
|
# Output chunks/ — generati da chunks/chunker.py
|
|
chunks/*/
|
|
|