e1b5298b20
Porta da branch marker la riscrittura completa di conversione/_pipeline/ (9 stadi PyMuPDF) e la suite tests/ senza modificare il resto del progetto RAG (ollama/, step-5/, step-6/, step-8/, rag.py, retrieve.py, config.py). requirements.txt: aggiunge PyMuPDF>=1.24.0 e pytest>=8.0, mantiene chromadb, rimuove opendataloader-pdf e pymupdf4llm. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
39 lines
586 B
Plaintext
39 lines
586 B
Plaintext
# Variabili d'ambiente — contiene chiavi API, non committare mai
|
|
.env
|
|
|
|
# Virtual environment
|
|
.venv/
|
|
|
|
# PDF originali — file pesanti, non versionare
|
|
sources/
|
|
|
|
# Output pipeline — generati dagli script, non versionare
|
|
processed/
|
|
chroma_db/
|
|
|
|
# Python
|
|
__pycache__/
|
|
*.py[cod]
|
|
*.pyo
|
|
|
|
# Editor
|
|
.vscode/
|
|
.idea/
|
|
*.swp
|
|
*.swo
|
|
|
|
# OS
|
|
.DS_Store
|
|
Thumbs.db
|
|
|
|
|
|
# Output conversione/ — generati dagli script
|
|
conversione/*/
|
|
!conversione/_pipeline/
|
|
!conversione/_pipeline/**
|
|
conversione/_pipeline/__pycache__/
|
|
|
|
# Output chunks/ — generati da chunks/chunker.py e chunks/verify_chunks.py
|
|
chunks/*/
|
|
|