diff --git a/.gitignore b/.gitignore new file mode 100644 index 0000000..4b233cc --- /dev/null +++ b/.gitignore @@ -0,0 +1,27 @@ +# Virtual environment +.venv/ + +# PDF originali — file pesanti, non versionare +sources/ + +# Output pipeline — generati dagli script, non versionare +processed/ +chroma_db/ + +# Python +__pycache__/ +*.py[cod] +*.pyo + +# Editor +.vscode/ +.idea/ +*.swp +*.swo + +# OS +.DS_Store +Thumbs.db + +# Report generati dagli script +step-0/*_step0_report.txt diff --git a/CLAUDE.md b/CLAUDE.md new file mode 100644 index 0000000..612c1f3 --- /dev/null +++ b/CLAUDE.md @@ -0,0 +1,19 @@ +# CLAUDE.md — RAG from Scratch + +## Ambiente + +Questo progetto usa un **virtual environment Python**. +Tutte le dipendenze e i comandi Python devono essere eseguiti nel venv. + +```bash +# Creazione (una volta sola) +python -m venv .venv + +# Attivazione +source .venv/bin/activate + +# Installazione dipendenze +pip install -r requirements.txt +``` + +Non installare mai pacchetti a livello di sistema con `pip install` senza venv attivo. diff --git a/requirements.txt b/requirements.txt new file mode 100644 index 0000000..e5577a4 --- /dev/null +++ b/requirements.txt @@ -0,0 +1,2 @@ +# Step 0-1 — Ispezione e verifica PDF +pdfplumber==0.11.9