docs(readme): aggiunge sezioni configurazione modelli, test ollama, retrieval e RAG
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
@@ -147,6 +147,77 @@ Modificare solo questo file — chunker, verify e fix si aggiornano automaticame
|
||||
|
||||
---
|
||||
|
||||
## Configurazione modelli
|
||||
|
||||
Tutti i parametri LLM e embedding sono in [`config.py`](config.py):
|
||||
|
||||
```python
|
||||
OLLAMA_MODEL = "qwen3.5:4b" # modello LLM per la generazione
|
||||
EMBED_MODEL = "nomic-embed-text" # modello embedding (deve coincidere con l'ingestion)
|
||||
TEMPERATURE = 0.2 # 0.0 = deterministico, valori alti = più creativo
|
||||
NO_THINK = True # True = risposta diretta (più veloce), False = con ragionamento
|
||||
TOP_K = 6 # numero di chunk recuperati per ogni domanda
|
||||
OLLAMA_URL = "http://localhost:11434"
|
||||
```
|
||||
|
||||
> Se cambi `EMBED_MODEL` devi rieseguire l'ingestion con `--force` — gli embedding
|
||||
> devono essere prodotti dallo stesso modello usato nel retrieval.
|
||||
|
||||
---
|
||||
|
||||
## Testare il modello (senza RAG)
|
||||
|
||||
Verifica che il modello LLM risponda correttamente prima di coinvolgere la pipeline:
|
||||
|
||||
```bash
|
||||
.venv/bin/python ollama/test_ollama.py
|
||||
```
|
||||
|
||||
Il modello usato è quello configurato in `config.py` (`OLLAMA_MODEL`).
|
||||
Digita `exit` per uscire.
|
||||
|
||||
---
|
||||
|
||||
## Retrieval puro (senza generazione)
|
||||
|
||||
Utile per verificare che i chunk giusti vengano recuperati prima di diagnosticare
|
||||
risposte sbagliate:
|
||||
|
||||
```bash
|
||||
.venv/bin/python retrieve.py --stem <nome>
|
||||
|
||||
# Modifica il numero di chunk restituiti
|
||||
.venv/bin/python retrieve.py --stem <nome> --top-k 10
|
||||
```
|
||||
|
||||
Nel loop interattivo:
|
||||
|
||||
| Comando | Effetto |
|
||||
|---------|---------|
|
||||
| `<query>` | Mostra i chunk più simili con score di similarità (testo troncato) |
|
||||
| `<query> -f` | Testo completo dei chunk |
|
||||
| `exit` | Termina |
|
||||
|
||||
---
|
||||
|
||||
## RAG interattivo
|
||||
|
||||
Risponde a domande in linguaggio naturale usando i chunk indicizzati in ChromaDB:
|
||||
|
||||
```bash
|
||||
.venv/bin/python rag.py --stem <nome>
|
||||
```
|
||||
|
||||
Nel loop interattivo:
|
||||
|
||||
| Comando | Effetto |
|
||||
|---------|---------|
|
||||
| `<domanda>` | Risposta generata dal LLM con contesto dai chunk |
|
||||
| `<domanda> -v` | Risposta + chunk recuperati con score di similarità |
|
||||
| `exit` | Termina |
|
||||
|
||||
---
|
||||
|
||||
## Test
|
||||
|
||||
```bash
|
||||
|
||||
Reference in New Issue
Block a user