diff --git a/ROADMAP.md b/ROADMAP.md index f220412..db6f470 100644 --- a/ROADMAP.md +++ b/ROADMAP.md @@ -314,6 +314,50 @@ Compacting ist **notwendig** (Token-Limit, Kosten, Latenz), aber dabei geht krit Schicht 2: 500 Token (Projekt, Entscheidungen) ``` +### Enforcement: Sicherstellen dass Claude den Kontext NUTZT + +**Problem:** Injizierter Kontext kann ignoriert werden (Lost in the Middle, keine Anweisung) + +**Lösung 1: Position** +- Schicht 1 → System Prompt (höchste Priorität) +- Schicht 2 → Letzter System-Reminder vor User-Nachricht (Recency Bias) + +**Lösung 2: Explizite Anweisungen** +``` + +Du MUSST folgende Zugänge verwenden (NICHT nachfragen!): +- DB: 192.168.155.11 / dolibarr_test +Diese Daten sind AKTUELL und KORREKT. + +``` + +**Lösung 3: Validierung nach Antwort** +- [ ] `validateResponse()` in claude-bridge.js +- [ ] Prüft: Hat Claude nach Infos gefragt die injiziert waren? +- [ ] Wenn ja: Automatisch Retry mit Korrektur-Hinweis + +**Lösung 4: Feedback-Loop** +- [ ] `context_failures` Tabelle in SQLite +- [ ] Speichert wenn Kontext ignoriert wurde +- [ ] Pattern erkennen → Prompts verbessern + +### Aufgaben (Enforcement) + +- [ ] **scripts/claude-bridge.js** + - [ ] System Prompt Builder mit `` Tags + - [ ] Schicht 1 am Anfang, Schicht 2 am Ende + - [ ] `validateResponse()` nach jeder Antwort + - [ ] Auto-Retry bei Kontext-Ignorierung (max 1x) + +- [ ] **src-tauri/src/db.rs** + - [ ] `context_failures` Tabelle + - [ ] `log_context_failure(session_id, context, expected, actual)` + - [ ] `get_failure_patterns()` für Prompt-Optimierung + +- [ ] **UI: Warnung bei Regel-Verletzung** + - [ ] Toast/Banner wenn Claude Regel ignoriert + - [ ] Option: "Erneut versuchen mit Hinweis" + ### Verifikation ```bash # Lange Session (>100 Nachrichten) → Compacting passiert