Pourquoi on‑prem
- Exigences réglementaires/sécurité/souveraineté : les données doivent rester on‑prem
- Accès selon vos règles (RBAC) : définir qui peut voir/faire quoi
- Chaque sortie est sourcée et tracée : auditabilité et responsabilité clarifiées
Architecture de haut niveau
Browser → Frontend → Backend → DB (requis) + optionnel : LLM provider / embedding / VectorDB / Knowledge Graph
Sécurité & gouvernance
- Contrôle d’accès RBAC
- Suivi d’audit + citations traçables
- Workflow de revue : en haut risque, revue humaine avec traces
Performance (ce qui compte)
- Faible latence : inférence au plus près des données et des utilisateurs
- Scalable : étendre la capacité au fur et à mesure
- Stable : débit prévisible et contrôle des ressources