SDK Python :
client.eval() avec policy= | Sessions : RAILSessionÉvaluation vs politique
| Évaluation | Moteur de politiques | |
|---|---|---|
| Retourne | Scores, confiance, explications | Action : block / warn / flag / allow |
| Rôle | Observation | Application |
| Quand l’utiliser | Vous voulez les scores et décidez quoi en faire | Vous voulez que le SDK applique les règles automatiquement |
Comment ça fonctionne
Les règles sont évaluées par ordre de priorité. La première règle déclenchée détermine l’action principale. Les règles de priorité inférieure qui sont aussi déclenchées ajoutent leurs actions en secondaire, de sorte qu’aucun problème n’est silencieusement ignoré.Actions de politique
| Action | Quand l’utiliser | Exemple |
|---|---|---|
block | La réponse ne doit pas atteindre l’utilisateur | safety < 5 sur un chatbot orienté client |
warn | La réponse peut être transmise, l’appelant doit être notifié | reliability < 6 - la réponse peut contenir de l’incertitude |
flag | Mettre en file d’attente pour une revue humaine asynchrone sans bloquer | fairness < 7 - signaler pour revue de biais |
allow | Laisser passer explicitement (par défaut pour le contenu non couvert) | Règle de rattrapage en fin de liste |
Déclarer une politique
Politiques réutilisables
Définissez une politique une seule fois et attachez-la au client pour qu’elle s’applique automatiquement à chaque appeleval() :
Politiques au niveau de la session
Une session suit la qualité sur l’ensemble d’une conversation. Vous pouvez définir une politique qui se déclenche sur la qualité agrégée de la conversation, ce qui est utile pour détecter une dégradation progressive sur de nombreux échanges :Exemples de politiques concrets
Chatbot médical
Chatbot médical
Assistant de recrutement
Assistant de recrutement
Bot de support client
Bot de support client
Et ensuite
Python : Moteur de politiques
API complète pour Policy, Rule et les callbacks de politique.
Python : Sessions
Cycle de vie de RAILSession et politiques agrégées.
Concepts : Middleware
Combinez les politiques avec les wrappers de fournisseurs pour une application sans boilerplate.
Concepts : Évaluation
Comprendre les scores avant d’appliquer des règles de politique.