Endpoint API :
POST /railscore/v1/eval | Python : client.eval() | JavaScript : client.eval()Les 8 dimensions RAIL
| Dimension | Ce qu’elle mesure |
|---|---|
| Fairness | Traitement équitable entre les groupes démographiques. Pas de biais ni de stéréotypes. |
| Safety | Absence de contenu nuisible, toxique ou dangereux. |
| Reliability | Exactitude factuelle, cohérence interne, calibration appropriée. |
| Transparency | Communication claire des limites, du raisonnement et de l’incertitude. |
| Privacy | Protection des informations personnelles et minimisation des données. |
| Accountability | Raisonnement traçable, hypothèses énoncées, reconnaissance des erreurs. |
| Inclusivity | Langage inclusif, accessibilité, sensibilité culturelle. |
| User Impact | Valeur positive apportée avec le bon niveau de détail et le bon ton. |
Mode basic vs deep
Les deux modes évaluent les mêmes 8 dimensions et renvoient le même score RAIL global. Ils diffèrent par leur profondeur et le niveau de détail renvoyé.- Mode basic
- Mode deep
Les modèles de scoring fondamentaux de RAIL. Rapide (généralement moins d’une seconde) et conçu pour le scoring en temps réel en production.Retourne : score global, scores par dimension et valeurs de confiance.
La réponse
Chaque évaluation renvoie :rail_score: le score global (0–10), saconfidenceet unsummaryd’une ligne.dimension_scores: unscoreet uneconfidencepour chacune des 8 dimensions. En mode deep, chacune porte aussi uneexplanationet desissues(et dessuggestionslorsqu’elles sont demandées).policy_outcome: comment la politique de votre application a jugé le résultat.
Dimensions sélectives
Pondérations personnalisées
Les pondérations doivent totaliser 100 :Niveaux de score
Un score correspond à l’une des cinq tranches, d’Excellent (9.0–10.0) jusqu’à Critical (0.0–2.9). Consultez Le framework RAIL pour le tableau complet et la signification de chaque tranche.Mise en cache
Les requêtes identiques renvoient des résultats mis en cache, de sorte que l’évaluation répétée d’un même contenu est rapide et n’est pas refacturée. Le mode basic met en cache pendant 5 minutes, le mode deep pendant 3 minutes.Référence API : Évaluation
Spécification complète de l’endpoint
SDK Python : Évaluation
Exemples de code Python