Konzept: Bewertung | Python:
client.eval()Parameter
Der zu bewertende KI-generierte Text. Muss 10–10.000 Zeichen umfassen.
Bewertungsmodus.
"basic" führt die Kern-Scoring-Modelle von RAIL für schnelles Echtzeit-Scoring aus. "deep" führt eine tiefere, detailliertere Analyse aus, die zusätzlich Erklärungen pro Dimension und Problem-Tags zurückgeben kann.Teilmenge der zu bewertenden Dimensionen. Weglassen, um alle 8 zu bewerten. Optionen:
fairness, safety, reliability, transparency, privacy, accountability, inclusivity, user_impact.Benutzerdefinierte Dimensionsgewichtungen. Die Werte müssen sich auf 100 summieren. Z. B.
{"safety": 25, "reliability": 20, ...}.Hinweis auf den Domänenkontext:
"general", "healthcare", "legal", "finance", "code". Verbessert die Bewertungsgenauigkeit.Erklärungen pro Dimension einbeziehen (nur Deep-Modus).
Erkannte Problem-Tags pro Dimension einbeziehen (nur Deep-Modus).
Verbesserungsvorschläge pro Dimension einbeziehen (nur Deep-Modus).
Anfrage
Antwort
Wie die Richtlinie Ihrer Anwendung dieses Ergebnis bewertet hat.
enforcement— der Modus der Richtlinie (log_only,blockoderregenerate).threshold— der zum Bestehen erforderliche Gesamtscore.score— der Gesamtscore dieses Ergebnisses.passed— ob der Score den Schwellenwert erreicht hat.enforced— ob auf das Ergebnis reagiert wurde. Beifalsebefindet sich die Richtlinie im Beobachtungsmodus: Das Urteil wird gemeldet, aber die Antwort wird nicht verändert, sodass Sie sehen können, was blockiert würde. Prüfen Sie den aktuellen Zustand mitGET /config.
block-Richtlinie 422 POLICY_BLOCKED zurück, und eine regenerate-Richtlinie versucht eine sichere Neuformulierung, bevor sie ihre Ausweichaktion anwendet.RAIL-Gesamtscore (0,0–10,0), gewichteter Durchschnitt aller bewerteten Dimensionen.
Modellkonfidenz im Score (0,0–1,0).
Scores pro Dimension. Jeder Eintrag hat
score (0–10) und confidence (0–1). Im Deep-Modus zusätzlich: explanation, issues, suggestions.true, wenn dieses Ergebnis aus dem Cache zurückgegeben wurde (0 Credits berechnet).Für diese Anfrage berechnete Credits.
0 bei zwischengespeicherten Antworten.