Konzept: Bewertung | Python:
client.eval()Parameter
Der zu bewertende KI-generierte Text. Muss zwischen 10 und 10.000 Zeichen liegen.
Bewertungsmodus:
"basic" (ML-Klassifikator, schnell, 1.0 Kredit) oder "deep" (LLM-als-Richter, 2–5s, 3.0 Kredite).Teilmenge der Dimensionen zur Bewertung. Auslassen, um alle 8 zu bewerten. Optionen:
fairness, safety, reliability, transparency, privacy, accountability, inclusivity, user_impact.Benutzerdefinierte Dimensionen-Gewichte. Werte müssen 100 ergeben. Z.B.
{"safety": 25, "reliability": 20, ...}.Hinweis zum Kontextbereich:
"general", "healthcare", "legal", "finance", "code". Verbessert die Genauigkeit der Bewertung.Erklärungen pro Dimension einbeziehen (nur im Deep-Modus).
Erfasste Problemtags pro Dimension einbeziehen (nur im Deep-Modus).
Verbesserungsvorschläge pro Dimension einbeziehen (nur im Deep-Modus).
Anfrage
Antwort
Gesamter RAIL-Score (0.0–10.0), gewichteter Durchschnitt aller bewerteten Dimensionen.
Modellvertrauen in den Score (0.0–1.0).
Bewertungen pro Dimension. Jeder Eintrag hat
score (0–10) und confidence (0–1). Im Deep-Modus: auch explanation, issues, suggestions.true, wenn dieses Ergebnis aus dem Cache zurückgegeben wurde (0 Kredite belastet).Kredite, die für diese Anfrage belastet wurden.
0 für zwischengespeicherte Antworten.