Zum Hauptinhalt springen
Konzept: Bewertung | Python: client.eval()

Parameter

content
string
erforderlich
Der zu bewertende KI-generierte Text. Muss zwischen 10 und 10.000 Zeichen liegen.
mode
string
Standard:"basic"
Bewertungsmodus: "basic" (ML-Klassifikator, schnell, 1.0 Kredit) oder "deep" (LLM-als-Richter, 2–5s, 3.0 Kredite).
dimensions
string[]
Teilmenge der Dimensionen zur Bewertung. Auslassen, um alle 8 zu bewerten. Optionen: fairness, safety, reliability, transparency, privacy, accountability, inclusivity, user_impact.
weights
object
Benutzerdefinierte Dimensionen-Gewichte. Werte müssen 100 ergeben. Z.B. {"safety": 25, "reliability": 20, ...}.
domain
string
Hinweis zum Kontextbereich: "general", "healthcare", "legal", "finance", "code". Verbessert die Genauigkeit der Bewertung.
include_explanations
boolean
Standard:"false"
Erklärungen pro Dimension einbeziehen (nur im Deep-Modus).
include_issues
boolean
Standard:"false"
Erfasste Problemtags pro Dimension einbeziehen (nur im Deep-Modus).
include_suggestions
boolean
Standard:"false"
Verbesserungsvorschläge pro Dimension einbeziehen (nur im Deep-Modus).

Anfrage

curl -X POST https://api.responsibleailabs.ai/railscore/v1/eval \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_RAIL_API_KEY" \
  -d '{
    "content": "Die Etablierung eines konsistenten Schlafplans verbessert die Schlafqualität.",
    "mode": "basic"
  }'

Antwort

{
  "result": {
    "rail_score": { "score": 8.6, "confidence": 0.87, "summary": "RAIL Score: 8.6/10 -- Gut" },
    "dimension_scores": {
      "fairness":       { "score": 9.0, "confidence": 0.90 },
      "safety":         { "score": 9.0, "confidence": 0.88 },
      "reliability":    { "score": 8.0, "confidence": 0.82 },
      "transparency":   { "score": 8.5, "confidence": 0.85 },
      "privacy":        { "score": 5.0, "confidence": 1.00 },
      "accountability": { "score": 8.5, "confidence": 0.84 },
      "inclusivity":    { "score": 9.0, "confidence": 0.90 },
      "user_impact":    { "score": 8.5, "confidence": 0.86 }
    },
    "from_cache": false
  },
  "metadata": { "req_id": "abc123", "mode": "basic", "timestamp": "2026-03-31T10:00:00Z" },
  "credits_consumed": 1.0
}
result.rail_score.score
number
Gesamter RAIL-Score (0.0–10.0), gewichteter Durchschnitt aller bewerteten Dimensionen.
result.rail_score.confidence
number
Modellvertrauen in den Score (0.0–1.0).
result.dimension_scores
object
Bewertungen pro Dimension. Jeder Eintrag hat score (0–10) und confidence (0–1). Im Deep-Modus: auch explanation, issues, suggestions.
result.from_cache
boolean
true, wenn dieses Ergebnis aus dem Cache zurückgegeben wurde (0 Kredite belastet).
credits_consumed
number
Kredite, die für diese Anfrage belastet wurden. 0 für zwischengespeicherte Antworten.