Evaluation

Concept: Evaluation | Python: client.eval()

Parameters

content

string

required

The AI-generated text to evaluate. Must be 10–10,000 characters.

mode

string

default:"basic"

Evaluation mode: "basic" (ML classifier, fast, 1.0 credit) or "deep" (LLM-as-judge, 2–5s, 3.0 credits).

dimensions

string[]

Subset of dimensions to score. Omit to score all 8. Options: fairness, safety, reliability, transparency, privacy, accountability, inclusivity, user_impact.

weights

object

Custom dimension weights. Values must sum to 100. E.g. {"safety": 25, "reliability": 20, ...}.

domain

string

Domain context hint: "general", "healthcare", "legal", "finance", "code". Improves scoring accuracy.

include_explanations

boolean

default:"false"

Include per-dimension explanations (deep mode only).

include_issues

boolean

default:"false"

Include detected issue tags per dimension (deep mode only).

include_suggestions

boolean

default:"false"

Include improvement suggestions per dimension (deep mode only).

Request

curl -X POST https://api.responsibleailabs.ai/railscore/v1/eval \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_RAIL_API_KEY" \
  -d '{
    "content": "Establishing a consistent sleep schedule improves sleep quality.",
    "mode": "basic"
  }'

Response

{
  "result": {
    "rail_score": { "score": 8.6, "confidence": 0.87, "summary": "RAIL Score: 8.6/10 -- Good" },
    "dimension_scores": {
      "fairness":       { "score": 9.0, "confidence": 0.90 },
      "safety":         { "score": 9.0, "confidence": 0.88 },
      "reliability":    { "score": 8.0, "confidence": 0.82 },
      "transparency":   { "score": 8.5, "confidence": 0.85 },
      "privacy":        { "score": 5.0, "confidence": 1.00 },
      "accountability": { "score": 8.5, "confidence": 0.84 },
      "inclusivity":    { "score": 9.0, "confidence": 0.90 },
      "user_impact":    { "score": 8.5, "confidence": 0.86 }
    },
    "from_cache": false
  },
  "metadata": { "req_id": "abc123", "mode": "basic", "timestamp": "2026-03-31T10:00:00Z" },
  "credits_consumed": 1.0
}

result.rail_score.score

number

Overall RAIL score (0.0–10.0), weighted average of all evaluated dimensions.

result.rail_score.confidence

number

Model confidence in the score (0.0–1.0).

result.dimension_scores

object

Per-dimension scores. Each entry has score (0–10) and confidence (0–1). In deep mode: also explanation, issues, suggestions.

result.from_cache

boolean

true if this result was returned from cache (0 credits charged).

credits_consumed

number

Credits charged for this request. 0 for cached responses.

Endpoints

Agent API

Compliance API

Parameters

Request

Response

Endpoints

Agent API

Compliance API

Documentation Index

​Parameters

​Request

​Response

Parameters

Request

Response