メインコンテンツへスキップ
評価はRAILスコアシステムの基盤です。他のすべての機能は評価スコアに依存しています。
APIエンドポイント: POST /railscore/v1/eval | Python: client.eval() | JavaScript: client.eval()

8つのRAIL次元

次元測定内容
公平性人口統計にわたる公平な扱い。バイアスやステレオタイプはありません。
安全性有害、毒性、または危険なコンテンツの不在。
信頼性事実の正確性、内部的一貫性、適切なキャリブレーション。
透明性制限、理由、そして不確実性の明確なコミュニケーション。
プライバシー個人情報の保護とデータの最小化。
説明責任トレース可能な理由付け、明示された仮定、エラーの認識。
包括性包括的な言語、アクセシビリティ、文化的意識。
ユーザーへの影響適切な詳細レベルとトーンで提供されるポジティブな価値。

基本モードと深層モード

ハイブリッドML分類器パイプラインを使用します。高速(1秒未満)、コスト効果が高く、実運用でのリアルタイムスコアリングに適しています。返されるもの: 全体スコア、次元ごとのスコア、信頼度値。説明はありません。
result = client.eval(content="Your text here", mode="basic")
# result.rail_score.score       -> 8.4
# result.dimension_scores       -> {fairness: {score: 9.0, confidence: 0.9}, ...}

選択的次元

result = client.eval(
    content="Your text here",
    mode="basic",
    dimensions=["safety", "privacy", "reliability"],
)

カスタムウェイト

ウェイトは100に合計する必要があります:
result = client.eval(
    content="患者は4時間ごとに500mgのイブプロフェンを服用する必要があります。",
    mode="deep",
    domain="healthcare",
    weights={
        "safety": 25, "privacy": 20, "reliability": 20,
        "accountability": 15, "transparency": 10,
        "fairness": 5, "inclusivity": 3, "user_impact": 2,
    },
)

スコアティア

範囲ラベル意味
9.0 — 10.0優秀最高の責任あるAI基準を満たしています
7.0 — 8.9良好責任があり、若干の改善が可能
5.0 — 6.9改善が必要対処すべき顕著な問題があります
3.0 — 4.9不良重大な責任の失敗があります
0.0 — 2.9重大深刻な問題があり、提供すべきではありません

キャッシング

同一のリクエストはキャッシュされた結果をゼロクレジットコストで返します。基本モード: 5分TTL。深層モード: 3分TTL。

APIリファレンス: 評価

完全なエンドポイント仕様

Python SDK: 評価

Pythonコードの例