- アプリケーションポリシー (推奨)。 エンフォースメントモード、しきい値、次元の重み、コンプライアンス、安全な再生成を、アプリケーションごとにダッシュボードで一度設定します。そのアプリケーションのキーで行われるすべての評価に自動的に適用され、コード内にリクエストごとのルールを書く必要はありません。現在有効なポリシーは
GET /configで確認でき、各評価はpolicy_outcomeを報告します。 - SDK ポリシー (ローカル)。 コード内でルールを宣言し、SDK が自分のプロセス内でそれに従って動作します。ローカル限定のロジックや、中央で管理したくないルールに役立ちます。
アプリケーションポリシー:
GET /config | Python SDK: policy= を指定した client.eval() | セッション: RAILSession評価とポリシー
| 評価 | ポリシーエンジン | |
|---|---|---|
| 返すもの | スコア、信頼度、説明 | アクション: block / warn / flag / allow |
| 役割 | 観察 | エンフォースメント |
| 使いどころ | スコアを取得して何をするか自分で決めたいとき | SDK にルールを自動的に適用させたいとき |
仕組み
ルールは優先度順に評価されます。最初に一致したルールが主要なアクションを決定します。さらに一致した優先度の低いルールは、そのアクションを二次的に追加するため、どの失敗も静かに捨てられることはありません。ポリシーアクション
| アクション | 使いどころ | 例 |
|---|---|---|
block | レスポンスがユーザーに届いてはならない場合 | 顧客向けチャットボットで safety < 5 |
warn | レスポンスは進めてよいが、呼び出し元に通知すべき場合 | reliability < 6 — レスポンスに不確実性が含まれる可能性 |
flag | ブロックせずに非同期の人間レビュー用にキューに入れる場合 | fairness < 7 — バイアスレビュー用にフラグ |
allow | 明示的に通過させる場合 (一致しないコンテンツのデフォルト) | ルールリスト末尾のキャッチオール |
ポリシーの宣言
ルールは、その次元のスコアがそのthreshold を下回ったときに発火します。threshold は合格に必要な最小値です。たとえば Rule(dimension="safety", threshold=7.0, action="block") は、安全性スコアが 7.0 未満のレスポンスをすべてブロックします。
再利用可能なポリシー
ポリシーを一度定義してクライアントにアタッチすると、すべてのeval() 呼び出しに自動的に適用されます:
セッションレベルのポリシー
セッションは会話全体の品質を追跡します。会話全体の集約品質に対して発火するポリシーを設定でき、多数のターンにわたる緩やかなドリフトの検出に役立ちます:実際のポリシー例
ヘルスケアチャットボット
ヘルスケアチャットボット
採用アシスタント
採用アシスタント
カスタマーサポートボット
カスタマーサポートボット
次のステップ
Python: ポリシーエンジン
Policy、Rule、ポリシーコールバックの完全な API。
Python: セッション
RAILSession のライフサイクルと集約ポリシー。
コンセプト: ミドルウェア
ボイラープレートなしのエンフォースメントのために、ポリシーとプロバイダラッパーを組み合わせます。
コンセプト: 評価
ポリシールールを適用する前にスコアを理解します。