Python SDK:
client.eval() with policy= | セッション: RAILSession評価とポリシー
| 評価 | ポリシーエンジン | |
|---|---|---|
| 返すもの | スコア、信頼度、説明 | アクション: block / warn / flag / allow |
| 役割 | 観察 | 強制 |
| 使用するタイミング | スコアを取得し、何をするかを決定したい場合 | SDKにルールを自動的に強制させたい場合 |
仕組み
ルールは優先順位の順に評価されます。最初に一致したルールが主要なアクションを決定します。さらに一致する低優先度のルールは、そのアクションを二次的に追加するため、失敗は静かに無視されません。ポリシーアクション
| アクション | 使用するタイミング | 例 |
|---|---|---|
block | 応答がユーザーに届いてはいけない場合 | 顧客向けチャットボットでの safety < 5 |
warn | 応答は進行できるが、呼び出し元に通知する必要がある場合 | reliability < 6 - 応答には不確実性が含まれる可能性があります |
flag | ブロックせずに非同期の人間によるレビューのためにキューに入れる場合 | fairness < 7 - バイアスレビューのためにフラグを立てる |
allow | 明示的に通過させる場合(一致しないコンテンツのデフォルト) | ルールリストの最後のキャッチオール |
ポリシーの宣言
再利用可能なポリシー
ポリシーを一度定義し、クライアントに添付することで、すべてのeval() 呼び出しに自動的に適用されます:
セッションレベルのポリシー
セッションは、会話全体の品質を追跡します。集約された会話の品質に基づいてトリガーされるポリシーを設定でき、これは多くのターンにわたる徐々のドリフトを検出するのに便利です:実際のポリシーの例
ヘルスケアチャットボット
ヘルスケアチャットボット
採用アシスタント
採用アシスタント
カスタマーサポートボット
カスタマーサポートボット
次は何をするか
Python: ポリシーエンジン
ポリシー、ルール、およびポリシーコールバックの完全なAPI。
Python: セッション
RAILSessionライフサイクルと集約ポリシー。
概念: ミドルウェア
ゼロボイラープレートの強制のためにプロバイダラッパーとポリシーを組み合わせます。
概念: 評価
ポリシールールを適用する前にスコアを理解します。