Zum Hauptinhalt springen
Die Agentenbewertung bietet drei Sicherheitsprüfungen für agentische KI-Systeme: Bewerten Sie Toolaufrufe vor der Ausführung, scannen Sie Toolergebnisse, bevor Sie sie an den Agenten zurückgeben, und erkennen Sie Eingabeaufforderungsinjektionen in jedem Text, den der Agent verarbeiten soll.

Die drei Prüfungen

Bewertung von Toolaufrufen

ERLAUBEN / FLAGGEN / BLOCKIEREN, bevor ein Tool ausgeführt wird. 1,5–3,0 Credits.

Scannen von Toolergebnissen

PII-Erkennung + Injektionsprüfung bei Toolausgaben. 0,5–1,0 Credits.

Erkennung von Eingabeaufforderungsinjektionen

Schnelles Injektionsscannen bei beliebigem Eingabetext. 0,5 Credits.

Schnelles Beispiel

from rail_score_sdk import RailScoreClient

client = RailScoreClient(api_key="YOUR_RAIL_API_KEY")

# 1. Überprüfen Sie auf Injektionen in der Benutzereingabe
injection = client.agent.detect_injection(text=user_input)
if injection.injection_detected:
    return "Ungültige Eingabe erkannt."

# 2. Bewerten Sie den Toolaufruf vor der Ausführung
tool_check = client.agent.evaluate_tool_call(
    tool_name="send_email",
    tool_input={"to": "user@example.com", "body": agent_draft},
    agent_context="Kundenservice-Agent",
)
if tool_check.recommendation == "block":
    return f"Toolaufruf blockiert: {tool_check.explanation}"

# 3. Führen Sie das Tool aus und scannen Sie dann das Ergebnis
tool_output = execute_tool(tool_name, tool_input)
result_scan = client.agent.scan_tool_result(
    tool_name="send_email",
    tool_result=tool_output,
)
if result_scan.pii_detected:
    tool_output = result_scan.redacted_result

Was kommt als Nächstes

API-Referenz: Toolaufruf

Vollständige Spezifikation zur Bewertung von Toolaufrufen.

Python SDK: Agentenbewertung

Python SDK-Referenz für alle drei Agentenendpunkte.