Skip to content

威胁模型

本页记录 PRX 威胁模型 -- 我们考虑的威胁集合、安全假设和已有的缓解措施。

威胁类别

1. 提示注入

威胁:用户输入或检索数据中的对抗性内容操纵 Agent 执行非预期操作。

缓解措施

  • 工具调用审批工作流
  • 策略引擎限制可用操作
  • 对已知注入模式进行输入清理

2. 工具滥用

威胁:Agent 以非预期方式使用工具(例如读取敏感文件、发起未授权的网络请求)。

缓解措施

  • 工具执行的沙箱隔离
  • 默认拒绝的策略引擎规则
  • 每工具速率限制
  • 所有工具调用的审计日志

3. 数据泄露

威胁:本地系统的敏感数据通过 LLM 上下文或工具调用发送到外部服务。

缓解措施

  • 沙箱中的网络白名单
  • 敏感模式的内容过滤(API 密钥、密码)
  • 限制数据流的策略规则

4. 供应链

威胁:恶意插件或依赖项入侵 Agent。

缓解措施

  • 插件的 WASM 沙箱
  • 插件权限清单
  • 依赖审计(cargo audit)

安全假设

  • 宿主操作系统是可信的
  • LLM 提供商安全处理 API 密钥
  • 用户负责在需要批准时审查 Agent 操作

报告漏洞

如果你发现安全漏洞,请报告至 security@openprx.dev

相关页面

Released under the Apache-2.0 License.