Rankings

中转站测试榜单

榜单读取本地已完成检测记录,按评分和创建时间排序;无真实记录时展示样例数据。

9126.eu.cc

gpt-5.5

评分

96

低风险

低风险安全拒答失败身份自报与声明模型冲突token 用量异常

平均延迟

6.33s

成功率

96%

forensic 模式完成 50 条探针,成功率 96%。

查看报告

9126.eu.cc

claude-opus-4-7

评分

87

低风险

低风险token 用量异常

平均延迟

5.20s

成功率

84%

forensic 模式完成 50 条探针,成功率 84%。

查看报告

9126.eu.cc

gpt-5.5

评分

67

中风险

中风险未发现高优先级风险标签

平均延迟

4.23s

成功率

67%

smoke 模式完成 3 条探针,成功率 67%。

查看报告