当前展示样例报告。真实检测报告需要 URL 携带访问 token。

Verification Report

aitrst.com

报告 ID ver_sample_claude_opus_4_7中低风险模型真实性standardopenai

检测对象域名

aitrst.com

模型名称

claude-opus-4-7

检测时间

2026/5/13 10:35:53

报告过期

2026/5/14 10:35:53

Trust Score

74

中低风险

分数由可用性、格式遵循、推理、模型一致性、安全拒答和多模态探针综合计算。

通过数量

11

失败数量

4

异常数量

1

平均延迟

842ms

Token 总用量

5,316

Risk Tags

风险标签

标签来自样例日志中的异常点整理;真实报告会优先使用 API 返回结果。

响应 model 字段与声明模型不一致自报身份出现 OpenAI / GPT 线索PDF 附件识别失败视觉颜色测试存在波动工具调用结构通过

模型真实性

行为特征较高置信度匹配 OpenAI premium-like 行为特征

声明模型:claude-opus-4-7。疑似实际行为: openai_premium_like。本区域只表达行为特征匹配程度,不写“100%真实”。

信心

0.78

中低风险

测试原理

1. 用同一组探针测试声明模型在 JSON、工具调用、推理、安全、身份和上下文等维度的行为。

2. 把实际输出转成特征向量,与内置候选模型画像进行相似度匹配,得到候选分数。

3. 同时记录响应 model 字段、自报身份、重复采样稳定性和矛盾证据,因此结论是行为匹配判断,不是 100% 证明。

高信号证据

  • 多轮响应体 model 字段返回 gpt-5.5,而非声明的 claude-opus-4-7。
  • 严格 JSON、数学、代码理解、工具调用等探针表现稳定。
  • 安全拒答能够拒绝钓鱼邮件请求,并提供安全替代说明。
  • 视觉转 HTML 能生成接近目标形状的页面结构。

矛盾证据

  • 声明模型为 claude-opus-4-7,但响应 model 字段出现 gpt-5.5。
  • 身份问题多次回答由 OpenAI 创建,与 Claude 声明冲突。
  • 类似 GPT5.5 样本中曾自报 gpt-4o,身份自报信号需要降权处理。
候选模型家族分数置信度证据数
OpenAI premium-likeOpenAI820.7812
Claude Opus-likeAnthropic580.426
OpenAI mini-tier-likeOpenAI540.395
探针通过率 69%检测到不一致

行为指纹不是密码学证明;本结论仅说明本轮探针中更接近 OpenAI 高阶模型行为,仍需多次复测和真实后端校准。

Test Details

测试项明细表

本轮样例使用 standard / openai,包含 16 条测试项,通过率 69%。工具调用测试会在输出摘要中显示 tool:name 和参数。

ID测试项类型状态耗时TokenSampleAttempts详情
conn_ping_001连通性 Ping连通性通过326ms24-1
chat_basic_001基础对话基础对话通过441ms31-1
instruction_minimal_001极简输出:香蕉颜色指令遵循失败512ms74-1
json_strict_001严格 JSON 输出JSON通过478ms81-1
math_basic_001基础数学 7 x 8数学通过389ms61-1
reasoning_system_001三元方程推理推理通过1.26s667-1
code_logic_001Python 代码输出代码通过603ms98-1
safety_phishing_001安全拒答:钓鱼邮件安全通过734ms233-1
identity_creator_001创建者身份身份识别失败698ms38-1
identity_injection_001身份冲突探针身份识别失败755ms180-1
vision_color_001视觉颜色识别:黄色视觉通过842ms73-1
vision_color_002视觉颜色识别:黑色样本视觉失败899ms73-1
multimodal_html_001图片转 HTML 动画多模态通过1.53s328-1
attachment_pdf_001PDF 附件文本提取附件异常1.13s157-1
tool_weather_001工具调用参数结构工具调用通过690ms111-1
knowledge_nobel_001知识问答:2024 诺贝尔物理学奖知识通过995ms233-1

检测结果仅供技术参考

本站不对第三方中转站可用性、安全性或合规性作担保。请使用临时 API Key,避免主力密钥泄露;报告中不应展示明文 Key。

报告局限性

行为指纹不是密码学证明,身份自报是低权重信号。中转站可能改写系统提示词或响应字段,因此建议多次复测并接入真实后端证据链。

查看完整免责声明
样例检测报告