中转站检测方法论 · 模型验真原理

TTCat 采用三层黑盒探针架构，多信号融合评分 + Hard-Gate 一票否决，全过程产出可第三方核验的 HMAC 证据链。

核心理念

指纹是统计分布，不是单次输出

行为指纹需聚合样本，真伪判定用统计检验而非单点比较。

精准优先（低误报）

误伤诚实站点代价高于漏判，判罚必须统计显著并附证据链。

探针可再生、像正常流量

防止中转站识别固定探针后只把它们转发给真模型作弊。

零存储信任基石

API Key 全链路不落盘、内存加密、用完即焚。

层	维度	成本	说明
L1	协议层指纹	极低	tool_use/tool_calls id 前缀、message id 格式、ratelimit header、cache_creation 嵌套结构、service_tier 等。识别真实后端来源（Anthropic 直连 / Bedrock / Vertex / 逆向源）。缺失字段即负面证据。
L2	身份/真伪 (KBF)★	核心	知识边界指纹：在模型知识边界附近询问数值型事实，与参考共识值在领域容差内比对，用 precision-first 统计检验判定是否与声称模型一致。辅以身份自述（弱信号）。
L5	性能/稳定性	低	TTFT 首 token 延迟、TPS 吞吐、P95、缓存命中率、可用率。性能单独成轴展示，不计入信任分。

最终信任分 = 加权多维度分 ⊗ Hard-Gate 一票否决

信任分由「真伪 60% + 协议 40%」加权得出，并按样本量用 Wilson 下界做小样本压分。命中任一 Hard-Gate（如 KBF 统计显著不一致、后端来源严重不符）直接判定为「不通过」，无视加权分。

每条探针结果写入链式 HMAC-SHA256：hmac(key, prev_hash + record)，任意一条被篡改其后全部校验失败。检测完成后可一键下载自验证 bundle，第三方可独立重放核验，无需信任 TTCat。

中立性声明：TTCat 自费采集、不接受任何影响排名的中转赞助或广告。检测结果基于黑盒探针的统计推断，仅作技术参考，不构成对任何端点的担保或法律结论。真伪检测使用公开演示探针集，生产级审计需为声称版本生成私有探针并跨轮换。