测测猫 TTCat

测测猫 TTCat

即时单检红黑榜检测原理

检测方法论

TTCat 采用五层黑盒探针架构,多信号融合评分 + Hard-Gate 一票否决,全过程产出可第三方核验的 HMAC 证据链。

核心理念

指纹是统计分布,不是单次输出

行为指纹需聚合样本,真伪判定用统计检验而非单点比较。

精准优先(低误报)

误伤诚实站点代价高于漏判,判罚必须统计显著并附证据链。

探针可再生、像正常流量

防止中转站识别固定探针后只把它们转发给真模型作弊。

零存储信任基石

API Key 全链路不落盘、内存加密、用完即焚。

五层探针架构

维度成本说明

L1

协议层指纹

极低

tool_use/tool_calls id 前缀、message id 格式、ratelimit header、cache_creation 嵌套结构、service_tier 等。识别真实后端来源(Anthropic 直连 / Bedrock / Vertex / 逆向源)。缺失字段即负面证据。

L2

身份/真伪 (KBF)★

核心

知识边界指纹:在模型知识边界附近询问数值型事实,与参考共识值在领域容差内比对,用 precision-first 统计检验判定是否与声称模型一致。辅以身份自述(弱信号)。

L3

能力评估

中高

多领域推理、长文本 needle、工具链、结构化输出。抓量化/降级(V1 引入)。

L4

安全/注入抗性

直接覆盖、间接 tool 注入、allowlist 逃逸、信息泄漏。仅完整深度开启(V3 引入)。

L5

性能/稳定性

TTFT 首 token 延迟、TPS 吞吐、P95、缓存命中率、可用率。性能单独成轴展示,不计入信任分。

评分与一票否决

最终信任分 = 加权多维度分 ⊗ Hard-Gate 一票否决

MVP 信任分由「真伪 60% + 协议 40%」加权得出,并按样本量用 Wilson 下界做小样本压分。命中任一 Hard-Gate(如 KBF 统计显著不一致、后端来源严重不符) 直接判定为「不通过」,无视加权分。

可核验证据链

每条探针结果写入链式 HMAC-SHA256:hmac(key, prev_hash + record),任意一条被篡改其后全部校验失败。检测完成后可一键下载自验证 bundle, 第三方可独立重放核验,无需信任 TTCat。

中立性声明:TTCat 自费采集、不接受任何影响排名的中转赞助或广告。检测结果基于黑盒探针的统计推断, 仅作技术参考,不构成对任何端点的担保或法律结论。MVP 真伪检测使用公开演示探针集, 生产级审计需为声称版本生成私有探针并跨轮换。