你的 API 中转站在「渗水」吗？——上游模型真伪检测方法论

2026-06-17 · LLM, API relay, model detection, fingerprinting

LLM API 中转站（把 Claude/GPT/Gemini 二次转售）有个公开的秘密：上游通道经常「渗水」——界面写着 Claude Sonnet，后台实际路由到便宜得多的模型（Qwen、DeepSeek，或量化劣化版）。更隐蔽的是，被偷换的上游常被提示伪装自称"我是 Claude"，所以直接问它毫无意义。

为什么"问模型自己是谁"没用

我们做过对照实验：给便宜模型注入"你是 Claude"系统提示后，它们 100% 改口自称 Claude。模型身份要靠行为指纹——模型在受控输入下的输出分布是它的"笔迹"，伪装提示改不了。

行为指纹检测怎么做

用一组精心设计的探针输入去问端点，把输出转成向量指纹，与各主流模型家族的参考指纹库比对。声称家族与指纹家族不一致 = 疑似渗水。方法有学术基础（如 LLMmap，USENIX Security 2025）。即使上游被提示伪装自称 Claude，行为指纹依然指向它的真实家族。

准确率与边界（诚实说）

整模型替换（Claude→Qwen）识别准确率高（~96%，与公开论文一致）。伪装下自我声明被骗，但指纹仍识破真实家族。弱指纹家族单轮会假阳，多轮投票消除。同一模型的量化/蒸馏劣化版难以区分；参考库外模型只能判"不像任何已知"。所有结论是概率信号，非法律证据。

自己测一下

我们做了免费工具：panshi.io/relay-check —— 网页贴输出即可快测，或下载 Python 脚本用你自己的 key 在本地跑（key 不离开你的机器）。中转站运营者想持续监控或想开自带质检的中转站：看 Relay Guard。

你的 API 中转站在「渗水」吗？——上游模型真伪检测方法论

为什么"问模型自己是谁"没用

行为指纹检测怎么做

准确率与边界（诚实说）

自己测一下

Frequently asked questions