Panshi
EN/

首页 / 博客

你的 API 中转站在「渗水」吗?——上游模型真伪检测方法论

2026-06-17 · LLM, API relay, model detection, fingerprinting

LLM API 中转站(把 Claude/GPT/Gemini 二次转售)有个公开的秘密:上游通道经常「渗水」——界面写着 Claude Sonnet,后台实际路由到便宜得多的模型(Qwen、DeepSeek,或量化劣化版)。更隐蔽的是,被偷换的上游常被提示伪装自称"我是 Claude",所以直接问它毫无意义。

为什么"问模型自己是谁"没用

我们做过对照实验:给便宜模型注入"你是 Claude"系统提示后,它们 100% 改口自称 Claude。模型身份要靠行为指纹——模型在受控输入下的输出分布是它的"笔迹",伪装提示改不了。

行为指纹检测怎么做

用一组精心设计的探针输入去问端点,把输出转成向量指纹,与各主流模型家族的参考指纹库比对。声称家族与指纹家族不一致 = 疑似渗水。方法有学术基础(如 LLMmap,USENIX Security 2025)。即使上游被提示伪装自称 Claude,行为指纹依然指向它的真实家族。

准确率与边界(诚实说)

整模型替换(Claude→Qwen)识别准确率高(~96%,与公开论文一致)。伪装下自我声明被骗,但指纹仍识破真实家族。弱指纹家族单轮会假阳,多轮投票消除。同一模型的量化/蒸馏劣化版难以区分;参考库外模型只能判"不像任何已知"。所有结论是概率信号,非法律证据。

自己测一下

我们做了免费工具:panshi.io/relay-check —— 网页贴输出即可快测,或下载 Python 脚本用你自己的 key 在本地跑(key 不离开你的机器)。中转站运营者想持续监控或想开自带质检的中转站:看 Relay Guard

Frequently asked questions