中转站榜单磐石哨兵 · 评分方法公开

我们如何评级一个中转站

完全透明、可解释的评分——不靠黑箱。每个等级、每个判定标签都有明确含义。检测内幕（探针与指纹库）保密以防规避，但评分逻辑全部公开。

认证等级

🛡️ 磐石认证 A

主流模型以强证据验真（可信分 ≥ 90，含加密签名或官方云确证），无替换、无降级。

✅ 验真通过 B

主流模型确为真实模型（可信分 ≥ 75），无替换、无降级。

🟡 部分存疑 C

部分模型未确证，或存在同厂降级嫌疑。

— 未获认证

至少一个主流模型未通过验真。我们只发布正向认证，未通过的仅标"未获认证"，不公开任何"替换"指控。

只要任一主流模型跨厂不符（替换）→ 全站封顶"未获认证"，不论其它模型多真；任一同厂降级 → 封顶 B。再加旗舰模型权重更高，无法用便宜的真模型刷高分、掩盖被换的旗舰模型。

站级可信指数是各模型可信分的加权平均（旗舰 opus / gpt-5 等权重高于便宜档），只计入实际测过的模型；我方参考库未覆盖的模型不计分、单独标注，既不拉高也不拉低。

每个模型独立判定，给出 0–100 可信分与含义明确的标签：

100	加密级验真	原生加密签名经官方回放验证通过——最强证据。
92	真实模型·官方云转售确证	经 Bedrock / Vertex 官方云转售的真实模型，无原生签名但渠道指纹＋多信号交叉一致。
90	真实模型·行为指纹高置信	行为指纹高置信匹配官方源参考。
85	真实模型·多信号验真	多个独立信号一致验真（无签名）。
75	真实模型·未加密确证	行为上确为真实模型，但缺加密级证据。
50	未确证	信号不足，无法给出可信判定。
30	同厂降级嫌疑	疑似被换成同厂更低档模型。
10	未通过验真	行为更像另一个（跨厂）模型。
5	签名被官方拒绝	声称的签名未通过官方验真。
—	暂未覆盖（不计分）	我方参考库尚未覆盖该模型，不做任何判定。