GoForum › 🌐 V2EX

[送 $10] 被中转站扣费搞怕了，做了个工具专门看中转站 usage 透不透明、缓存命中问题

huangyin0514 · 2026-05-20 10:38 · 0 次点赞 · 3 条回复

工具地址： https://aiapidoctor.com

最近自己的站点升级，但是发现各种 Claude / GPT / Gemini 接口和客户端配置。

折腾久了之后，发现很多站点是按照模板搭建的，但是后台有很多坑要填

（比如模板就有空值扣费的问题，必须手动查缺补漏才行）

比如；

你不知道这次请求到底用了多少 token
usage 字段给不全
prompt_tokens / completion_tokens 看不明白
max_tokens 到底有没有生效
商家说 98% 缓存，但 API 里看不到任何 cached_tokens 证据
一个很短的 OK 回复，usage 里却显示一堆 token
后台余额到底是不是按你理解的方式在扣

很多时候，用户讨论中转站会问：

“这个站稳不稳？” “这个站真不真？” “这个站是不是 Pro 反代？” “这个站有没有缓存？” “这个站会不会偷扣？”

但这些问题如果只靠嘴说，很容易变成口水仗。

所以我最近做了一个小工具：

AI API Doctor

它的核心不是“鉴定真假模型”，而是先帮你看一件更实际的事：

这个 API 的扣费信号是否透明。

如果不透明，或者漏洞不修，风险就比较大

目前主要测这些：

usage 是否完整

会看 API 返回里有没有：

prompt_tokens
completion_tokens
total_tokens

如果 usage 缺失，或者字段不完整，用户就很难核对真实消耗。

token 是否异常

会做一些短请求测试，比如只让模型回复 OK 。

正常情况下，极短回复不应该出现很离谱的 completion_tokens 。

如果短回复 token 异常偏高，工具会提示：

“存在扣费不可解释风险。”

max_tokens 是否生效

有些接口虽然兼容 OpenAI 格式，但 max_tokens 不一定真的受控。

工具会测试：

max_tokens = 5 时，输出是否明显超出限制。

如果 max_tokens 不生效，长期使用时费用就可能不可控。

usage 是否稳定

同样的短请求重复几次，看 usage 字段是否大幅波动。

如果同样的 prompt ，token 统计波动很大，那至少说明这个接口的扣费可审计性不太好。

缓存命中检测

现在很多商家会宣传：

“98% 缓存” “缓存后极低成本” “Opus 低倍率”

所以工具加了一个缓存命中检测。

它会用两次完全相同的长 prompt 做探测，看第二次 API 是否返回：

cached_tokens
cache_read_tokens
cache_read_input_tokens

这类缓存命中字段。

如果检测到高缓存命中，会显示缓存命中分。

如果 API 没暴露缓存字段，它不会直接说商家造假，只会显示：

“未验证，API 未暴露缓存字段，无法验证缓存宣传。”

这点很重要。

因为有些上游确实可能有缓存，但中转接口不一定把字段透出来。工具只基于 API 响应给证据，不做过度判断。

除了扣费相关，它也顺手测了几个辅助项：

模型能力是否有明显异常
稳定性采样
Base URL / Key / Model 是否兼容
Cline / Continue 配置是否可导出
来源透明度是否异常

但我自己觉得最有价值的还是：

usage 、token 、缓存、max_tokens 。

因为这些直接关系到钱。

使用方式：

打开 https://aiapidoctor.com
填 Base URL
填 API Key
填 Model ID ，或者点自动识别模型
点击检测
拿到一张验货报告图

检测会发起少量测试请求，页面里会提示：

预计消耗低于 $0.05

API Key 只在当前浏览器内用于本次检测，不会上传到 AI API Doctor 服务器。

如果不想暴露 Base URL ，可以直接用工具里的复制验货分功能，或者保存分享图，Base URL 会自动脱敏。

我想说明一下边界：

这个工具不能证明：

商家的真实成本
商家的真实上游合同
商家的真实倍率
商家到底有没有人工补贴
法律意义上的真假

它能做的是：

把 API 层能看到、能复现的信号测出来。

比如：

usage 是否完整
token 是否异常
max_tokens 是否受控
cached_tokens 是否存在
稳定性是否波动
模型能力是否明显掉档

我觉得这比单纯问“这站真不真”更有用。

这次想邀请大家帮我灰测一下。

你可以拿自己正在用的 OpenAI-compatible API / 中转站来测。

欢迎在楼里发：

验货分（ API Doctor 验货报告）
Link-AI 注册 ID 数字

注意：

不要发 API Key 。不要发完整敏感 Base URL 。工具保存图默认会脱敏 Base URL 。

福利：

为了收集更多真实样本，本帖灰测期内：

在本帖回复：

AI API Doctor 验货截图
Link-AI 注册 ID 数字

我手动赠送 $10 API 余额。

注册链接： https://link-ai.cc

ID 可以在个人信息页查看。

我每天晚上集中处理一次，并在楼层回复已加。

这个福利主要是感谢大家提供真实测试样本。工具本身不限制只能测 Link-AI ，也欢迎测其他站。

3 条回复

huangyin0514 · 2026-05-20 10:38

#1

回复模板：粘贴获得的验货分： Link-AI 注册 ID：

huangyin0514 · 2026-05-20 10:38

#2

最后欢迎各位大佬来打脸。

尤其欢迎发这些情况：

usage 缺失
cached_tokens 不返回
短回复 token 很高
max_tokens 不生效
稳定性很抖
分数和实际体验不一致

我会根据真实反馈继续改！

huangyin0514 · 2026-05-20 10:53

#3

第一次做这种工具，希望大家多多指正= =

添加回复

你还需要登录后发表回复