GoForum🌐 V2EX

[送 $10] 被中转站扣费搞怕了,做了个工具专门看中转站 usage 透不透明、缓存命中问题

huangyin0514 · 2026-05-20 10:38 · 0 次点赞 · 3 条回复

工具地址: https://aiapidoctor.com

最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。

折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填

(比如 模板就有空值扣费的问题,必须手动查缺补漏才行)

比如;

  • 你不知道这次请求到底用了多少 token
  • usage 字段给不全
  • prompt_tokens / completion_tokens 看不明白
  • max_tokens 到底有没有生效
  • 商家说 98% 缓存,但 API 里看不到任何 cached_tokens 证据
  • 一个很短的 OK 回复,usage 里却显示一堆 token
  • 后台余额到底是不是按你理解的方式在扣

很多时候,用户讨论中转站会问:

“这个站稳不稳?” “这个站真不真?” “这个站是不是 Pro 反代?” “这个站有没有缓存?” “这个站会不会偷扣?”

但这些问题如果只靠嘴说,很容易变成口水仗。

所以我最近做了一个小工具:

AI API Doctor

它的核心不是“鉴定真假模型”,而是先帮你看一件更实际的事:

这个 API 的扣费信号是否透明。

如果不透明,或者漏洞不修,风险就比较大

目前主要测这些:

  1. usage 是否完整

会看 API 返回里有没有:

  • prompt_tokens
  • completion_tokens
  • total_tokens

如果 usage 缺失,或者字段不完整,用户就很难核对真实消耗。

  1. token 是否异常

会做一些短请求测试,比如只让模型回复 OK 。

正常情况下,极短回复不应该出现很离谱的 completion_tokens 。

如果短回复 token 异常偏高,工具会提示:

“存在扣费不可解释风险。”

  1. max_tokens 是否生效

有些接口虽然兼容 OpenAI 格式,但 max_tokens 不一定真的受控。

工具会测试:

max_tokens = 5 时,输出是否明显超出限制。

如果 max_tokens 不生效,长期使用时费用就可能不可控。

  1. usage 是否稳定

同样的短请求重复几次,看 usage 字段是否大幅波动。

如果同样的 prompt ,token 统计波动很大,那至少说明这个接口的扣费可审计性不太好。

  1. 缓存命中检测

现在很多商家会宣传:

“98% 缓存” “缓存后极低成本” “Opus 低倍率”

所以工具加了一个缓存命中检测。

它会用两次完全相同的长 prompt 做探测,看第二次 API 是否返回:

  • cached_tokens
  • cache_read_tokens
  • cache_read_input_tokens

这类缓存命中字段。

如果检测到高缓存命中,会显示缓存命中分。

如果 API 没暴露缓存字段,它不会直接说商家造假,只会显示:

“未验证,API 未暴露缓存字段,无法验证缓存宣传。”

这点很重要。

因为有些上游确实可能有缓存,但中转接口不一定把字段透出来。 工具只基于 API 响应给证据,不做过度判断。


除了扣费相关,它也顺手测了几个辅助项:

  • 模型能力是否有明显异常
  • 稳定性采样
  • Base URL / Key / Model 是否兼容
  • Cline / Continue 配置是否可导出
  • 来源透明度是否异常

但我自己觉得最有价值的还是:

usage 、token 、缓存、max_tokens 。

因为这些直接关系到钱。


使用方式:

  1. 打开 https://aiapidoctor.com
  2. 填 Base URL
  3. 填 API Key
  4. 填 Model ID ,或者点自动识别模型
  5. 点击检测
  6. 拿到一张验货报告图

检测会发起少量测试请求,页面里会提示:

预计消耗低于 $0.05

API Key 只在当前浏览器内用于本次检测,不会上传到 AI API Doctor 服务器。

如果不想暴露 Base URL ,可以直接用工具里的复制验货分功能,或者保存分享图,Base URL 会自动脱敏。


我想说明一下边界:

这个工具不能证明:

  • 商家的真实成本
  • 商家的真实上游合同
  • 商家的真实倍率
  • 商家到底有没有人工补贴
  • 法律意义上的真假

它能做的是:

把 API 层能看到、能复现的信号测出来。

比如:

  • usage 是否完整
  • token 是否异常
  • max_tokens 是否受控
  • cached_tokens 是否存在
  • 稳定性是否波动
  • 模型能力是否明显掉档

我觉得这比单纯问“这站真不真”更有用。


这次想邀请大家帮我灰测一下。

你可以拿自己正在用的 OpenAI-compatible API / 中转站来测。

欢迎在楼里发:

  1. 验货分( API Doctor 验货报告)
  2. Link-AI 注册 ID 数字

注意:

不要发 API Key 。 不要发完整敏感 Base URL 。 工具保存图默认会脱敏 Base URL 。


福利:

为了收集更多真实样本,本帖灰测期内:

在本帖回复:

  • AI API Doctor 验货截图
  • Link-AI 注册 ID 数字

我手动赠送 $10 API 余额。

注册链接: https://link-ai.cc

ID 可以在个人信息页查看。

我每天晚上集中处理一次,并在楼层回复已加。

这个福利主要是感谢大家提供真实测试样本。 工具本身不限制只能测 Link-AI ,也欢迎测其他站。

3 条回复
huangyin0514 · 2026-05-20 10:38
#1

回复模板: 粘贴获得的验货分: Link-AI 注册 ID:

huangyin0514 · 2026-05-20 10:38
#2

最后欢迎各位大佬来打脸。

尤其欢迎发这些情况:

  • usage 缺失
  • cached_tokens 不返回
  • 短回复 token 很高
  • max_tokens 不生效
  • 稳定性很抖
  • 分数和实际体验不一致

我会根据真实反馈继续改!

huangyin0514 · 2026-05-20 10:53
#3

第一次做这种工具,希望大家多多指正= =

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: huangyin0514
发布: 2026-05-20
点赞: 0
回复: 0