GoForum › 🌐 V2EX

讲讲我的中转站建站历程，大家似乎都不太关注中转站实际使用的模型，最近我的 gpt-oss-120b（别名成 GPT-5.5）蜜罐被盗刷炸了

longxinglink · 2026-05-27 16:33 · 0 次点赞 · 0 条回复

最近发生了一件挺好玩的事——我搭的那个中转站，流量炸了。

原因不是上游 API 免费额度用完，是我自己这边的 render 双向流量跑满了 200GB ，然后邮件给我，自动停机了

先说说这逆天小破玩意儿是怎么搭起来的

目标很简单：运营成本无限趋近于零，反正我也用不完，baseurl 和 key 直接给朋友用了。

具体做法是聚合上游几百个模型，用 render 走 docker 部署，数据库用的 GitHub 私有仓库，然后把 BaseURL 和 Key 直接暴露出去

这里写了一部分上游，还有一些其他的比如 cloudflare 这类，怕被你们薅死就没写 https://www.v2ex.com/t/1205711

哦，实测建号池是坑，CPA 代码没有指纹模拟，sub2api 就模拟了个请求头，被审计到直接 403 封号，不知道那些拼车的是怎么解决封号问题的，虽然说无论是走 apple store 还是 Credit Cards 正规付款，争议退款是每个消费者的权力，但不建议滥用哈，大家自行斟酌吧

非要建高级模型 API 建议去看看企业计划 API 或者新用户试用 API ，比如 AWS （亚马逊云那个）目前有 unlimited Claude API ，可以找客服申请 Claude 模型使用权限，而且不限量，Azure 有企业计划可以给初创企业提供几千美元的 Chatgpt-5.5 API ，国外很多企业也是拿这些渠道的 API 套审计给员工用，比如 v 友推荐的 https://github.com/maximhq/bifrost 可以审计对话记录，时间，用途这类，完全符合业务规定，当然用的时候得注意 baseurl 是不是 aws 和 azure 的，别给骗了，论坛里面的被骗不像闲鱼，还能披露和追回。

讲讲我的蜜罐设计

主要提供服务的模型，我把它别名成比如 Zaku-3.5 ，用的是薅的 AWS 试用金，即使被刷爆也可以接受的廉价账号，听起来就像个杂牌小垃圾，但居然没人刷，我和朋友一起用，两个多月就用了$180 多一些。

建站的时候，把两个垃圾模型——gpt-oss-120b 和 gpt-oss-20b——改了个别名，叫做：

gpt-5.5
gpt-5.4

一开始没啥人去用，最近 GPT-5.5 用量突然变多，gpt-oss-120b 用量占 99.98%以上，也不知道他们是怎么知道 baseurl 和 key 的，发现有人用之后我和朋友商量了一下，就把 AWS API 轮换掉了，移动到另一个 render 账户和域名里面，顺便也想看看他们是怎么玩 API 的。

蜜罐把我自己撑爆了

大量外部请求涌进来之后，双向流量哗哗地跑，这个月直接把 render 的双向 200GB 上限给吃满了，直到前几天晚上，朋友给我报告说 403 ，去看 render 邮件才知道是流量熔断了，切个 render 账户重新部署之后还在同域名下继续跑。

日志里躺着些什么

因为用的是 CliproxyAPI ，日志和对话记录都在，但是前几天重写部署的时候更新了一下 docker 镜像，用量统计被作者删除了，那么正好放弃屎山，重新部署更优雅的。

打算找个周末好好翻一翻，看看这些冲着 gpt-5.5 来的人是在聊啥，到时候有意思的内容再单独写一篇。

后续打算怎么搞

dedirock 最近交付给我了 6.07 美元/年的 Promo VPS Saver LA BF 2025 ，1 核心 2GB 内存 3GB 储存 4000 GB 流量上限。还白嫖到了 oracle 的 AMD vps ，虽然只有 50Mbps 但好在无限制流量，应该会暂时拿这两台顶着。

后面 API 打算迁移到 https://github.com/maximhq/bifrost ，细粒度审计对话记录和用量，比依赖开发者的 CPA 强大太多

总体来说这个思路还是跑通了，只是没想到瓶颈不在上游成本，而在自己这边的出口流量。

下次再聊。

0 条回复

添加回复

你还需要登录后发表回复

登录后可发帖和回复

登录注册

主题信息

作者: longxinglink

发布: 2026-05-27

点赞: 0

回复: 0