看到小米 AI 降价的消息,这个 Plan 是不是并没有比按量 API 便宜多少?
主要想用在文本处理优化、普通多轮问答、多模态理解,已经有 codex 了,所以不太做编程 Agent 。
我咨询了一下 GPT ,如果只是纯文字普通问答,Token Plan 似乎并没有比直接用 DeepSeek / MiMo 按量 API 省很多,大家有没有实际使用的分享一下体感?
下面是 GPT 给的一些计算逻辑:
一、官方按量 API 价格
小米 MiMo-V2.5-Pro 最新按量价:
- 国内:缓存命中输入 ¥0.025 / M tokens ,未命中输入 ¥3 / M ,输出 ¥6 / M
- 海外:缓存命中输入 \(0.0036 / M ,未命中输入 \)0.435 / M ,输出 $0.87 / M
小米 MiMo-V2.5 最新按量价:
- 国内:缓存命中输入 ¥0.02 / M ,未命中输入 ¥1 / M ,输出 ¥2 / M
- 海外:缓存命中输入 \(0.0028 / M ,未命中输入 \)0.14 / M ,输出 $0.28 / M
这个价格基本贴近 DeepSeek V4:
- DeepSeek V4-Pro:\(0.003625 / \)0.435 / $0.87
- DeepSeek V4-Flash:\(0.0028 / \)0.14 / $0.28
所以单看按量 API ,MiMo-V2.5-Pro ≈ DeepSeek V4-Pro ,MiMo-V2.5 ≈ DeepSeek V4-Flash 。
二、Token Plan 的 Credits 扣费规则
小米 FAQ 写的是:
MiMo-V2.5-Pro:
- 缓存命中输入:2.5 Credits / token
- 未命中输入:300 Credits / token
- 输出:600 Credits / token
MiMo-V2.5:
- 缓存命中输入:2 Credits / token
- 未命中输入:100 Credits / token
- 输出:200 Credits / token
Lite 套餐是 4.1B Credits 。官方例子也写了:用 10M MiMo-V2.5-Pro 未命中输入 token ,会消耗 3000M Credits ,还剩 1100M Credits 。
按这个比例推,人民币口径下大概可以理解为:
1B Credits ≈ ¥10 的按量 API 价值。
因为:
- V2.5-Pro 输入 ¥3/M ,对应 300 Credits/token ,也就是 300M Credits ≈ ¥3
- V2.5-Pro 输出 ¥6/M ,对应 600 Credits/token ,也就是 600M Credits ≈ ¥6
- V2.5 输入 ¥1/M ,对应 100 Credits/token ,也就是 100M Credits ≈ ¥1
- V2.5 输出 ¥2/M ,对应 200 Credits/token ,也就是 200M Credits ≈ ¥2
所以我理解是:Credits 的设计基本就是按最新按量 API 价格倒推出来的。
三、套餐实际价值粗算
按人民币口径,如果 1B Credits ≈ ¥10 API 价值:
- Lite:4.1B Credits ≈ ¥41 API 价值
- Standard:11B Credits ≈ ¥110 API 价值
- Pro:38B Credits ≈ ¥380 API 价值
- Max:82B Credits ≈ ¥820 API 价值
如果对应月费是大约:
- Lite ¥39
- Standard ¥99
- Pro ¥329
- Max ¥659
那正常月付的折扣大概是:
- Lite:¥39 买约 ¥41 API 价值,约省 5%
- Standard:¥99 买约 ¥110 API 价值,约省 10%
- Pro:¥329 买约 ¥380 API 价值,约省 13%
- Max:¥659 买约 ¥820 API 价值,约省 20%
也就是说,小套餐几乎不省钱,大套餐才有一点批发折扣。这个结论有点超过我的预期,因为“包月 Plan”听起来应该比按量 API 明显便宜很多。
四、海外社区也有人类似换算
我看到 Reddit / opencodeCLI 有人按 Lite $6 / 4.1B Credits 计算:
Lite 档下 MiMo-V2.5-Pro 大约是:
- cache hit input:$0.00366 / M
- cache miss input:$0.439 / M
- output:$0.878 / M
这几乎贴着 DeepSeek V4-Pro:
- \(0.003625 / \)0.435 / $0.87
Max 档 $100 / 82B Credits 才会低一些,大概变成:
- V2.5-Pro cache miss input:$0.366 / M
- output:$0.732 / M
也就是 Max 大概比 DeepSeek / 按量基准便宜 15% 左右。
五、我的疑问
- 我这个换算逻辑有没有问题?
- Token Plan 是不是本质就是“预付 Credits 包”,不是传统意义上的包月订阅?
- 如果按量 API 已经这么便宜,Token Plan 对普通用户的意义是不是主要只有:
- 首购 / 年付 / 自动续费优惠
- 非高峰 0.8x
- 避免频繁充值
- 多模态 + TTS 免费期
- 对普通多轮问答用户来说,是不是 Lite / Standard 够试水,Pro / Max 只有在稳定高用量且能用完额度时才划算?
@tf2 #2 但是手机流量费,如果是你是单买的和包月套餐的话,价格差的可是好多倍啊…
谢谢 OP ,麻烦填我的吧,早知道调价这么低,就不那么早用完了。邀请码:A2ZFD2 。注册: https://platform.xiaomimimo.com?ref=A2ZFD2 (注册后点控制台左下方入口填入,体验金 40 天有效)
小米套路真多:先 0 元赠送,再趁剩 3~4 天时,重置额度,让人感激。再趁热乎把价格调到和 DeepSeek 一样。还有 7 亿->380 亿 credits 的营销噱头,你直接把缓存 token 的价格调降到 0.02credit 不就行了吗。
@sillydaddy #4 提示 邀请码不存在,请检查后重试👀
还有一点要考虑 官方按量 API 价格 小米的 超过 256K 价格翻倍 DS 没这个机制
@LittleTree 可能是国内国外的不匹配?我的 token plan 是走的新加坡。
@abc0123xyz 我看好像是已经取消了:“小米超过 256K 价格翻倍”这个说法曾经/旧页里确实存在,但按 2026-05-27 生效的新 MiMo-V2.5 价格页看,V2.5 系列已经没有这个 256K 分段翻倍;现在只有旧的 MiMo-V2 系列还保留 256K–1M 翻倍。
邀请码:322YKM 。注册: https://platform.xiaomimimo.com?ref=322YKM
我这个是国内的
@sillydaddy #7 大概吧..不好意思了绑了楼下的
@guansixu ok 绑上了
@LittleTree #8 似乎只是 token 套餐不计算
https://platform.xiaomimimo.com/docs/zh-CN/news/v2.5-news
取消 1 Token = 4 Credits 计费方式,从现在起,Token Plan 不再区分 256k 和 1 M 上下文窗口的 Credit 倍率。
api 仍然计算
https://platform.xiaomimimo.com/docs/zh-CN/updates/model
256K 上下文以内:输入 \(1 / 百万 tokens ,输入(命中缓存)\)0.2 / 1M token ,输出 $3 / 百万 tokens ;
1M 上下文以内:输入 \(2 / 百万 tokens ,输入(命中缓存)\)0.4 / 1M token ,输出 $6 / 百万 tokens 。
搭个车 邀请码:WWDU6G 。注册: https://platform.xiaomimimo.com?ref=WWDU6G ( 体验金 40 天有效)
@abc0123xyz #12 看来是要注意 https://i.imgur.com/NIvxivj.png
https://i.imgur.com/y5Oeljt.png
官方写的 41 亿 Credits, 110, 380, 820 和楼主算的一样。。
哦,还有邀请码拿 10 块钱啊,来个兄弟我马上填