GoForum🌐 V2EX

MiniMax-M2.7-highspeed 模型真的一般般

mogutouer · 2026-03-25 11:04 · 0 次点赞 · 7 条回复

昨天要增加一个新功能,改动比较多,尤其是前端。 于是我用 opus4.6 让 superpowers:brainstorming 开始规划,他分析所有相关不相关的文件,最后整理出一个非常详细的开发设计,以及开发任务,每个大任务还分了几个小任务,任务里都有改哪些文件改什么地方怎么改怎么验证,只需要照着任务指引做就行了。

前段时间因为玩龙虾,开了 minimax 那个 98 的极速版 token plan 。

然后我想着任务都规划的这么细了,让 MiniMax-M2.7-highspeed 干一干试试呗。

晚上 10 点开始,我想着改动也不大就十几个文件,搞一个来小时绝对可以了吧,于是切到 minimax ,开启 agent team 开干。开始感觉还挺好,十几个 agent 五颜六色的在跑,各种开发各种 review ,我心想国产大模型也没他们说的那么不堪嘛,好赖有个平替,以后 opus 规划,minimax 执行好像也挺不错。

框框不到一个小时任务全跑完了,给我报告说所有任务都完成了。

于是我就打开测试一下,后端除了数据库没导入,有些字段类型错误,也没啥问题,花了十几二十分钟来回对话他给修好了,API 没问题了,毕竟接口调整不大就改几个返回格式。

问题出在前端,前端需要增加一个侧滑抽屉,兼容 H5 和 APP 以及 PC 端,滑出来的位置总是不对,然后还有很多大小位置滑动等等问题,完全没法用。

于是我就跟他说有什么什么问题,然后他哼哧哼哧改,如此反复又反复对话光是我给他说问题就用了将近 100M 的 tokens

上头了,最后折腾到凌晨快 2 点还是一堆问题。

实在顶不住了,git 重置,切到 sonnet 不到半个小时完美完成任务,几个小问题对话了几次就搞定了。

最后发布上线,折腾到凌晨 3 点。

第二天直接买 VPS 固定 IP ,新卡新号升级到 claude max ,要不是最近大封号,我之前的被封了,然后试了一大堆中转站体验实在一般般,并且最近封号很多都不能用或者是逆向的,都不会想到要折腾这国产模型。

总结就是,跑分多牛逼都没用,任务分的多细都没用,因为最终执行是靠模型能力的,不要想着 opus 做规划国产模型来执行,这条路行不通的。我之前还测试 claude 开发完,让国产模型去跑测试,测都测不明白。

截止到今天,真正的生产力,现在唯二的选择还是 cluade ( opus,sonnet )和 codex ( gpt5.4 ),其他大家试都不用试了,纯浪费时间精力,一个月多花一千几百大家多睡几个好觉吧。

https://i.imgur.com/t5RYV3k.png

7 条回复
imik · 2026-03-25 11:14
#1

幸亏没手贱花几十块钱试一下

weixiaoyun · 2026-03-25 11:19
#2

op 图中是什么软件统计的?

onedge · 2026-03-25 11:19
#3

实测不如 m2.5 的智力,我感觉 2.7 路子走偏了,太往工具链方向了,计划,复盘,疑难杂症攻坚能力真的不如 m2.5 我已经用回 2.5 (做执行和日常非编程任务)了

mogutouer · 2026-03-25 11:19
#4

@weixiaoyun #2 ccusage 统计的数据,写了个 chrome 插件方便自己看

onedge · 2026-03-25 11:24
#5

可以试试我自己 vibe 的工具,实时对话 review ,没办法消除但可以降低一定的幻觉,总体上对输出是有提升的 https://github.com/timwuhaotian/the-pair 欢迎 contribute

wengjin456123 · 2026-03-25 11:24
#6

我基本全用 codex + copilot pro+的 claude 模型,kimi2.5 + GLM 用来打辅助任务,国产执行力 kimi 和 glm 好一点,minimax 模型太小

ktyang · 2026-03-25 11:29
#7

vps 固定 ip 搭梯子么?还是什么其他的防风操作?

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: mogutouer
发布: 2026-03-25
点赞: 0
回复: 0