MiniMax-M2.7-highspeed 模型真的一般般
昨天要增加一个新功能,改动比较多,尤其是前端。 于是我用 opus4.6 让 superpowers:brainstorming 开始规划,他分析所有相关不相关的文件,最后整理出一个非常详细的开发设计,以及开发任务,每个大任务还分了几个小任务,任务里都有改哪些文件改什么地方怎么改怎么验证,只需要照着任务指引做就行了。
前段时间因为玩龙虾,开了 minimax 那个 98 的极速版 token plan 。
然后我想着任务都规划的这么细了,让 MiniMax-M2.7-highspeed 干一干试试呗。
晚上 10 点开始,我想着改动也不大就十几个文件,搞一个来小时绝对可以了吧,于是切到 minimax ,开启 agent team 开干。开始感觉还挺好,十几个 agent 五颜六色的在跑,各种开发各种 review ,我心想国产大模型也没他们说的那么不堪嘛,好赖有个平替,以后 opus 规划,minimax 执行好像也挺不错。
框框不到一个小时任务全跑完了,给我报告说所有任务都完成了。
于是我就打开测试一下,后端除了数据库没导入,有些字段类型错误,也没啥问题,花了十几二十分钟来回对话他给修好了,API 没问题了,毕竟接口调整不大就改几个返回格式。
问题出在前端,前端需要增加一个侧滑抽屉,兼容 H5 和 APP 以及 PC 端,滑出来的位置总是不对,然后还有很多大小位置滑动等等问题,完全没法用。
于是我就跟他说有什么什么问题,然后他哼哧哼哧改,如此反复又反复对话光是我给他说问题就用了将近 100M 的 tokens
上头了,最后折腾到凌晨快 2 点还是一堆问题。
实在顶不住了,git 重置,切到 sonnet 不到半个小时完美完成任务,几个小问题对话了几次就搞定了。
最后发布上线,折腾到凌晨 3 点。
第二天直接买 VPS 固定 IP ,新卡新号升级到 claude max ,要不是最近大封号,我之前的被封了,然后试了一大堆中转站体验实在一般般,并且最近封号很多都不能用或者是逆向的,都不会想到要折腾这国产模型。
总结就是,跑分多牛逼都没用,任务分的多细都没用,因为最终执行是靠模型能力的,不要想着 opus 做规划国产模型来执行,这条路行不通的。我之前还测试 claude 开发完,让国产模型去跑测试,测都测不明白。
截止到今天,真正的生产力,现在唯二的选择还是 cluade ( opus,sonnet )和 codex ( gpt5.4 ),其他大家试都不用试了,纯浪费时间精力,一个月多花一千几百大家多睡几个好觉吧。
op 图中是什么软件统计的?
@weixiaoyun #2 ccusage 统计的数据,写了个 chrome 插件方便自己看
可以试试我自己 vibe 的工具,实时对话 review ,没办法消除但可以降低一定的幻觉,总体上对输出是有提升的 https://github.com/timwuhaotian/the-pair 欢迎 contribute
我基本全用 codex + copilot pro+的 claude 模型,kimi2.5 + GLM 用来打辅助任务,国产执行力 kimi 和 glm 好一点,minimax 模型太小
幸亏没手贱花几十块钱试一下