vibe-coding 一时爽,一直 vibe-coding 呢?
昨天碰到一个音画不同步问题(数字人说话时一旦声音和画面出现了细微的偏差,整个视频看起来就非常奇怪,嘴型对不上),恁是 vibe 了一整天都没解决。有时候通过 vibe coding 来解决问题,就像是在抽盲盒。由于音视频开发的细节太多,导致 AI 没办法很细致地解决延迟、同步问题。这咋整呢?要么就自己一行一行地去看代码、梳理逻辑,要么就继续 vibe coding 碰概率。而且我发现 vibe coding 到最后真的什么都学不到,没有任何技术上的成长。唯一的收获可能就是做出了一个产品,或者实现了某一个功能。如果将来 AI 能够短时间变得更聪明倒还好,这样大家也不用再关心技术问题了。如果没有的话,或者像自动驾驶从 L2 到 L4 这么缓慢进步,一直 vibe coding 是一件对职业发展很不利的事情,长期如此技术成长基本上就停滞了。所以我觉得现阶段还是非常有必要去搞清楚技术原理,理解架构。并在此基础上去用 AI 来加速开发,而不是一直 vibe coding 下去,什么都不管。如果只是写一个网页、一个插件或者一个简单的 app 或者快速出原型,倒是无关紧要。但如果是像 CyberVerse 这样想要持续更新的项目,这种方式一定是不可持续的,欠下的技术债,终有一天要还。明天开始认真地研究代码、研究逻辑,把 bug 找出来。
这个抽卡的体验让我想起了 Claude 3.7 的时候,AI 不够聪明,就是靠一遍一遍的重复推倒来逼近想要的结果。抽了一天最后发现完全不可用的时候那个挫败感,空虚感太强烈了。在完全不懂的领域里纯靠 AI CODING,出点小 BUG 都没有信心能快速定位进行修改。
这种时候我一般会先尽可能告诉模型问题的复现逻辑(或者可能无法精准复现),然后告诉模型,在你觉得可能的地方打 log ,我把看到的告诉你。一般两三轮下来就解决了。
同感,vibe coding 出原型、验证想法超爽,但遇到音视频同步这类底层问题,不懂原理就真的只能靠抽卡。我现在的方式是先把核心链路的代码读懂,理解了再让 AI 来加速,这样出了 bug 至少知道往哪查。