sentinelK
即便是现在,copilot 的 ask 模式的代码合并依然还是很烂。 agent 模式应该是改变了最终生成代码的形态,变相解决了这个问题
应该是跟工具,以及基座模型能力二者都相关。
如果是同行,应该是基座模型能力差。 如果是不同行,应该是工具逻辑有问题。
最起码法宝还是实际战力的 pk 。
但现在的 AI Coding 已经比的是谁烧 token 烧的更狠了。真正 coding 的效果没人关心的。
程序员就是需要和人打交道的职业。你不打交道如何确认需求和产出? 即便退回到 2010 年对日外包盛行的年代,你如果想当好程序员,依然是要交流的。
交流≠交际≠跪舔
如果是个人设备就可以部署的模型,为何 openRouter 需要你来提供上游服务?
反过来讲,你如果是一个合格的大模型 API 提供商,为何非要绑定 openRouter ?
从 AI Coding 的 Agent 设计来看,一般都是要求 LLM 要明确表达出最终改动的位置和内容,且通过 shell 复核确认,才算成功。最终的“完成状态”不依照 LLM 的 token 表述,是靠查验脚本决定。
Copilot 的最新额度扣除规则,也是通过类似的逻辑实现的。在 Age…
举个最简单的例子,你用微信是因为腾讯代码写得好吗?
聊起行业软件的竞争力,我能想到的: 品牌、行业口碑,客户关系,运维服务,产品逻辑,定制二开。
什么时候代码实现也能当行业竞争力了?
首先,要先去试驾,再聊性价比。
有的车纸面数据再好,上车踩一脚油门,拧一把方向,不是你喜欢的风格就直接 pass 了。之前的纸面功夫全都白搭。 车给人的感受 90%是动态的,不是静态纸面的。
不一样的调教风格,不一样的硬件,乃至不一样的胎宽,给你的驾驶手感都是完全不同的。所以先试驾。
我认为如果楼主想证明某些论点,最起码得有一点点定量分析。 通篇都是“可能”、“还不清楚”、“或许”
所以你建立在这些“可能”假设的结论有什么价值呢?
没人能负责任的解答你的问题,除非他是先知。
本质上,llm 难以替代的,是“不可全面量化”的工作。
这个“不可量化”有很多维度。 1 、公开数据很少。 2 、不以产出来绝对衡量能力与价值。 3 、没有明确的规则边界。 4 、需要取得别人的认可与信任。 5 、你的产出质量远超业界…