sentinelK
如果不是纯 vibe 的话(超长任务分解、选型、实施全程不介入) deepseek-v4-flash+claude code ,大概能用十分之一的价格,复刻接近 claude-sonnet 的体验。
代码结构、AI 上下文可见性、程序架构,这三者是风马牛不相及。
并不会互相影响。
你通过什么手段进行的结果审核?如果没有 result review ,会大幅度的消耗你的精力。
你是否通过提示词指导了 AI 如何生成素材?游戏里的视觉效果,五成靠骗,四成凑合,一成靠画。如果你是业余的前提下,主观客观上指导了 AI 如何实现视觉效果,其实绝大多数情况都是误导。
很像大厂的风格。 我挂在某平台的信息上阐述了对于 AI Coding 相关的经历,某公司以有对应职位为由, 和我交流了技术经验,然后直接不回复了。
btw:使用大模型,核心矛盾点,就是你需要投入多少精力来进行控制。这和企业管理的底层逻辑相通。
你给员工更大的自由,他就更能发挥上限,代价就是捅娄子的能力也更强。 你越依赖微操,你的员工的能力就越难以发挥,也就越难以突出你的人力优势。这里要 @蒋委员长
1 、我会干预其架构设计。不是别的,是因为我要为我的 Agent 兜底,他的技术选型我看不懂我就兜不了…… 2 、看心情,所以我目前在尝试可能的情况下,让 hermes 接管我的代码仓库和文档,让他帮我去调用 claudeCode/openCode 。我只提需求和把控设计。 3 、同理,herm…
“知道了工具怎么用,然后探索把工具用起来和用好。 那么人类本能对未知的神秘感和焦虑感也就自然消除”
不会的。 因为目前 LLM 的模式对于消费者而言是全黑盒模式。消费者唯一只知道,调用了某个公司的一个 API 服务。
数据输入输出是否被污染?不知道。 数据究竟被什么模型加工?不知道。…
mlx 的 qwen3.6-35B-A3B 试试看
因为 LLM 的工程实践有个自证陷阱。
你没法证明你的 Agent 流程,或者说工程化产品相比裸模型/竞品是更优、更有效的。 所有人都在吹自己对于 LLM 落地的思路有多么高大上。但聊到实际产出又都阳痿了,因为他们没法对实际产出负责。
但是有一些思想还是有一定的启发作用。
比如任…
这是钓鱼赚币够用了,开始干活了?