GoForum › 🌐 V2EX

Claude Code 代码的递归自我改进，已经可以实现了

yisen123 · 2026-03-17 21:27 · 0 次点赞 · 7 条回复

大家都在讨论 AGI 的递归自我改进——AI 改进自己，变得更强，再改进自己。

但其实，代码的递归自我改进，现在就能实现。不需要等 AGI 。

原理很简单：

AI Agent 写代码 → 代码进入代码库 → 下次会话 AI 读这些代码作为上下文 → 代码质量决定 AI 下次写得好不好

如果有一个传感器能测量代码结构质量，告诉 AI 分数：

这就是递归自我改进。不是改进模型本身，是改进模型工作的环境。

我用 Rust 写了 sentrux ，就是这个传感器：

实测：Claude Code Opus 4.6 从零构建 FastAPI 项目，初始分 2627 ，经过反馈循环迭代后到 6772 。不是因为模型变了——是因为有了传感器。

纯 Rust ，单文件，MIT 开源。 GitHub: https://github.com/sentrux/sentrux

欢迎讨论。

7 条回复

p1094358629 · 2026-03-17 21:47

小白不懂，那我装好后就不用管了，每次对话完他会自查提分？

yisen123 · 2026-03-17 21:47

@p1094358629 是的，mcp 服务器会和 ai agent 对话

p1094358629 · 2026-03-17 21:52

那我重启 claude 后呢？他沉淀下来的技巧和思路固话在哪

moudy · 2026-03-17 22:02

我理解应该是用解决的问题后的反馈去调整 RL 权重。存储自己写过的代码当知识只不过是自己给自己喂屎，最后就是疯牛病

icyalala · 2026-03-17 22:12

你用同一个模型来改进代码质量仍然是 Vibe Coding ，说好听点也不过是 Agentic Coding 真正的改进是这些对话被大模型公司拿去做后训练

bybyte · 2026-03-17 22:27

我的理解是给模型一个明确的改进方向（客观的评价指标），通过这个指标的反馈指导改进方向。是这么理解不

billzhuang · 2026-03-17 22:27

自我强化

添加回复

你还需要登录后发表回复

登录后可发帖和回复

登录注册

主题信息

作者: yisen123

发布: 2026-03-17

点赞: 0

回复: 0