GoForum🌐 V2EX

Claude Code 代码的递归自我改进,已经可以实现了

yisen123 · 2026-03-17 21:27 · 0 次点赞 · 7 条回复

大家都在讨论 AGI 的递归自我改进——AI 改进自己,变得更强,再改进自己。

但其实,代码的递归自我改进,现在就能实现。不需要等 AGI 。

原理很简单:

AI Agent 写代码 → 代码进入代码库 → 下次会话 AI 读这些代码作为上下文 → 代码质量决定 AI 下次写得好不好

如果有一个传感器能测量代码结构质量,告诉 AI 分数:

  • AI 看到分数 → 知道要改进 → 改进代码 → 分数上升
  • 分数上升 → 代码库更清晰 → AI 下次读到更好的上下文 → 写出更好的代码
  • 循环。每次迭代都在变好。

这就是递归自我改进。不是改进模型本身,是改进模型工作的环境。

我用 Rust 写了 sentrux ,就是这个传感器:

  • tree-sitter 扫描( 52 种语言)
  • 5 个根因指标 → 一个质量分( 0-10000 )
  • MCP 接入 Claude Code ,Agent 直接能看到分数
  • 几何平均值聚合( Nash 定理)——没法刷分,只有真正改善架构才能提分

实测:Claude Code Opus 4.6 从零构建 FastAPI 项目,初始分 2627 ,经过反馈循环迭代后到 6772 。不是因为模型变了——是因为有了传感器。

纯 Rust ,单文件,MIT 开源。 GitHub: https://github.com/sentrux/sentrux

欢迎讨论。

7 条回复
p1094358629 · 2026-03-17 21:47
#1

小白不懂,那我装好后就不用管了,每次对话完他会自查提分?

yisen123 · 2026-03-17 21:47
#2

@p1094358629 是的,mcp 服务器会和 ai agent 对话

p1094358629 · 2026-03-17 21:52
#3

那我重启 claude 后呢?他沉淀下来的技巧和思路 固话在哪

moudy · 2026-03-17 22:02
#4

我理解应该是用解决的问题后的反馈去调整 RL 权重。存储自己写过的代码当知识只不过是自己给自己喂屎,最后就是疯牛病

icyalala · 2026-03-17 22:12
#5

你用同一个模型来改进代码质量仍然是 Vibe Coding ,说好听点也不过是 Agentic Coding 真正的改进是这些对话被大模型公司拿去做后训练

bybyte · 2026-03-17 22:27
#6

我的理解是给模型一个明确的改进方向(客观的评价指标),通过这个指标的反馈指导改进方向。是这么理解不

billzhuang · 2026-03-17 22:27
#7

自我强化

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: yisen123
发布: 2026-03-17
点赞: 0
回复: 0