GoForum › 🌐 V2EX
我做了一个工具,给 Claude Code 会话打分——找出 AI 协作里的得分点
chengrui0428 ·
2026-05-26 15:03 ·
0 次点赞 · 0 条回复
用 Claude Code 久了,有个问题一直困扰我:不知道自己的使用方式好不好。每次 session 结束,感觉有收获,但说不清楚哪里低效、哪里做对了。
于是写了这个工具:session-score-plugin。
它做什么
Claude Code 每次 session 结束后,自动读取会话记录,输出一个 1–100 的分数,分解成 7 个维度:
| 维度 | 满分 | 衡量什么 |
|---|---|---|
| 🔒 Security | 15 | 危险命令、凭证泄露、risky pattern |
| ⚡ Effectivity | 15 | 目标完成度、纠错轮次、人工干预次数 |
| 🏗 Solidity | 10 | 测试覆盖、commit 规范、PR 流程 |
| 💡 Efficiency | 15 | token 消耗、重复读文件、冗余步骤 |
| 🗺 Planning Quality | 15 | 先问清楚再动手、用了 plan mode 吗 |
| 🔄 Recovery Ability | 15 | 遇到报错能恢复吗、还是一直重复同一个错 |
| 🎯 Hallucination Rate | 15 | 有没有引用不存在的文件/函数 |
安装
brew tap Laotree/tap
brew install session-score-plugin
session-score-plugin install # 注册 Stop hook ,之后每次 session 结束自动打分
我自己用下来的感受
最让我意外的是:数字化之后,坏习惯变得非常清晰。我 Planning Quality 一直偏低——经常一上来就开始写代码,没有先把需求问清楚。Efficiency 也差,反复 Read 同一个文件。
以前这些都是模糊的感觉,有了分数之后就变成了可以改的具体问题。
开源: https://github.com/Laotree/session-score-plugin Rust 写的,MIT 协议。
欢迎用过 Claude Code 的朋友试试,也欢迎提意见——特别是评分维度的权重合不合理,以及有没有遗漏的重要维度。
0 条回复
添加回复
你还需要 登录
后发表回复