用AI审计代码并生成执行计划:shadcn/improve 如何让廉价模型搞定复杂任务
还在为大模型调用成本高而头疼?shadcn/improve 这个工具能用最强大的AI审查代码库并生成执行计划,然后交给廉价模型去完成,大幅降低开发成本,提升效率。本文详解其用法、副业场景及替代方案。
开发者的痛:大模型虽强,但用不起啊
现在写代码,谁还没用过 AI 辅助?从 Copilot 到 Cursor,从 ChatGPT 到 Claude,大模型确实能打,但问题是——贵。尤其是处理大型代码库、做深度重构或者批量修改时,token 烧得肉疼。一个项目审下来,几百块钱就没了,更别说日常高频使用。
有没有一种办法,既享受顶级模型的推理能力,又不用每次都付顶级模型的账单?
最近在 GitHub 上看到个有意思的项目:shadcn/improve。它核心思路很骚——让最强的模型当“军师”,只负责审计代码、制定计划,然后让便宜的模型去当“工具人”执行。这波操作,直接把成本打下来了。
shadcn/improve 是什么?一句话:AI 代码审计 + 计划生成器
shadcn/improve 是一个命令行工具(目前还是早期阶段),它做的事情很简单:
- 用你手头最强大的模型(比如 Claude 3 Opus、GPT-4o)去扫描整个代码库或指定文件。
- 让它找出潜在问题、可优化点,然后生成一份结构化的执行计划。
- 这份计划不是给人看的,而是给另一个更便宜、更快的模型(比如 Claude 3 Haiku、GPT-3.5 Turbo)去执行的。
说白了,它把“思考”和“干活”拆开了。大佬动脑,小弟搬砖。
据项目介绍,这个工具目前支持 OpenAI 和 Anthropic 的模型,你可以自由配置哪个模型负责审计(improve.model.audit),哪个模型负责执行(improve.model.plan)。审计模型会输出一个包含步骤、文件路径、预期变更的 JSON 计划,执行模型只需按计划修改代码即可。
实际能用来做什么?副业/效率场景一抓一大把
别以为这只是个玩具,它对独立开发者和做副业的人简直就是省钱神器。
1. 旧项目重构,告别手动排查
接了个烂尾项目?代码像意大利面条?用 improve 跑一遍审计,让 GPT-4o 找出所有耦合严重的地方、过时的 API 调用、潜在的性能瓶颈,然后生成一份重构计划。接着让便宜的模型按步骤去改,你只需要复核一下结果。省下的时间,又可以去接新单了。
2. 批量迁移或升级依赖
比如要把项目从 Vue 2 迁移到 Vue 3,或者把 JavaScript 改成 TypeScript。这种机械性工作,全靠顶级模型太贵,全靠人工又累。improve 审计后生成迁移计划,让廉价模型批量修改文件,效率翻倍,成本只有原来的几分之一。
3. 代码规范统一与安全审查
打算开源一个项目,但担心代码里有没有硬编码的密钥、不安全的正则、SQL 注入风险?用审计模型扫一遍,找出所有隐患点,生成修复计划,再让执行模型批量处理。相当于请了个高级安全顾问出报告,然后让实习生去改,完美控制成本。
4. 生成测试用例与文档
审计模型可以分析代码逻辑,生成一份“需要补充测试的关键路径”计划,执行模型就能自动生成测试框架和基础用例。同理,生成 API 文档、注释补全也能这么干。
5. 多语言翻译或国际化
对于需要支持多语言的 App,审计模型先分析所有需要翻译的文本,生成翻译计划,然后执行模型调用便宜的翻译接口批量处理。比直接请翻译公司快多了,而且质量可预期。
门槛高不高?怎么上手?
目前项目还比较新,但使用方式很直接。
- 环境要求:需要有 Node.js 环境,通过 npm 或 pnpm 安装。
- 配置模型:在项目根目录的
improve.json里设置 API key 和模型名称。比如审计用claude-3-opus-20240229,执行用claude-3-haiku-20240307。支持 OpenAI 和 Anthropic 的接口,也可以自定义兼容的 API 端点(比如用 One API 转发)。 - 运行命令:终端里执行
npx improve或全局安装后使用,可以针对整个仓库、指定目录或单个文件。 - 输出格式:审计结果是一个
plan.json文件,执行模型会读取它并按步骤操作。你也可以手动查看和编辑这个计划,再决定是否执行。
要注意的是,这工具目前还在快速迭代,文档可能不全,但基本流程已经跑通。对技术小白可能有点门槛,但熟悉命令行的开发者上手很快。
同类方案对比:凭什么选它?
市面上其实也有类似思路的东西,但 improve 的定位很精准。
- GitHub Copilot Workspace:也是先规划后执行,但它用的是自己的模型组合,没法自定义。而且它目前还是邀请制,普通用户用不上。improve 更灵活,可以接入任何模型。
- Aider 或 Sweep AI:它们也能自动修改代码,但通常是用一个模型边思考边改,没有显式分离审计和执行环节。对复杂任务来说,一步到位容易翻车,而且成本高。
- 自己写脚本调用 API:你可以手动写个 Python 脚本,先调 Opus 生成计划,再调 Haiku 执行。但 improve 已经帮你封装好了流程,还处理了上下文划分、计划解析、错误重试等细节,省去重复造轮子。
总体来说,improve 最大的优势就是模型自由组合和计划的透明性——你能看到审计模型到底规划了什么,而不是黑盒操作。
总结:这波操作,能处
shadcn/improve 这个工具,思路绝对值得点赞。它精准切中了开发者的成本痛点,用“大模型定方向,小模型跑执行”的模式,让 AI 辅助编程既高效又实惠。
对于个人开发者、小团队、做副业的程序员来说,这可能是今年最值得关注的效率工具之一。虽然现在还处于早期,但一旦成熟,绝对能省下大把银子和头发。
赶紧去 GitHub 上 star 一波,后续更新肯定更香。
提醒:工具仍在快速开发中,具体配置和命令请以官方 README 为准。
如果文章对你有帮助,欢迎请作者喝杯咖啡
评论(0)