![[程序员] 和 Claude Code 死磕 3B token 的家庭记账 APP,聊聊 vibe coding 和 spec coding 在长项目上到底差在哪](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_4-893.jpg)
一句话看懂:一名独立开发者用 Claude Code (Opus 4.8) 开发家庭财务 APP“家庭账房”,在消耗约 3B token、迭代 8 个版本后,发现纯粹依赖“vibe coding”(对话式编程)会导致逻辑随会话蒸发、同一 bug 重复出现,最终通过自建三层 spec 体系(文档、记忆、脚本)才稳住了长达半年的项目。这不是一篇评测,而是一份关于 AI 辅助长项目开发的方法论实录。
事件核心:发生了什么
V2EX 用户 LuoDi-Nate 分享了自己用 Claude Code 开发自托管家庭记账 APP “家庭账房”的完整经历。该项目后端为 Spring Boot 3 + Thymeleaf + HTMX + Chart.js,不开前端构建,支持 Docker 或 systemd 部署,数据完全自托管。目前源码已开源(Apache 2.0),并提供 Beta 演示站。
最关键的发现并非技术实现,而是开发模式对比:vibe coding(即用自然语言描述、AI 自动生成代码的模式)在写单个功能时效率极高,但在需要改几十上百次、时间跨度半年的长线上项目中,会暴露出致命缺陷——模型无跨会话记忆,之前共同确认的业务逻辑(例如“汇率切换时比值指标必须不变”)在下个会话会被当作冗余代码“清理”掉,同一 bug 在 v0.2 / v0.5 / v0.8 反复出现。
开发者被迫总结出一套 “spec coding” 流程:任何功能改动必须先写 PRD(产品需求文档),再搭静态 HTML 原型审交互,再写 tech-design(技术设计),最后才改代码。此流程的核心是三层约束:文档(PRD/设计文档)、记忆(Claude Code 项目级长期记忆,约 30 多条规则如“禁止大模型做四则运算”)、skill(将危险流程如发版固化为带人工硬闸的脚本)。
为什么重要
这个案例的价值在于提供了 AI 辅助编程在真实、长期、有复杂业务逻辑项目中的一手反馈。当前行业热炒“vibe coding”时,大量注意力集中在“几句话生成一个 demo”的炫技层面,但缺少对长周期、多版本迭代下“AI 协作债务”的量化分析。该项目实测表明:AI 在跨会话上下文消解、业务规则一致性保持、以及危险操作(如触碰生产数据、打 tag 发版)的自动化管控方面,仍存在结构性短板。
它间接验证了一个被低估的工程事实:AI 编程的瓶颈不再是模型生成能力,而是知识的持久化与复用机制。Claude Code 的记忆层可存储几十条规则,但开发者仍需手动将每次踩坑抽象为断言或记忆条目,这条“从坑到规”的转化链目前尚无自动化方案。对于团队协作或复杂业务系统而言,这意味着 AI 辅助编程的门槛从“写代码”前移到了“写规范”上。
对用户/开发者/创作者的影响
对独立开发者和技术创作者:该项目开源代码(GitHub)和 Beta 演示站可供直接体验。但更重要的是其方法论可迁移:如果你正在用 AI 辅助开发超过数周周期的项目,建议建立类似的三层规范——将每次业务决策写成 AI 每次会话自动加载的长期记忆,将危险流程(如操作生产环境)固化为手动确认的脚本,并坚决维护文档与代码的同步生命周期。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
对普通用户:如果你是家庭财务管理的重度用户,“家庭账房”提供了一条替代购买商业应用数据被集中存储的路径——数据只在自己的服务器上,每月花十分钟拍张快照即可查看分散在银行、支付宝、券商、房贷处的资产全局图,并计算真实年化收益率(XIRR / TWR),AI 仅做解读不荐产品。不过项目目前仍需一定技术配置能力。
对 AI 工具平台:“vibe coding vs. spec coding”的对比,实际上是对大模型产品设计者提出的需求——是否应该在 AI 编程工具中内置长期记忆的版本管理?是否允许用户导出、导入、版本回溯记忆规则?这可能是下一阶段差异化竞争的关键功能。
值得关注的后续
1. 记忆层标准化能否落地。 Claude Code 目前已支持项目级长期记忆,但如何确保记忆条目不冲突、不遗漏、不随模型更新失效,仍缺乏社区共识。如果 OpenAI 的 Codex 或 Cursor 等竞品跟进“记忆即代码”的产品设计,可能会催生一种新的 AI 编程元语言。
2. 开源生态的衍生。 “家庭账房”已被作者应用于实际家庭财务管理。如果能吸引其他开发者基于 spec coding 流程贡献功能,并积累出一套面向个人财务管理的“AI 辅助开发最佳实践”,对自托管财务工具圈可能产生示范效应。
3. AI 辅助编程的认知校准。 当前市场对 AI 编程的期望普遍夸大到“取代程序员”层面,该案例通过一个长达半年的真实项目,提供了冷静的依据:AI 擅长单点执行,但业务的规则一致性、上下文追踪、工程纪律仍然需要人的顶层设计。后续其他开发者类似的长周期实验反馈,可能进一步调整行业对 AI 编程能力的预期管理。

![[推广] 来领免费 3 天的 GPT5.4 和 sonnet 4.6](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_4-897-768x403.jpg)
