[程序员] 和 Claude Code 死磕 3B token 的家庭记账 APP，聊聊 vibe coding 和 spec coding 在长项目上到底差在哪

一句话看懂：一名独立开发者用 Claude Code (Opus 4.8) 开发家庭财务 APP“家庭账房”，在消耗约 3B token、迭代 8 个版本后，发现纯粹依赖“vibe coding”（对话式编程）会导致逻辑随会话蒸发、同一 bug 重复出现，最终通过自建三层 spec 体系（文档、记忆、脚本）才稳住了长达半年的项目。这不是一篇评测，而是一份关于 AI 辅助长项目开发的方法论实录。

事件核心：发生了什么

V2EX 用户 LuoDi-Nate 分享了自己用 Claude Code 开发自托管家庭记账 APP “家庭账房”的完整经历。该项目后端为 Spring Boot 3 + Thymeleaf + HTMX + Chart.js，不开前端构建，支持 Docker 或 systemd 部署，数据完全自托管。目前源码已开源（Apache 2.0），并提供 Beta 演示站。

最关键的发现并非技术实现，而是开发模式对比：vibe coding（即用自然语言描述、AI 自动生成代码的模式）在写单个功能时效率极高，但在需要改几十上百次、时间跨度半年的长线上项目中，会暴露出致命缺陷——模型无跨会话记忆，之前共同确认的业务逻辑（例如“汇率切换时比值指标必须不变”）在下个会话会被当作冗余代码“清理”掉，同一 bug 在 v0.2 / v0.5 / v0.8 反复出现。

开发者被迫总结出一套 “spec coding” 流程：任何功能改动必须先写 PRD（产品需求文档），再搭静态 HTML 原型审交互，再写 tech-design（技术设计），最后才改代码。此流程的核心是三层约束：文档（PRD/设计文档）、记忆（Claude Code 项目级长期记忆，约 30 多条规则如“禁止大模型做四则运算”）、skill（将危险流程如发版固化为带人工硬闸的脚本）。

为什么重要

这个案例的价值在于提供了 AI 辅助编程在真实、长期、有复杂业务逻辑项目中的一手反馈。当前行业热炒“vibe coding”时，大量注意力集中在“几句话生成一个 demo”的炫技层面，但缺少对长周期、多版本迭代下“AI 协作债务”的量化分析。该项目实测表明：AI 在跨会话上下文消解、业务规则一致性保持、以及危险操作（如触碰生产数据、打 tag 发版）的自动化管控方面，仍存在结构性短板。

它间接验证了一个被低估的工程事实：AI 编程的瓶颈不再是模型生成能力，而是知识的持久化与复用机制。Claude Code 的记忆层可存储几十条规则，但开发者仍需手动将每次踩坑抽象为断言或记忆条目，这条“从坑到规”的转化链目前尚无自动化方案。对于团队协作或复杂业务系统而言，这意味着 AI 辅助编程的门槛从“写代码”前移到了“写规范”上。

对用户/开发者/创作者的影响

对独立开发者和技术创作者：该项目开源代码（GitHub）和 Beta 演示站可供直接体验。但更重要的是其方法论可迁移：如果你正在用 AI 辅助开发超过数周周期的项目，建议建立类似的三层规范——将每次业务决策写成 AI 每次会话自动加载的长期记忆，将危险流程（如操作生产环境）固化为手动确认的脚本，并坚决维护文档与代码的同步生命周期。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

对普通用户：如果你是家庭财务管理的重度用户，“家庭账房”提供了一条替代购买商业应用数据被集中存储的路径——数据只在自己的服务器上，每月花十分钟拍张快照即可查看分散在银行、支付宝、券商、房贷处的资产全局图，并计算真实年化收益率（XIRR / TWR），AI 仅做解读不荐产品。不过项目目前仍需一定技术配置能力。

对 AI 工具平台：“vibe coding vs. spec coding”的对比，实际上是对大模型产品设计者提出的需求——是否应该在 AI 编程工具中内置长期记忆的版本管理？是否允许用户导出、导入、版本回溯记忆规则？这可能是下一阶段差异化竞争的关键功能。

值得关注的后续

1. 记忆层标准化能否落地。 Claude Code 目前已支持项目级长期记忆，但如何确保记忆条目不冲突、不遗漏、不随模型更新失效，仍缺乏社区共识。如果 OpenAI 的 Codex 或 Cursor 等竞品跟进“记忆即代码”的产品设计，可能会催生一种新的 AI 编程元语言。

2. 开源生态的衍生。 “家庭账房”已被作者应用于实际家庭财务管理。如果能吸引其他开发者基于 spec coding 流程贡献功能，并积累出一套面向个人财务管理的“AI 辅助开发最佳实践”，对自托管财务工具圈可能产生示范效应。

3. AI 辅助编程的认知校准。 当前市场对 AI 编程的期望普遍夸大到“取代程序员”层面，该案例通过一个长达半年的真实项目，提供了冷静的依据：AI 擅长单点执行，但业务的规则一致性、上下文追踪、工程纪律仍然需要人的顶层设计。后续其他开发者类似的长周期实验反馈，可能进一步调整行业对 AI 编程能力的预期管理。

来源：V2EX (创意工作者社区)

[程序员] 和 Claude Code 死磕 3B token 的家庭记账 APP，聊聊 vibe coding 和 spec coding 在长项目上到底差在哪

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

由人工智能驱动的电子邮件正在影响敏感议题上的政治走向

[推广] 来领免费 3 天的 GPT5.4 和 sonnet 4.6

点击这里进入

发表回复取消回复