[问与答] 国产 ai cc 中写 ios app 感觉很绝望啊

一句话看懂：一位开发者在 V2EX 发帖抱怨，在用国产 AI 辅助编写 iOS 应用 UI 时，发现多模态模型（Kimi、Qwen）能力偏弱，而非多模态模型（GLM、DeepSeek）无法直接处理 UI 图像，导致工作流断裂，只能混搭使用。这暴露了当前国产大模型在 UI 开发场景中的实用短板。

事件核心：发生了什么

2025 年 2 月 20 日左右，V2EX 用户 jakeyfly 发帖表达了对国产 AI 辅助 iOS 开发体验的失望。他指出，GLM 和 DeepSeek 等非多模态模型无法直接理解 UI 界面图片，而支持多模态的 Kimi 和 Qwen 在处理 UI 任务时“太拉了”。有回复建议混搭使用——先用 Kimi/Qwen 的多模态能力把需求识别成文字，再交给 GLM/DeepSeek 生成代码，但发帖人认为这种体验“太难过了”。截至目前，该帖子获得 65 次浏览和 2 条回复，涉及模型包括 GLM、DeepSeek、Kimi、Qwen 及 iOS 开发中的 UI 设计环节。

为什么重要

这件事虽然出自个体开发者吐槽，但反映了一个系统性问题：国产大模型在视觉理解与编码生成之间的衔接仍不成熟。UI 开发本质上需要模型具备“看懂截图→理解布局→生成对应代码”的端到端能力，而目前国产多模态模型在 UI 语义理解上表现不佳，非多模态模型又无法以视觉形式交互。这种“眼手分离”的尴尬恰好对标了 GPT-4V + Copilot 等海外方案的多模态编码能力，显示出国产模型在工具链完整度和精细任务适配上的现实差距。对开发者生态而言，这不仅影响生产效率，也可能推高试错成本。

对用户/开发者/创作者的影响

对于直接从事 iOS 或客户端开发的工程师，这意味着目前依赖单一大模型完成 UI→代码转换的体验不可靠，必须手动拆解工作流：先用多模态模型做需求描述（如截图标注、布局描述），再切换到非多模态模型生成 Swift/SwiftUI 代码。这种“拼凑方案”会显著降低开发流畅度，尤其在高频调试 UI 细节时感受更明显。对于 C 端用户来说，影响较小，但间接意味着这类国产 AI 辅助的 App 开发效率暂时无法比肩理想中的“一句话做 App”。创作者或独立开发者如果计划用 AI 加速 App 原型设计，需要对国产模型的能力边界有清醒预期。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Kimi 和 Qwen 等模型是否会在后续版本中专门优化 UI 理解与代码生成的对齐能力，这是直接解决痛点的主要路径。第二，DeepSeek、GLM 等非多模态模型有无计划开放视觉输入接口，从而绕过当前的“分步工作流”。第三，该帖引发的讨论量和后续回帖是否会有更多开发者分享更成熟的工作流方案，例如用截图工具配合 API 组合调用，以降低当前混搭模式的痛苦感。

来源：V2EX (创意工作者社区)

[问与答] 国产 ai cc 中写 ios app 感觉很绝望啊