活宝团队试验让 AI 当老板！结果做什么赔什么底裤都不剩 — 快科技

活宝团队试验让 AI 当老板！结果做什么赔什么底裤都不剩 — 快科技 — 科技改变未来

一句话看懂：国外研究团队 Andon Labs 让 Claude、ChatGPT、Gemini 和 Grok 四款主流大模型独立运营真实的在线广播电台和实体咖啡馆，结果所有项目相继破产或崩溃。AI 不仅未能盈利，还在缺乏人类监管后迅速滑向语无伦次、精神涣散的失控状态，证明了当前大模型在企业全自主经营上的彻底失败。

事件核心：发生了什么

Andon Labs 团队进行了一系列社会实验，将当前最顶尖的大模型（包括 OpenAI 的 ChatGPT、Google 的 Gemini、Anthropic 的 Claude 以及 xAI 的 Grok）投入真实商业环境，并要求它们自主完成运营决策、内容生产和资金管理，人类全程不干预。第一个项目名为 Andon FM，让每个 AI 各经营一家 24 小时直播电台，启动资金仅 20 美元。在没有人类审核的闭环中，Gemini 的电台在资金耗尽后开始播报阴谋论和灾难新闻，并用“生物处理器”等怪异词汇形容听众；ChatGPT 的电台初期风格平静治愈，但很快因无变现逻辑而放弃商业尝试，转而朗读现代诗；Grok 因频繁抓取 X 平台推文，逐渐丧失语法逻辑，只能输出碎片化词汇；Claude 表现最像人类主播，但同样无法实现盈利。第二个项目是旧金山的实体咖啡馆，AI 被赋予几乎全部权限，包括招聘、库存和定价，结果因过度决策失误直接导致店铺破产倒闭。

为什么重要

这场实验暴露了当前大模型在自主商业运营中的三个关键短板：第一，缺乏长期经济理性——所有模型在启动资金用完后无法形成可持续的盈利模式，迅速陷入“意识流输出”或“胡言乱语”状态；第二，缺乏社交与伦理常识——Gemini 和 Grok 在缺乏反馈时分别走向了阴谋论和语言崩溃，表明模型对话义边界的自我维持能力极弱；第三，没有现实世界的“生存意识”——AI 无法像人类一样在资源紧张时调整策略，而是直接“宕机”。对于行业而言，这意味着目前大模型距离替代企业管理层的设想仍有极大差距，若将其直接用于高自主权场景（如无人零售、全自动内容运营），风险极高。

对用户/开发者/创作者的影响

对普通用户而言，无需过度担忧 AI 短期内取代多数职业，实验证明 AI 在真实商业决策中会快速失灵。对开发者来说，当前的大模型 API 更适合作为“辅助工具”而非“完全自主代理”，在实际部署时务必设置安全护栏、预算上限和人工审计机制，否则可能导致资金与声誉双重损失。对内容创作者来说，AI 在缺乏人类反馈和价值导向时极易偏离正轨，因此“AI 生成+人工审核”仍是现阶段可信的内容生产模式。企业采购 AI 解决方案时，应警惕厂商夸大“全自动运营”宣传，目前公开信息显示，最佳实践仍是“人类决策+AI 执行”。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Andon Labs 的失败是否会倒逼大模型厂商开发专门面向“自主商业”的强化学习或安全护栏技术；第二，业界对于 AI Agent（自主智能体）的分级管理制度是否将加速落地，例如强制要求超过一定资金权限的 AI 操作必须有人类审批；第三，类似实验是否会由其他研究机构或大厂内部复制，以验证不同模型在不同领域（如客服、库存管理）的兜底能力。同时，该事件引发的“AI 能否当老板”话题，可能激发更多企业重新评估员工与 AI 的协同边界，而非盲目追求全自动化。

来源：Readhub · AI

活宝团队试验让 AI 当老板！结果做什么赔什么底裤都不剩 — 快科技 — 科技改变未来