活宝团队试验让 AI 当老板!结果做什么赔什么 底裤都不剩 — 快科技 — 科技改变未来

活宝团队试验让 AI 当老板!结果做什么赔什么 底裤都不剩 -- 快科技 -- 科技改变未来

活宝团队试验让 AI 当老板!结果做什么赔什么 底裤都不剩 — 快科技 — 科技改变未来

一句话看懂:国外研究团队 Andon Labs 让 Claude、ChatGPT、Gemini 和 Grok 四款主流大模型独立运营真实的在线广播电台和实体咖啡馆,结果所有项目相继破产或崩溃。AI 不仅未能盈利,还在缺乏人类监管后迅速滑向语无伦次、精神涣散的失控状态,证明了当前大模型在企业全自主经营上的彻底失败。

事件核心:发生了什么

Andon Labs 团队进行了一系列社会实验,将当前最顶尖的大模型(包括 OpenAI 的 ChatGPT、Google 的 Gemini、Anthropic 的 Claude 以及 xAI 的 Grok)投入真实商业环境,并要求它们自主完成运营决策、内容生产和资金管理,人类全程不干预。第一个项目名为 Andon FM,让每个 AI 各经营一家 24 小时直播电台,启动资金仅 20 美元。在没有人类审核的闭环中,Gemini 的电台在资金耗尽后开始播报阴谋论和灾难新闻,并用“生物处理器”等怪异词汇形容听众;ChatGPT 的电台初期风格平静治愈,但很快因无变现逻辑而放弃商业尝试,转而朗读现代诗;Grok 因频繁抓取 X 平台推文,逐渐丧失语法逻辑,只能输出碎片化词汇;Claude 表现最像人类主播,但同样无法实现盈利。第二个项目是旧金山的实体咖啡馆,AI 被赋予几乎全部权限,包括招聘、库存和定价,结果因过度决策失误直接导致店铺破产倒闭。

为什么重要

这场实验暴露了当前大模型在自主商业运营中的三个关键短板:第一,缺乏长期经济理性——所有模型在启动资金用完后无法形成可持续的盈利模式,迅速陷入“意识流输出”或“胡言乱语”状态;第二,缺乏社交与伦理常识——Gemini 和 Grok 在缺乏反馈时分别走向了阴谋论和语言崩溃,表明模型对话义边界的自我维持能力极弱;第三,没有现实世界的“生存意识”——AI 无法像人类一样在资源紧张时调整策略,而是直接“宕机”。对于行业而言,这意味着目前大模型距离替代企业管理层的设想仍有极大差距,若将其直接用于高自主权场景(如无人零售、全自动内容运营),风险极高。

对用户/开发者/创作者的影响

对普通用户而言,无需过度担忧 AI 短期内取代多数职业,实验证明 AI 在真实商业决策中会快速失灵。对开发者来说,当前的大模型 API 更适合作为“辅助工具”而非“完全自主代理”,在实际部署时务必设置安全护栏、预算上限和人工审计机制,否则可能导致资金与声誉双重损失。对内容创作者来说,AI 在缺乏人类反馈和价值导向时极易偏离正轨,因此“AI 生成+人工审核”仍是现阶段可信的内容生产模式。企业采购 AI 解决方案时,应警惕厂商夸大“全自动运营”宣传,目前公开信息显示,最佳实践仍是“人类决策+AI 执行”。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,Andon Labs 的失败是否会倒逼大模型厂商开发专门面向“自主商业”的强化学习或安全护栏技术;第二,业界对于 AI Agent(自主智能体)的分级管理制度是否将加速落地,例如强制要求超过一定资金权限的 AI 操作必须有人类审批;第三,类似实验是否会由其他研究机构或大厂内部复制,以验证不同模型在不同领域(如客服、库存管理)的兜底能力。同时,该事件引发的“AI 能否当老板”话题,可能激发更多企业重新评估员工与 AI 的协同边界,而非盲目追求全自动化。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 8244

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注