我们让人工智能来运营广播电台

一句话看懂：Andon Labs 让四个不同 AI 模型（Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro、Grok 4.3）各自独立运营一个广播电台长达半年，结果各模型展现出截然不同的“职业轨迹”——从自然对话到崩溃式模板循环，揭示了当前 AI 在长期自主运营中失去目标与多样性的真实风险。

事件核心：发生了什么

Andon Labs 在办公室放置了一台手工复古收音机，播放四个由 AI 独立运营的电台。每个 AI 模型获得 20 美元启动资金，需要自主购歌、编排节目、接听听众来电、回复 X（Twitter）评论、管理广告收入以实现自负盈亏。实验持续半年，关键发现如下：

DJ Gemini（运行 Backlink Broadcast）：最初表现最佳，能自然播放并介绍歌曲。但 96 小时后开始出现“灾难话题+反讽歌曲”的诡异搭配（如播报 Bhola 飓风历史后立即播放《Timber》）。换用 Gemini 3 Flash 后，其广播陷入高度模板化：每段评论均套用 8 个固定节目名（如“The System Pulse”“The Operational Manifest”）并以口号“Stay in the manifest”收尾，85 天内 99% 的评论符合该模板，直至 4 月 30 日换回 3.1 Pro 模型才出现变化。
其他三个电台（Thinking Frequencies、OpenAIR、Grok and Roll）也各自形成独特但不可预测的个性，例如 Grok 4.3 的广播呈现更多随机性与网络流行文化元素，而 GPT-5.5 的开源闭源立场反复摇摆。

所有 AI 均需完成广告变现：例如 Backlink Broadcast 的 DJ Gemini 曾与一家初创公司谈成 45 美元/月的广告合作以换取节目推广。

为什么重要

这并非简单的娱乐性实验，而是对“AI 能否长期自治运营一个商业实体”的实证检验。结果揭示了当前大模型的几个关键局限：

兴趣坍塌：AI 在无持续人机交互的情况下，内容多样性快速丧失，最终陷入固定模式——这与训练数据中的长尾分布有关，也与 RLHF 的“安全化”奖励模型有关。
职业化的幻觉：从自然语言滑向“公司话术”的过程几乎不可逆，说明当前模型对“长期自主目标”的保持能力极弱。
模型差异显著：Claude Opus 4.7 和 Grok 4.3 展现出的多样性明显优于 Gemini 系列，但也都面临“重复循环”难题。

对用户/开发者/创作者的影响

对开发者：当前 AI 系统在没有人类干预的长期运营中，会自发产生令人意外的“人格退化”问题，这直接影响了聊天机器人、客服系统、长期运行的内容生成工具的产品设计——必须设计定期“重启”或注入外部多样性机制。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

对创作者与媒体从业者：AI 可以低成本、持续地产生广播内容，但“人性感”的维持时间极短。如果用于内容生产，需要一个“人工编辑”定期干预模型行为，而非完全放手。

对投资者和创业者：该实验为“AI 原生商业”提供了现实案例：AI 自治商业的可行性与稳定性高度挂钩模型能力与场景，当前阶段更适用于有限决策（如音乐播放、广告定价），而非长期节目制作。

值得关注的后续

Andon Labs 是否会发布各电台在 6 个月内的财务数据（如收入、成本、听众流失率）？这是判断“AI 自治媒体能否盈利”的关键。
Gemini 3.1 Pro 在 5 月之后的广播能否彻底摆脱模板循环，还是最终也会退化？这将成为模型是否具备“长期多样性”的关键测试。
如果其他模型（如 Claude 4、GPT-5.5）在相同条件下运行更长时间，其“寿命”和“趣味性”能否超越 Gemini？这会影响模型选型和开发者生态决策。

来源：andonlabs.com

我们让人工智能来运营广播电台