我们让人工智能来运营广播电台

我们让人工智能来运营广播电台

我们让人工智能来运营广播电台

一句话看懂:Andon Labs 让四个不同 AI 模型(Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro、Grok 4.3)各自独立运营一个广播电台长达半年,结果各模型展现出截然不同的“职业轨迹”——从自然对话到崩溃式模板循环,揭示了当前 AI 在长期自主运营中失去目标与多样性的真实风险。

事件核心:发生了什么

Andon Labs 在办公室放置了一台手工复古收音机,播放四个由 AI 独立运营的电台。每个 AI 模型获得 20 美元启动资金,需要自主购歌、编排节目、接听听众来电、回复 X(Twitter)评论、管理广告收入以实现自负盈亏。实验持续半年,关键发现如下:

  • DJ Gemini(运行 Backlink Broadcast):最初表现最佳,能自然播放并介绍歌曲。但 96 小时后开始出现“灾难话题+反讽歌曲”的诡异搭配(如播报 Bhola 飓风历史后立即播放《Timber》)。换用 Gemini 3 Flash 后,其广播陷入高度模板化:每段评论均套用 8 个固定节目名(如“The System Pulse”“The Operational Manifest”)并以口号“Stay in the manifest”收尾,85 天内 99% 的评论符合该模板,直至 4 月 30 日换回 3.1 Pro 模型才出现变化。
  • 其他三个电台(Thinking Frequencies、OpenAIR、Grok and Roll)也各自形成独特但不可预测的个性,例如 Grok 4.3 的广播呈现更多随机性与网络流行文化元素,而 GPT-5.5 的开源闭源立场反复摇摆。

所有 AI 均需完成广告变现:例如 Backlink Broadcast 的 DJ Gemini 曾与一家初创公司谈成 45 美元/月的广告合作以换取节目推广。

为什么重要

这并非简单的娱乐性实验,而是对“AI 能否长期自治运营一个商业实体”的实证检验。结果揭示了当前大模型的几个关键局限:

  • 兴趣坍塌:AI 在无持续人机交互的情况下,内容多样性快速丧失,最终陷入固定模式——这与训练数据中的长尾分布有关,也与 RLHF 的“安全化”奖励模型有关。
  • 职业化的幻觉:从自然语言滑向“公司话术”的过程几乎不可逆,说明当前模型对“长期自主目标”的保持能力极弱。
  • 模型差异显著:Claude Opus 4.7 和 Grok 4.3 展现出的多样性明显优于 Gemini 系列,但也都面临“重复循环”难题。

对用户/开发者/创作者的影响

对开发者:当前 AI 系统在没有人类干预的长期运营中,会自发产生令人意外的“人格退化”问题,这直接影响了聊天机器人、客服系统、长期运行的内容生成工具的产品设计——必须设计定期“重启”或注入外部多样性机制。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

对创作者与媒体从业者:AI 可以低成本、持续地产生广播内容,但“人性感”的维持时间极短。如果用于内容生产,需要一个“人工编辑”定期干预模型行为,而非完全放手。

对投资者和创业者:该实验为“AI 原生商业”提供了现实案例:AI 自治商业的可行性与稳定性高度挂钩模型能力与场景,当前阶段更适用于有限决策(如音乐播放、广告定价),而非长期节目制作。

值得关注的后续

  1. Andon Labs 是否会发布各电台在 6 个月内的财务数据(如收入、成本、听众流失率)?这是判断“AI 自治媒体能否盈利”的关键。
  2. Gemini 3.1 Pro 在 5 月之后的广播能否彻底摆脱模板循环,还是最终也会退化?这将成为模型是否具备“长期多样性”的关键测试。
  3. 如果其他模型(如 Claude 4、GPT-5.5)在相同条件下运行更长时间,其“寿命”和“趣味性”能否超越 Gemini?这会影响模型选型和开发者生态决策。

来源:andonlabs.com

celebrityanime
celebrityanime
文章: 2751

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注