仓鼠打乒乓球的 SVG

一句话看懂：AI 评测平台 AIBenchy 公布了一项针对“仓鼠打乒乓球 SVG 生成”的模型擂台，119 个模型输出结果中，Gemini 3 Flash Preview 以 0.01 美元和 17.9 秒的速度胜出，而 Claude Opus 4.8 和 GPT-5.5 则展示了不同的成本与时间平衡。这场测试直观揭示了当前主流图像生成模型在 SVG 生成任务上的性能梯度。

事件核心：发生了什么

AIBenchy 发起了一项名为“仓鼠打乒乓球”的 SVG 生成展示任务，统一提示词为“Create a detailed SVG illustration of a hamster playing table tennis”。共有 119 个模型参与了测试，其中 99 个输出被判定为有效。排名显示：Gemini 3 Flash Preview 以 0.01 美元、17.9 秒的极低成本和时间摘得第一；Claude Opus 4.8 排名第 10，成本 0.057 美元、用时 23.1 秒；GPT-5.5 低配版成本 0.068 美元、用时 37 秒；GLM 5 以 0.005 美元、20.7 秒位列第 17，展示了性价比优势。值得注意的是，总测试成本仅为 2.80 美元，总耗时 3 小时 18 分钟。

为什么重要

这是一个 AI 图像生成领域的“跑分”事件，但焦点从传统自然图像转移到了 SVG（可缩放矢量图形）输出。SVG 是网页设计、图标和插画的核心格式，其生成质量直接关系到 AI 能否替代设计师的图形工作。当前排名清晰反映出不同模型在 svg 文本理解、代码结构规范性 和 提示还原度 上的差异。Gemini 3 Flash Preview 的极速表现说明 Google 在轻量级 SVG 生成上优势明显，而一批新模型如 GLM 5 和 Seed-2.0-Lite 正在压低门槛。这也暗示了 低成本、高效率的 SVG 生成 可能很快成为可商用的能力。

对用户/开发者/创作者的影响

对于设计师和前端开发者，这一测试提供了参考：Gemini 3 Flash Preview 适合快速迭代原型，成本极低；Claude Opus 4.8 和 GPT-5.5 可能输出更复杂的 SVG 结构，适合要求精细的场景。对于 API 调用者，应关注各模型的“成本/时间/质量”三角——GLM 5 总体成本低于 0.01 美元，但时间较长。对于创作者，SVG 生成质量的提升意味着 图标、插画、图表生成 将更接近实用级别，未来或可直接用于网页设计和产品 UI。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

首先，AIBenchy 是否有计划开放更多 SVG 基准测试（如“复杂逻辑图生成”）将影响行业对 SVG 模型能力的共识；其次，GLM 5、Seed-2.0-Lite 等低价模型能否保持高有效输出比例，将决定它们是否能成为开发者的首选；最后，GPT-5.5 系列 在 SVG 任务上没有展示明显优势，OpenAI 是否会在后续版本优化 SVG 生成能力值得关注。

来源：Hacker News · 24h最热

仓鼠打乒乓球的 SVG