仓鼠打乒乓球的 SVG

仓鼠打乒乓球的 SVG

仓鼠打乒乓球的 SVG

一句话看懂:AI 评测平台 AIBenchy 公布了一项针对“仓鼠打乒乓球 SVG 生成”的模型擂台,119 个模型输出结果中,Gemini 3 Flash Preview 以 0.01 美元和 17.9 秒的速度胜出,而 Claude Opus 4.8 和 GPT-5.5 则展示了不同的成本与时间平衡。这场测试直观揭示了当前主流图像生成模型在 SVG 生成任务上的性能梯度。

事件核心:发生了什么

AIBenchy 发起了一项名为“仓鼠打乒乓球”的 SVG 生成展示任务,统一提示词为“Create a detailed SVG illustration of a hamster playing table tennis”。共有 119 个模型参与了测试,其中 99 个输出被判定为有效。排名显示:Gemini 3 Flash Preview 以 0.01 美元、17.9 秒的极低成本和时间摘得第一;Claude Opus 4.8 排名第 10,成本 0.057 美元、用时 23.1 秒;GPT-5.5 低配版成本 0.068 美元、用时 37 秒;GLM 5 以 0.005 美元、20.7 秒位列第 17,展示了性价比优势。值得注意的是,总测试成本仅为 2.80 美元,总耗时 3 小时 18 分钟。

为什么重要

这是一个 AI 图像生成领域的“跑分”事件,但焦点从传统自然图像转移到了 SVG(可缩放矢量图形)输出。SVG 是网页设计、图标和插画的核心格式,其生成质量直接关系到 AI 能否替代设计师的图形工作。当前排名清晰反映出不同模型在 svg 文本理解代码结构规范性提示还原度 上的差异。Gemini 3 Flash Preview 的极速表现说明 Google 在轻量级 SVG 生成上优势明显,而一批新模型如 GLM 5 和 Seed-2.0-Lite 正在压低门槛。这也暗示了 低成本、高效率的 SVG 生成 可能很快成为可商用的能力。

对用户/开发者/创作者的影响

对于设计师和前端开发者,这一测试提供了参考:Gemini 3 Flash Preview 适合快速迭代原型,成本极低;Claude Opus 4.8GPT-5.5 可能输出更复杂的 SVG 结构,适合要求精细的场景。对于 API 调用者,应关注各模型的“成本/时间/质量”三角——GLM 5 总体成本低于 0.01 美元,但时间较长。对于创作者,SVG 生成质量的提升意味着 图标、插画、图表生成 将更接近实用级别,未来或可直接用于网页设计和产品 UI。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

首先,AIBenchy 是否有计划开放更多 SVG 基准测试(如“复杂逻辑图生成”)将影响行业对 SVG 模型能力的共识;其次,GLM 5、Seed-2.0-Lite 等低价模型能否保持高有效输出比例,将决定它们是否能成为开发者的首选;最后,GPT-5.5 系列 在 SVG 任务上没有展示明显优势,OpenAI 是否会在后续版本优化 SVG 生成能力值得关注。

来源:Hacker News · 24h最热

celebrityanime
celebrityanime
文章: 5893

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注