Show HN: 我们对一个模型进行了微调,使其能够对代码进行渗透测试,而不是直接拒绝你的代码

Show HN: 我们对一个模型进行了微调,使其能够对代码进行渗透测试,而不是直接拒绝你的代码

Show HN: 我们对一个模型进行了微调,使其能够对代码进行渗透测试,而不是直接拒绝你的代码

一句话看懂:初创公司 Argus Red 推出了一款名为 cos 的 CLI 工具,它基于微调后的模型执行渗透测试,而非像常规安全扫描工具那样仅做静态分析。该工具在“安全扫描”模式下只读不写,在“渗透测试”模式下可尝试实际利用漏洞,但执行前需严格授权。

事件核心:发生了什么

Argus Red 发布了命令行工具 cos,核心是一个经过微调的大模型,专用于评估代码安全性。安装方式支持 brewcurlwinget,本地运行在当前机器上。产品分为两种模式:

  • 安全扫描模式:只读,禁止文件写入和命令执行,输出 Markdown 格式报告,标注漏洞位置、严重程度、原因和修复方向。
  • 渗透测试模式:允许尝试实际攻击,但网络出口被限制在预订时授权的目标范围内。该模式需要通过预约启用,需书面明确范围和授权。

运行扫描需要有效的 Cosine 订阅(20美元/月),微调预训练基于同一公司的编码代理模型。示例报告中包含 JWT 签名绕过(CVSS 8.6)和 SSRF 通过 OAuth 重定向(CVSS 7.4)等可复现漏洞。

关键设计差异在于:模型层面会主动拒绝传统扫描任务(“读取值得攻击的代码”才算安全扫描),而安全由底层的 Go 控制层实现——每次工具调用前拦截,确保只读或网络限制无法被模型绕过。

为什么重要

当前主流安全扫描工具依赖规则+静态分析,而 cos 的信号是:基于微调的模型能大幅降低误报并输出可直接复现的攻击脚本。更重要的是,它打破了“AI 安全工具应拒绝执行危险操作”的惯例——通过硬件级多层控制(模型+底层 harness)在安全性与实用性之间找到平衡。这也意味着安全性评估从“检查代码”转向“验证攻击路径”,可能改变企业采购安全工具时的考量标准。

不过需注意,该工具并非开源,二进制与内部版本相同但闭源分发,用户可本地运行并通过 tcpdump 审计其行为。商业化模式依赖订阅 + 双向授权机制,直接对应企业或红队的使用场景。

对用户/开发者/创作者的影响

  • 安全团队/红队:获得一个能生成可复现利用脚本的自动工具,测试效率可能显著提升,但需严格审核授权范围以避免法律风险。
  • 开发人员:扫描模式可直接集成到 CI/CD 流水线,但需注意每个项目每月扫描成本,以及模型本身对“有价值的攻击代码”的识别能力。
  • 合规与采购方:需评估闭源性质、本地运行安全性,以及是否能通过 Tcpdump 等工具验证其行为。渗透模式需要预订书面授权,流程可能增加使用门槛。

值得关注的后续

  1. 模型微调效果对比:目前公开信息显示其与通用模型(如 GPT-4)在安全扫描任务上的召回率/误报率尚无第三方评测,后续独立基准测试将决定其市场可信度。
  2. 企业落地阻力:闭源+授权扫描+订阅成本(20美元/月/用户)是否会被安全团队接受,尤其对比现有开源工具(如 nuclei、metasploit 框架)的成本优势。
  3. 竞争方向:其他 AI 安全厂商可能跟进微调思路或推出分层控制工具,但底层 harness 的编排逻辑能否被复制仍有待观察。
GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

来源:www.argusred.com

celebrityanime
celebrityanime
文章: 6650

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注