Show HN: 我们对一个模型进行了微调，使其能够对代码进行渗透测试，而不是直接拒绝你的代码

一句话看懂：初创公司 Argus Red 推出了一款名为 cos 的 CLI 工具，它基于微调后的模型执行渗透测试，而非像常规安全扫描工具那样仅做静态分析。该工具在“安全扫描”模式下只读不写，在“渗透测试”模式下可尝试实际利用漏洞，但执行前需严格授权。

事件核心：发生了什么

Argus Red 发布了命令行工具 cos，核心是一个经过微调的大模型，专用于评估代码安全性。安装方式支持 brew、curl 或 winget，本地运行在当前机器上。产品分为两种模式：

安全扫描模式：只读，禁止文件写入和命令执行，输出 Markdown 格式报告，标注漏洞位置、严重程度、原因和修复方向。
渗透测试模式：允许尝试实际攻击，但网络出口被限制在预订时授权的目标范围内。该模式需要通过预约启用，需书面明确范围和授权。

运行扫描需要有效的 Cosine 订阅（20美元/月），微调预训练基于同一公司的编码代理模型。示例报告中包含 JWT 签名绕过（CVSS 8.6）和 SSRF 通过 OAuth 重定向（CVSS 7.4）等可复现漏洞。

关键设计差异在于：模型层面会主动拒绝传统扫描任务（“读取值得攻击的代码”才算安全扫描），而安全由底层的 Go 控制层实现——每次工具调用前拦截，确保只读或网络限制无法被模型绕过。

为什么重要

当前主流安全扫描工具依赖规则+静态分析，而 cos 的信号是：基于微调的模型能大幅降低误报并输出可直接复现的攻击脚本。更重要的是，它打破了“AI 安全工具应拒绝执行危险操作”的惯例——通过硬件级多层控制（模型+底层 harness）在安全性与实用性之间找到平衡。这也意味着安全性评估从“检查代码”转向“验证攻击路径”，可能改变企业采购安全工具时的考量标准。

不过需注意，该工具并非开源，二进制与内部版本相同但闭源分发，用户可本地运行并通过 tcpdump 审计其行为。商业化模式依赖订阅 + 双向授权机制，直接对应企业或红队的使用场景。

对用户/开发者/创作者的影响

安全团队/红队：获得一个能生成可复现利用脚本的自动工具，测试效率可能显著提升，但需严格审核授权范围以避免法律风险。
开发人员：扫描模式可直接集成到 CI/CD 流水线，但需注意每个项目每月扫描成本，以及模型本身对“有价值的攻击代码”的识别能力。
合规与采购方：需评估闭源性质、本地运行安全性，以及是否能通过 Tcpdump 等工具验证其行为。渗透模式需要预订书面授权，流程可能增加使用门槛。

值得关注的后续

模型微调效果对比：目前公开信息显示其与通用模型（如 GPT-4）在安全扫描任务上的召回率/误报率尚无第三方评测，后续独立基准测试将决定其市场可信度。
企业落地阻力：闭源+授权扫描+订阅成本（20美元/月/用户）是否会被安全团队接受，尤其对比现有开源工具（如 nuclei、metasploit 框架）的成本优势。
竞争方向：其他 AI 安全厂商可能跟进微调思路或推出分层控制工具，但底层 harness 的编排逻辑能否被复制仍有待观察。