DeepSeek陈德里开发自动研究Skill,写一篇论文人类只动脑2小时

DeepSeek陈德里开发自动研究Skill,写一篇论文人类只动脑2小时

DeepSeek陈德里开发自动研究Skill,写一篇论文人类只动脑2小时

一句话看懂:DeepSeek研究员陈德里用自研的自动研究技能“DeliAutoResearch”,结合DeepSeek-V4-Pro模型,6天写完一篇研究综述论文,个人实际投入不足2小时。这篇论文不仅展示了AI如何快速完成科研写作,还首次系统性地提出了AI研究智能体的自主度分级体系(L1-L5),为混乱的智能体领域提供了分类框架。

事件核心:发生了什么

2026年5月27日,DeepSeek研究员陈德里在个人博客公布了一篇研究综述论文的生成过程。论文主题是关于自动研究智能体的L1-L5自主度分类体系,分析了四种架构模式、17个主流系统,并提出了六大开放问题。整篇论文共迭代6次,总耗时6天,涉及约108轮Agent调用,消耗64.8万token,生成了2234行LaTeX代码、103个已验证参考文献、7个图表和4个表格。陈德里表示,自己的碳基大脑(人脑)实际处理时间不到2小时,其余99%的工作由Agent完成。论文中,他提出了一个类比自动驾驶SAE级别的智能体自主度分类:L1(自动补全)、L2(任务执行)、L3(多步骤执行)、L4(受限领域全自主执行)、L5(完全自定研究议程)。目前行业前沿初步达到L4,L5仍是未实现的理想状态,核心瓶颈在于持续知识积累、可靠自我评估和架构规模化。

为什么重要

这篇论文的生成过程本身,就是AI工具从“研究辅助”向“自主研究”转变的实证。过去需要至少一个月的科研综述工作,现在被压缩到6天,且人类只需动脑2小时。这种行为的变化,正在实质性改变计算机科学领域的论文产出效率——陈德里指出,Code Agent已经导致该领域论文数量疯狂膨胀。更重要的是,论文提出的L1-L5自主度分类体系,首次为混乱的AI智能体领域提供了统一的评估框架。这种分类有助于开发者和研究者快速判断现有工具的成熟度,也明确了下一阶段(向L5迈进)的关键技术瓶颈:不是模型能力,而是持续知识积累和可靠自我评估。这一框架的发布,可能影响未来AI研究工具的评估标准、投资方向和技术路线选择。

对用户/开发者/创作者的影响

对AI开发者而言,L1-L5分类体系提供了一个清晰的标尺,可用于评估现有智能体框架(如AutoGen、MetaGPT、Claude Code、Devin等)的自主度水平,指导工具选型和技术演进。对科研创作者来说,DeliAutoResearch的实践表明,当前AI已能在人类极低干预下完成研究综述的撰写、引证、制图等全流程工作——这对期刊审稿、学术抄袭检测、以及研究者个人时间分配模式带来挑战。对普通用户或内容创作者,这意味着AI工具正从“帮你写句子”升级到“帮你完成一整项研究任务”,未来的内容创作门槛将进一步降低,但鉴别原创性与学术诚信问题的难度也在上升。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,DeliAutoResearch是否会开源或产品化。目前该技能仅在陈德里个人博客中使用,如果DeepSeek将其集成到API或交互界面中,将直接影响开发者生态。第二,L1-L5分类体系能否成为行业标准。这篇论文的提出方(DeepSeek)并非OpenAI或Google,但其框架结构清晰,仍需观察头部公司是否跟进或提出竞争性标准。第三,学术期刊与会议如何应对AI全自动论文。目前尚无统一的接受或拒绝规则,这篇论文的发表路径(个人博客而非正式会议)本身就是一种态度的试探——未来可能需要专门的“AI协同论文”披露规范。

来源:量子位 · 每日最新

celebrityanime
celebrityanime
文章: 3961

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注