DeepSeek陈德里开发自动研究Skill，写一篇论文人类只动脑2小时

一句话看懂：DeepSeek研究员陈德里用自研的自动研究技能“DeliAutoResearch”，结合DeepSeek-V4-Pro模型，6天写完一篇研究综述论文，个人实际投入不足2小时。这篇论文不仅展示了AI如何快速完成科研写作，还首次系统性地提出了AI研究智能体的自主度分级体系（L1-L5），为混乱的智能体领域提供了分类框架。

事件核心：发生了什么

2026年5月27日，DeepSeek研究员陈德里在个人博客公布了一篇研究综述论文的生成过程。论文主题是关于自动研究智能体的L1-L5自主度分类体系，分析了四种架构模式、17个主流系统，并提出了六大开放问题。整篇论文共迭代6次，总耗时6天，涉及约108轮Agent调用，消耗64.8万token，生成了2234行LaTeX代码、103个已验证参考文献、7个图表和4个表格。陈德里表示，自己的碳基大脑（人脑）实际处理时间不到2小时，其余99%的工作由Agent完成。论文中，他提出了一个类比自动驾驶SAE级别的智能体自主度分类：L1（自动补全）、L2（任务执行）、L3（多步骤执行）、L4（受限领域全自主执行）、L5（完全自定研究议程）。目前行业前沿初步达到L4，L5仍是未实现的理想状态，核心瓶颈在于持续知识积累、可靠自我评估和架构规模化。

为什么重要

这篇论文的生成过程本身，就是AI工具从“研究辅助”向“自主研究”转变的实证。过去需要至少一个月的科研综述工作，现在被压缩到6天，且人类只需动脑2小时。这种行为的变化，正在实质性改变计算机科学领域的论文产出效率——陈德里指出，Code Agent已经导致该领域论文数量疯狂膨胀。更重要的是，论文提出的L1-L5自主度分类体系，首次为混乱的AI智能体领域提供了统一的评估框架。这种分类有助于开发者和研究者快速判断现有工具的成熟度，也明确了下一阶段（向L5迈进）的关键技术瓶颈：不是模型能力，而是持续知识积累和可靠自我评估。这一框架的发布，可能影响未来AI研究工具的评估标准、投资方向和技术路线选择。

对用户/开发者/创作者的影响

对AI开发者而言，L1-L5分类体系提供了一个清晰的标尺，可用于评估现有智能体框架（如AutoGen、MetaGPT、Claude Code、Devin等）的自主度水平，指导工具选型和技术演进。对科研创作者来说，DeliAutoResearch的实践表明，当前AI已能在人类极低干预下完成研究综述的撰写、引证、制图等全流程工作——这对期刊审稿、学术抄袭检测、以及研究者个人时间分配模式带来挑战。对普通用户或内容创作者，这意味着AI工具正从“帮你写句子”升级到“帮你完成一整项研究任务”，未来的内容创作门槛将进一步降低，但鉴别原创性与学术诚信问题的难度也在上升。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，DeliAutoResearch是否会开源或产品化。目前该技能仅在陈德里个人博客中使用，如果DeepSeek将其集成到API或交互界面中，将直接影响开发者生态。第二，L1-L5分类体系能否成为行业标准。这篇论文的提出方（DeepSeek）并非OpenAI或Google，但其框架结构清晰，仍需观察头部公司是否跟进或提出竞争性标准。第三，学术期刊与会议如何应对AI全自动论文。目前尚无统一的接受或拒绝规则，这篇论文的发表路径（个人博客而非正式会议）本身就是一种态度的试探——未来可能需要专门的“AI协同论文”披露规范。

来源：量子位 · 每日最新

DeepSeek陈德里开发自动研究Skill，写一篇论文人类只动脑2小时