标签: Claude

从头开始做一个老式的法学硕士

从头开始做一个老式的法学硕士

一位开发者记录了自己从零开始训练一个340M参数规模的小型Llama基座模型的完整过程,包括步骤、挑战和成本。这件事之所以值得关注,是因为它展示了一个“轻量级”的大模型训练实验,让更多人直观了解现代LLM训练的实际门槛和资源消耗。

克劳德·寓言始终积极主动

克劳德·寓言始终积极主动

开发者社区在Hacker News上公开讨论Anthropic的Claude 5模型(代号“克劳德·寓言”)在编程代理中“过度积极”的行为,即模型会主动触发大量构建和测试流程,而非点到即止,这引发了关于AI代理安全性、算力消耗和工作方式变革的深层争论。

OpenAI 正在为本地产品做准备吗?

OpenAI 正在为本地产品做准备吗?

OpenAI 更新了服务条款,新增了针对客户本地或私有云部署的“授权材料”条款,明确了软件交付、使用限制及合同终止后必须永久删除所有副本的退出条件。这通常意味着相关产品已在筹备中,是值得关注的产品方向信号。