标签: API

[Local LLM] 分享个自己在用的玩具

[Local LLM] 分享个自己在用的玩具

V2EX 用户 mountainl 分享了一次低成本本地大模型硬件搭建实践,利用两块二手 RTX 3060(12GB)和 E5 平台,成功运行通义千问 Qwen3.6-35B-A3B-APEX 模型(128K 上下文,输出约 100 tps),并配合 hermes agent 实现脚本辅助编写。这件事直观展示…

小米发布MiMo Claw正式版:支持千次连续工具调用,免费时长增至4小时

小米发布MiMo Claw正式版:支持千次连续工具调用,免费时长增至4小时

小米大模型团队于6月16日正式发布云端Agent产品MiMo Claw,搭载MiMo-V2.5-Pro模型,支持单次会话超千次连续工具调用,并将免费用户单日体验时长从1小时提升至4小时。这意味着小米在复杂办公场景的AI Agent能力上迈出了实质一步,尤其在工具调用稳定性和Token成本控制方面有具体数据支撑…