GateGPT:FPGA 上每秒 56k 个令牌,频率为 80 MHz

开发者 fguzman82 实现了一个名为 GateGPT 的项目,在 FPGA 上以 80 MHz 的频率运行小型 Transformer 模型,推理速度达到每秒 56k 个令牌。该项目的核心价值不在于跑赢 GPU,而在于展示了完全定制化硬件执行 AI 推理的可行性,以及机器人辅助开发 FPGA 的新工作流…

开发者 fguzman82 实现了一个名为 GateGPT 的项目,在 FPGA 上以 80 MHz 的频率运行小型 Transformer 模型,推理速度达到每秒 56k 个令牌。该项目的核心价值不在于跑赢 GPU,而在于展示了完全定制化硬件执行 AI 推理的可行性,以及机器人辅助开发 FPGA 的新工作流…

一篇博客文章提出“AI 代理的章鱼架构”概念,核心是构建一个中央协调器,并连接多个专用 AI 代理来执行具体任务。但评论指出,这种多代理协调模式早已是前沿模型厂商和初创公司的常见做法,并非新鲜想法。

阿里通义千问团队发布了 Qwen-Robot Suite,一套旨在让大模型指挥机器人完成导航、操作等物理世界任务的模型套件。这套方案展示了从“看到世界”到“动手执行”的完整技术路径,引发了社区关于其架构先进性、实际可用性(未开放权重)以及何时能进入产品的讨论。

Hacker News 上关于 AI 夺走工作的讨论,重新点燃了“卢德运动”的历史隐喻——当时工人砸机器争取基本权利,如今创作者和开发者担心 AI 公司会像当年资本持有者一样,通过技术控制劳动价值分配,而问题核心已不是机器替代人,而是“谁来分享收益”。

Hacker News 用户集中反馈 Claude Code 在 Windows 终端表现糟糕——渲染卡顿、错误频发,而对比之下其竞争对手在基础设施稳定性上表现更优。这一讨论同时折射出 AI 开发生态中 Windows 与 Linux/Mac 的长期割裂,以及“代码代理”在复杂基础设施项目中的真实可靠性问题。

SpaceX 已同意以 600 亿美元股票收购 AI 编码助手公司 Cursor,将其纳入 Elon Musk 旗下新成立的航空航天与人工智能综合企业。Cursor 自 2022 年创立后增长迅猛,2026 年 11 月宣布年化营收突破 10 亿美元,并被列入当年 CNBC Disruptor 50 榜单。

国内 AI 初创公司 DeepSeek 被曝已完成一轮规模超过 500 亿元人民币的融资,这可能是中国 AI 领域单笔融资额最高的案例之一。该事件折射出大模型赛道的资本热度与商业模式探索进入新阶段。

慧与科技(Hewlett Packard Enterprise,HPE)宣布将联合英伟达,把“代理式人工智能”(Agentic AI)从研究阶段推进到实际生产环境中。这意味着企业级AI应用正从单一对话模型向更复杂的、可自主执行任务的智能代理系统演进。

因遵守美国政府监管指令,Anthropic 于上周五晚间关停了其先进大模型 Fable 5 的公开访问权限。但预测市场交易员押注,该公司有望在 7 月初恢复对美国用户的服务,市场给出的概率已超过 50%。这一事件凸显了 AI 前沿模型在安全与商业开放之间的激烈博弈。

用户在 Windows 上启动 Stable Diffusion WebUI(Commit hash: ea9bd9fc ),未使用特殊命令行参数,未安装 xformers,加载模型后 WebUI 提示正在运行,但随即报错退出。报错发生在 webui.py 第 232 行调用 app.add_mid