Meta 的非侵入性大脑到文本人工智能正在缩小与手术植入的差距

Meta 发布了 Brain2Qwerty v2 模型,用非侵入式脑磁图(MEG)记录活动,从打字信号中重建句子。平均词错误率降至 39%,最佳参与者达到 22%——这一水平正在逼近需要开颅手术的脑植入方案。

Meta 的非侵入性大脑到文本人工智能正在缩小与手术植入的差距

一句话看懂:Meta 发布了 Brain2Qwerty v2 模型,用非侵入式脑磁图(MEG)记录活动,从打字信号中重建句子。平均词错误率降至 39%,最佳参与者达到 22%——这一水平正在逼近需要开颅手术的脑植入方案。

事件核心:发生了什么

Meta 的 FAIR 研究团队于 2026 年 7 月 1 日公布了 Brain2Qwerty 的第二代模型。实验招募了 9 名健康志愿者,用脑磁图(MEG)在颅外采集脑磁信号,每位参与者累计记录 10 小时,总共输入了 22,000 个句子。实验流程是:志愿者听到句子后短暂停顿,然后在看不见屏幕文本的情况下打字。模型从敲击键盘时的脑信号中重建句子。与上一代不同,Brain2Qwerty v2 不再需要每个按键的精确时间戳来对齐信号,而是采用连续信号窗口自主分配字符,实现了异步处理。该模型采用三层 AI 结构——字符级、单词级和句子级,其中句子级使用 Qwen3 大语言模型微调,将带有噪声的脑信号转换成连贯文字。此外,研究使用了基于 Claude Opus 4.6 的自动 AI 代理编写优化代码,发现了标签平滑、模态丢弃和更短提示等有效技巧。

为什么重要

目前,帮助脑损伤后失语或失动患者沟通的可靠方案是脑植入,但植入手术风险高。Meta 正试图用非侵入式方法缩小差距。Brain2Qwerty v2 平均词错误率 39%,而上一代基于 N-gram 模型的方案为 43%,原始编码器则为 55%。最佳参与者的句子完全正确率达到 28%,47% 的句子最多只有一个词错误。作为对比,此前基于 fMRI 的研究词错误率高达 92-94%。但字符错误率方面,v2 却比原始编码器更差(31% vs 28%),原因是语言模型倾向于生成语法正确但脑信号未完全支持的句子,甚至会生成与目标完全偏离但通顺的句子。研究团队认为,在脑机接口场景中,语义正确性比字符精确匹配更重要。目前仍处于研究阶段,尚不具备实时使用能力。

对用户/开发者/创作者的影响

对于从事脑机接口和康复辅助技术的开发者和研究者,Brain2Qwerty v2 提供了开源参考:非侵入方案的可行性边界正在扩展。医疗和辅助设备领域的企业可关注该技术是否从实验室走向产品化。对普通用户而言,此技术距离日常应用仍有时日,需解决实时性、设备便携性和个体差异等挑战。对于内容创作和开发者工具领域,该工作展示了语言模型(如 Qwen3)在信号去噪和非传统输入方式中的潜力,可能启发更多跨模态融合应用。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

1. 目前系统依赖 MEG 设备,该设备体积大、成本高,Meta 是否能结合更便携的传感器(如 EEG 干电极)实现室外可用的原型。2. 语言模型带来的语义准确性与字符准确性之间的矛盾如何解决,是否有商业化的纠错机制。3. 研究团队使用了 AI 代理进行代码优化,但在开放任务时失败,这种“AI 辅助 AI 研究”的模式是否能形成工作流并扩大应用范围。

来源:The Decoder AI News

celebrityanime
celebrityanime
文章: 10817

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注