Ask HN: 您对 Opus 4.8 和 GPT-5.5 的参数数量估计是多少?

Hacker News 社区近期发起了一项非正式调查,邀请技术圈用户对 Anthropic 的 Opus 4.8 和 OpenAI 的 GPT-5.5 两个潜在下一代模型的实际参数数量进行估算。这一话题之所以引发关注,是因为当前公开信息极度缺乏,从业者试图通过推测来提前判断技术路线与算力成本。

Hacker News 社区近期发起了一项非正式调查,邀请技术圈用户对 Anthropic 的 Opus 4.8 和 OpenAI 的 GPT-5.5 两个潜在下一代模型的实际参数数量进行估算。这一话题之所以引发关注,是因为当前公开信息极度缺乏,从业者试图通过推测来提前判断技术路线与算力成本。

安卓 17 通过强制终止高内存 App 提升流畅度,Android Authority 解读称该机制将直接影响 Pixel 10 等设备;微信 AI 助手“小微”扩大灰度测试,可语音操作原生功能并“一句话生成小程序”,这是微信生态在对话式 AI 交互上的关键落地;小米“寻天”SUV 原型车被拍下展开车顶帐篷…

开发者 Ethan 发布了一款名为 cc-fleet 的开源工具,让用户能够将 DeepSeek、GLM、Kimi、Qwen 等第三方大语言模型作为工作节点,直接注入 Anthropic 的 Claude Code 多智能体编排系统(动态工作流、智能体团队、子智能体),无需 Claude 订阅即可在这些模型上…

特斯拉近期向美国专利商标局申请注册“Amazing Abundance”商标,涵盖机器人与人工智能硬件及软件类别。此举被视为特斯拉加速从汽车公司向AI与机器人公司转型的明确信号,尤其是其“Optimus”人形机器人商业化进程的关键一步。

前 OpenAI 设计师 Thomas Dimson 和 Joey Flynn 推出了一款名为 In the Weights 的网站,它通过向多个 AI 模型提问“某个人是谁”,来评估这个人在模型“内部权重”中的记忆强度,并将其量化为一个可供比较的分数。这本质上是将传统“谷歌虚荣搜索”换成了以 LLM 为中心…

一项名为“欧洲 2031”的情景推演指出,如果欧盟在AI竞争中长期落后于美国和中国,到2031年可能面临显著的经济增长放缓和政治不确定性。该推演并非预测,而是对政策缺位后果的警示。

英国内政部宣布投入 7500 万英镑(约合 6.9 亿元人民币),启动名为“PoliceAI”的专项计划,旨在将人工智能技术系统性地引入警务工作。这表明政府层面对 AI 在公共安全与执法领域的应用进入了实质性推进阶段,而非停留在概念讨论。

在 Hacker News 上,开发者社区正围绕 Claude Code、GitHub Copilot/Codex 和其他 AI 编程工具展开热烈讨论,反映了 AI 辅助编程已成为日常开发的核心争议点,用户关心哪个工具更实用、更高效。

SpaceX以600亿美元全股票交易收购了AI编程工具Cursor的母公司Anysphere。这笔交易不仅服务于xAI与OpenAI及Anthropic的竞争,更重要的是为SpaceX的估值提供了即时收入缓冲。

OpenAI 近期发布了名为 LifeSciBench 的基准测试,用于评估 AI 在真实生命科学研究任务中的能力。结果显示,其最强的 GPT-Rosalind 模型整体通过率仅为 36.1%,未能通过近三分之二的测试,暴露了当前 AI 在复杂科研场景下的显著局限性。