Ask HN: 对于健康方面的问题,你有多信任大型语言模型(LLMs)?

Hacker News 上一位软件工程师发帖,质疑自己越来越频繁地拿 LLM 回答对比医生处方,引发社区讨论——开发者普遍承认在编程领域能验证 LLM 的可靠性,但在医疗等非工程领域,信任边界尚不明确。

Hacker News 上一位软件工程师发帖,质疑自己越来越频繁地拿 LLM 回答对比医生处方,引发社区讨论——开发者普遍承认在编程领域能验证 LLM 的可靠性,但在医疗等非工程领域,信任边界尚不明确。

吴恩达在 LangChain 大会上指出,编程 Agent 已将代码实现速度提升 10 到 100 倍,但随之而来的是整个软件协作链条的结构性错配——瓶颈从工程实现转移到了产品管理、营销、法务等环节;同时,Agent 竞争的下半场不再是模型本身有多强,而是 Agent 能否获取及时、准确的执行上下文。这一判断…

Fifth Third Bancorp(FITB)因获邀参与 Anthropic 的“Project Glasswing”网络安全项目,将率先接入 Claude Mythos 模型,这有望为其带来安全层面的竞争优势,并推动股价上涨。此外,该银行已完成对 Comerica 的收购,财务数据增长显著,但当前市盈率…

加拿大养老金投资巨头CPP Investments宣布向印度数据中心运营商CtrlS投资高达700亿卢比(约7.41亿美元),押注印度在全球AI和云计算基础设施布局中的关键角色。这是全球资本涌入印度AI数据中心建设浪潮的最新一例。

因出口管控争议,白宫要求 Anthropic 下线其最先进的 AI 模型 Claude Mythos 和 Fable 5,并禁止外国公民访问。这一事件暴露了美国在缺乏明确 AI 法规的情况下,政府正以“实时拍板”的方式处理前沿技术安全问题。

OpenAI 为 ChatGPT 企业版推出了新的分析功能和更精细的支出控制工具,即日生效。此举是 OpenAI 在 B 端商业化进程中的一个具体动作,旨在提升企业客户的管理能力和对预算的掌控力。

白宫要求 Anthropic 切断韩国电信巨头 SK Telecom 对其顶级模型 Mythos 的访问权限,Anthropic 立即照办。这一事件在 Hacker News 上引发激烈讨论,核心争议是:美国正在利用出口管制手段,将盟友的商业利益作为地缘政治的筹码。

Google Gemini 联合负责人 Noam Shazeer 再次离开 Google,加入 OpenAI。这位 Transformer 架构的核心发明者、Character.AI 的联合创始人,在经历了一次价值约 27 亿美元的“反向收购”后,又一次改变了阵营。

OpenRuna 在其网站上 Show HN 展示了三个核心能力——图关联提示、MCP 服务器和代理技能组合,旨在让 AI 代理(agent)更聪明地理解上下文、调用外部工具并执行多步骤任务,标志着 AI agent 开发从“单个提示”向“结构化工作流”的演进。

根据人工智能分析(Artificial Analysis)最新发布的智能指数,智谱AI的GLM-5.2以51分成为得分最高的开放权重模型,仅落后于三款闭源模型——Anthropic的《神鬼寓言 5》60分、Opus 4.8的56分和OpenAI的GPT-5.5的55分。这一排名表明,开放权重模型在推理能力上正…