各家公司正争相设法控制不断攀升的人工智能成本

随着大模型训练和推理成本急剧上升,企业正从“先建再说”转向“成本控制优先”,开始调整模型架构、优化推理效率和重新谈判云服务合同,以遏制AI投入的失控式增长。

随着大模型训练和推理成本急剧上升,企业正从“先建再说”转向“成本控制优先”,开始调整模型架构、优化推理效率和重新谈判云服务合同,以遏制AI投入的失控式增长。

6月14日,市场传闻蚂蚁集团正在秘密测试一款原生AI界面的支付宝版本,可将支付、理财、生活服务等全链路智能化。蚂蚁集团拒绝评论,但分析师认为这是超级App从功能集合转向智能体中枢的必然趋势,短期内不会全面上线。

北京中关村学院与中关村人工智能研究院(合称“中关村两院”)成立不到两年,以“前店后厂”模式打通产学研——累计孵化超百个项目、总融资超3亿元,并已培养10个学生自主立项及2家AI初创企业(深度机智、新烛时代),标志着AI人才与产业孵化一体化的新尝试。

在 HN 社区中,多位开发者公开分享了他们使用 AI Agent(而非仅 LLM 对话)构建完整软件项目的真实案例,从地理数据整理到内部工具重写,AI Agent 正从“聊天玩具”变成实际生产力工具。关键在于,这些项目在无 Agent 的情况下几乎不可能以相同成本和时间完成。

ComplyEdge 发布了一款面向 Python 的运行时合规工具,能在 AI 代理的生产请求中实时拦截违反《欧盟人工智能法案》(EU AI Act)规则的内容,并提供带法条引用和规则 ID 的审计日志。它不是事后扫描器,而是部署在推理路径上的强制检查点。
![[问与答] 好奇 LLM 厂商是怎么给模型定价的](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_1-569-768x403.jpg)
V2EX 社区用户发起了一个关于大模型定价逻辑的讨论,核心问题是大模型厂商如何计算每百万 tokens 输出的成本。两位社区用户从硬件利用率、推理性能与队列控制等角度给出了技术性解释,揭示了当前 AI 推理服务商业化中成本结构与定价模型之间的直接关系。

知名会计师事务所毕马威(KPMG)因一份关于AI使用情况的报告中出现明显的“幻觉”错误,被迫撤回该报告。这一事件再次凸显了AI生成内容在严肃商业与合规场景下的可信度危机。

开发者 gary23w 开源了一个名为 neuron-db 的关联记忆存储工具,核心思路是用纯文本事实替代向量嵌入,实现微秒级召回且无模型依赖。它不直接解决 LLM 上下文窗口限制,但为长期、低资源记忆管理提供了一种实用、可审计的替代方案。

拥有近20年投资经验的远镜创投前投资人金戈,于2025年2月联合清华教授莫一林创立具身智能公司“灵御智能”,并在一年内完成了四轮融资,第五轮即将完成。这揭示了风险投资人才向AI创业一线大规模流动,以及具身智能赛道当前融资的极高热度。
![[Codex] 中转站的 codex 有办法在手机上控制吗](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_5-548-768x403.jpg)
V2EX 社区近期有用户询问能否在手机上控制部署在“中转站”的 Codex 服务,多位开发者分享了三种可行方案:利用官方客户端改配置、使用国内开发者提供的远程终端工具、以及通过自建内网穿透实现。这表明 AI 工具与移动端结合的需求正在快速增长,但方案成熟度和兼容性仍存在分歧。