标签： API

各家公司正争相设法控制不断攀升的人工智能成本

随着大模型训练和推理成本急剧上升，企业正从“先建再说”转向“成本控制优先”，开始调整模型架构、优化推理效率和重新谈判云服务合同，以遏制AI投入的失控式增长。

6月14日，市场传闻蚂蚁集团正在秘密测试一款原生AI界面的支付宝版本，可将支付、理财、生活服务等全链路智能化。蚂蚁集团拒绝评论，但分析师认为这是超级App从功能集合转向智能体中枢的必然趋势，短期内不会全面上线。

北京中关村学院与中关村人工智能研究院（合称“中关村两院”）成立不到两年，以“前店后厂”模式打通产学研——累计孵化超百个项目、总融资超3亿元，并已培养10个学生自主立项及2家AI初创企业（深度机智、新烛时代），标志着AI人才与产业孵化一体化的新尝试。

在 HN 社区中，多位开发者公开分享了他们使用 AI Agent（而非仅 LLM 对话）构建完整软件项目的真实案例，从地理数据整理到内部工具重写，AI Agent 正从“聊天玩具”变成实际生产力工具。关键在于，这些项目在无 Agent 的情况下几乎不可能以相同成本和时间完成。

ComplyEdge 发布了一款面向 Python 的运行时合规工具，能在 AI 代理的生产请求中实时拦截违反《欧盟人工智能法案》（EU AI Act）规则的内容，并提供带法条引用和规则 ID 的审计日志。它不是事后扫描器，而是部署在推理路径上的强制检查点。

V2EX 社区用户发起了一个关于大模型定价逻辑的讨论，核心问题是大模型厂商如何计算每百万 tokens 输出的成本。两位社区用户从硬件利用率、推理性能与队列控制等角度给出了技术性解释，揭示了当前 AI 推理服务商业化中成本结构与定价模型之间的直接关系。

知名会计师事务所毕马威（KPMG）因一份关于AI使用情况的报告中出现明显的“幻觉”错误，被迫撤回该报告。这一事件再次凸显了AI生成内容在严肃商业与合规场景下的可信度危机。

开发者 gary23w 开源了一个名为 neuron-db 的关联记忆存储工具，核心思路是用纯文本事实替代向量嵌入，实现微秒级召回且无模型依赖。它不直接解决 LLM 上下文窗口限制，但为长期、低资源记忆管理提供了一种实用、可审计的替代方案。

拥有近20年投资经验的远镜创投前投资人金戈，于2025年2月联合清华教授莫一林创立具身智能公司“灵御智能”，并在一年内完成了四轮融资，第五轮即将完成。这揭示了风险投资人才向AI创业一线大规模流动，以及具身智能赛道当前融资的极高热度。

V2EX 社区近期有用户询问能否在手机上控制部署在“中转站”的 Codex 服务，多位开发者分享了三种可行方案：利用官方客户端改配置、使用国内开发者提供的远程终端工具、以及通过自建内网穿透实现。这表明 AI 工具与移动端结合的需求正在快速增长，但方案成熟度和兼容性仍存在分歧。