沐曦股份曦云C系列GPU Day 0 适配智谱GLM-5.2旗舰模型

沐曦的曦云C系列GPU在正式出货前即完成与智谱GLM-5.2旗舰模型适配,意味着国产算力芯片正在加速追赶AI大模型生态,为开发者和企业提供更多硬件选择。

沐曦的曦云C系列GPU在正式出货前即完成与智谱GLM-5.2旗舰模型适配,意味着国产算力芯片正在加速追赶AI大模型生态,为开发者和企业提供更多硬件选择。

印度AI初创公司Sarvam AI完成2.34亿美元融资,估值达15亿美元,成为印度最新独角兽。HCLTech以1.5亿美元作为战略领投方,反映出全球对“主权AI”——即国家或企业自主掌控大模型能力与算力基础设施——的需求正在快速升温。

用户在 Docker 中运行 Open WebUI v0.9.6,Ollama 版本从 0.23.0-rc0(前一天正常工作)升级后,UI 一直显示“loading”,无法完成任何聊天请求。用户同时提到 Ollama 0.24.0 也存在类似行为(尝试 RAG embedding 模型时导致 wor

用户在 Open WebUI(Docker 部署)中通过 Web 界面与 Ollama(v0.30.5)交互。预期行为:在模型选择下拉菜单中,已加载到 VRAM 的模型旁边应显示一个绿色圆点,表示该模型“热就绪”可立即使用。实际行为:该绿色圆点完全消失,即使模型刚刚被使用过也看不到任何指示。此问题影
![[Local LLM] 分享个自己在用的玩具](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_5-648-768x403.jpg)
V2EX 用户 mountainl 分享了一次低成本本地大模型硬件搭建实践,利用两块二手 RTX 3060(12GB)和 E5 平台,成功运行通义千问 Qwen3.6-35B-A3B-APEX 模型(128K 上下文,输出约 100 tps),并配合 hermes agent 实现脚本辅助编写。这件事直观展示…

诺基亚宣布投资3000万美元,扩建其位于宾夕法尼亚州的芯片先进封测工厂,旨在将光子半导体产能提升十倍,以优化数据中心等场景的AI运行效率。该工厂将创造250个就业岗位,并利用美国政府《芯片与科学法案》提供的税收抵免,加速半导体制造回流美国。

一名外省女子为博取流量,利用AI工具生成“上海地铁站天花板大面积坍塌”的虚假视频并发布到微信视频号,最终因虚构事实扰乱公共秩序被警方依法行政拘留。此案是AI工具被用于制造恐慌性谣言的新案例,凸显了AI生成内容在传播环节的监管挑战与伦理风险。

Adobe最新发布的《2026创作者工具包报告》显示,75%的全球创作者已将AI工具融入日常工作流程,其中87%的受访者明确表示AI在加速其业务增长和粉丝积累方面发挥了实质性作用,这意味着AI不再只是实验性辅助,而是已转化为可量化商业竞争力的核心变量。

谷歌于 2026 年 6 月 16 日正式推出 Android 17 与 Wear OS 7,将自研多模态大模型 Gemini Omni 与音频生成模型 Lyria3 深度植入系统底层,标志着移动操作系统从“应用商店生态”向“原生 AI 代理生态”的实质性转变。

截至2026年5月底,ChatGPT全球市场份额首次跌至46.4%,Google Gemini和Anthropic Claude分别升至27.7%和10.3%,AI助手市场从ChatGPT一家独大转向三强并立。