美国出口管制收紧,Coinbase转向中国AI模型
总部位于北京的AI实验室Z.ai(前身为智谱AI)于6月13日发布了GLM-5.2——恰好是特朗普政府以全面出口管制令要求Anthropic在全球范围内下线其Fable 5和Mythos 5模型后的次日。这款拥有7440亿参数的开放权重模型因此成为自DeepSeek亮相以来讨论热度最高的中国AI发布,吸引了众多寻求更低成本替代方案的企业,同时也再度引发外界对依赖中国司法管辖下所构建模型的安全隐患的质疑。
国产芯片上的前沿模型
GLM-5.2 采用混合专家(MoE)架构,总参数量约 7500 亿,但每个 token 仅激活约 400 亿参数,从而保持较低的推理成本。智谱 AI 声称该模型完全基于华为昇腾 AI 加速器训练,未使用任何英伟达 硬件。该模型支持 100 万 token 的上下文窗口,最多可输出 131,072 个 token,并以 MIT 许可证开源发布。
在长周期编程基准测试 FrontierSWE 上,GLM-5.2 的得分比 Anthropic 的 Opus 4.8 低约一个百分点,但超越了 OpenAI 的 GPT-5.5。其 API 定价为每百万输入 token 1.40 美元、每百万输出 token 4.40 美元,远低于 Anthropic Opus 4.8 的定价(输入 5 美元、输出 25 美元)。此外,GLM-5.2 在 Artificial Analysis 智能指数中位列开放权重模型榜首。
阿姆斯特朗的成本论点
Coinbase 首席执行官布莱恩·阿姆斯特朗于6月27日就成本问题发声,分享了 Coinbase 如何通过内部 LLM 网关,将工程师默认使用的模型切换为开放权重模型,包括 GLM-5.2 和 Kimi 2.7。据《The Information》报道,尽管 token 使用量持续攀升,Coinbase 的 AI 支出已削减"近一半"。阿姆斯特朗此前曾在 X 上表示,"在未来12至18个月内,80% 的工作负载将运行在成本低99% 的模型上"。
这一趋势在 OpenRouter 上同样有所体现——中国 AI 模型目前占据该平台逾60% 的 token 流量,而一年前这一比例还不到2%。
安全隐忧挥之不去
对低价中国模型的热情,与外界长期以来对中国《国家情报法》的顾虑形成碰撞——该法律要求所有中国组织和公民"支持、协助并配合国家情报工作"。智谱(Z.ai)的云端API受该法律约束,这令处理敏感信息的企业对数据流向心存疑虑。今年5月,美国众议院议员正式发起调查,审查中国源AI模型在关键基础设施中带来的网络安全风险,智谱与DeepSeek、MiniMax及字节跳动均被点名。
这一矛盾至今悬而未决:随着美国出口管制限制企业获取美国前沿模型的渠道,填补这一空白的开放权重替代模型也有其自身风险,企业必须在成本节省与潜在风险之间审慎权衡。