智谱开源AI模型媲美Anthropic,成本仅为其五分之一

智谱开源AI模型媲美Anthropic,成本仅为其五分之一

智谱开源AI模型媲美Anthropic,成本仅为其五分之一

据CNBC报道,智谱AI的开源模型GLM 5.2已成为美国领先AI系统的强力挑战者——在一项备受关注的智能体基准测试中,其得分与Anthropic的Opus 4.8相差不到一个百分点,推理成本却仅约为后者的五分之一。该模型于6月16日以MIT许可证发布,外界将其与2025年初的DeepSeek冲击波相提并论,但对于企业市场而言,GLM 5.2或许更具持久价值。

与最终被定性为"聊天机器人现象"而遭淡化的DeepSeek不同,GLM 5.2的优势在于智能体任务——规划、编程、测试与循环迭代,正是企业竞相实现自动化的那类自主工作。该模型拥有7440亿参数,采用混合专家架构,每个token激活400亿参数,并支持100万token的上下文窗口,可一次性处理整个代码库。

分发优势

GLM 5.2 的发布时机放大了其影响力。特朗普总统于6月2日签署的一项行政令建立了一套自愿性框架,赋予联邦政府对指定"前沿覆盖模型"最长30天的预发布访问权限,先于公众获取。OpenAI已开始感受到影响:据《The Information》报道(TechCrunch转引),其最新模型GPT 5.6据报道在预览期内将仅向经政府批准的合作伙伴开放,管理层"逐客户审批访问权限"。

这一监管动态为智谱——其运营不受该框架约束——创造了一个分发窗口。GLM 5.2 可免费下载、微调并部署在私有服务器上,目前已在 Together AI、Cloudflare Workers AI 及 Hugging Face 等平台上线托管。

开放权重,开放竞赛

在 Terminal Bench 2.1 和 SWE-Bench Pro 等基准测试中,GLM 5.2 是迄今发布的最强开源模型,在编程任务上的表现与 Claude Opus 4.8 和 GPT-5.5 不相上下,同时超越了谷歌()的 Gemini 3.1 Pro。借助 Unsloth 的动态量化技术,开发者现在可以在单台 256 GB Mac 上本地运行该模型。

Harvey 联合创始人盖布·佩雷拉(Gabe Pereyra)是率先肯定该模型前沿水准的人士之一——他创办的法律 AI 公司此前曾对智谱的模型进行过后训练。更广泛的开发者社区也积极响应:多位从业者不约而同地表示,GLM 5.2 是首个在日常使用中真正能与闭源系统一较高下的开放权重模型。

GLM 5.2 能否保持这一势头,或许不取决于基准测试成绩,而更多地取决于目前有利于其传播的监管不对称性——若行政令的自愿性框架始终停留于纸面,这一差距或将逐渐收窄。