

记者 郑晨烨
2025 年底,寰球最大的 AI 模子团员平台 OpenRouter 发布的年度使用敷陈流露,在其用户组成中,47% 来自好意思国,中国设备者占 6%。此外,平台调用现实中,英语占比 83%,汉文不及 5%。
兑现 2026 年 4 月 3 日当周,该平台调用量排名前十的模子中,有 6 个来自中国。按调用量从高到低按次为:小米 MiMo-V2-Pro、阶跃星辰 Step3.5Flash、MiniMaxM2.7、DeepSeekV3.2、智谱 GLM5Turbo 和 MiniMaxM2.5。其中,小米 MiMo-V2-Pro 以 4.82 万亿 Token(词元)位居全平台第一。
事实上,自 2026 年 2 月 9 日至 15 日,当周中国模子调用量初度杰出好意思国以来,中国模子的着手已抓续近两个月。
OpenRouter 平台会聚了杰出 400 个 AI 模子,掩盖 60 多家供应商,其调用量的数据被视为不雅察寰球设备者模子遴荐偏好的窗口之一。设备者可通过团结 APIKey(一种用于考据身份和调用工作的密钥)在不同模子间随时切换。
OpenRouter 迎合首创东谈主兼 COOChrisClark 在 2026 年 2 月公开默示,中国开源模子在好意思国企业运行的 Agent(智能体)责任流中占比"不行比例的高"。同期,设备者社区中围绕模子间任务分派与老本优化的相干也日益加多。
有不雅点将这一陶然与 30 年前的中国制造业类比:那时中国凭借老本上风切入寰球电子产业链的拼装门径,产生了富士康、立讯精密等代工企业;如今,中国大模子也正以价钱上风切入寰球 AI 产业链的践诺门径。也有不雅点将国产大模子视为" AI 期间的富士康"。
国产大模子在 AI 产业链中演出何种变装?该变装的含金量究竟有多高?
价钱上风
经济不雅察报记者梳理各厂商兑现 2026 年 3 月底的官方 API 订价发现,中好意思主流大模子的价钱存在浩大差距。
以输入价钱为例,中国模子中,DeepSeekV3.2 为每百万 Token0.28 好意思元,MiniMaxM2.5 为 0.3 好意思元,月之暗面 KimiK2.5 为 0.42 好意思元。好意思国模子中,An-thropicClaudeOpus4.6 为 5 好意思元,OpenAIGPT-5.4 为 2.50 好意思元。好意思国主流模子的输入价钱约为中国主流模子的 10 至 20 倍。
输出价钱差距更为昭着。中国模子方面,DeepSeekV3.2 为每百万 Token0.42 好意思元,MiniMaxM2.5 为 1.1 好意思元,月之暗面 KimiK2.5 为 2.2 好意思元。好意思国模子方面,OpenAIGPT-5.4 为 15 好意思元,ClaudeOpus4.6 为 25 好意思元。中好意思主流模子输出价钱差距约为 7 倍至 60 倍。
上述价差一直存在,此前未激励大限制用户挪动,原因很肤浅,大多数东谈主用 AI 的主要场景即是聊天,Token 糜掷量较低,价差影响甚微。
但 2026 年头,一只"龙虾"的出现改动了这一切。
开源器具 OpenClaw(设备者社区称为"龙虾")于 2026 年 2 月前后赶快走红,上线后很快登顶 OpenRouter 行使名次榜第一,单周糜掷超 6000 亿 To-ken。"龙虾"属于智能体行使,和往常"你问我答"的聊天模式不同,它可使 AI 在电脑上自主践诺编程、测试、文献处理等任务,无需慢慢东谈主工干豫。
在这种责任模式下,Token 糜掷量与聊天场景不在一个量级。
比如,一个编程任务可能需要资历几十轮"写代码—运行—报错—修改—再运行"的轮回,每一轮皆是一次齐备的模子调用。为了让智能体记着此前的操作,每次调用还需要调用对话历史。
有设备者在酬酢平台上默示,一个活跃的 OpenClaw 会话高下文很容易推广到 23 万 Token 以上。若全程使用 ClaudeAPI,月用度可能在 800 至 1500 好意思元之间。也灵验户称,一个成立不妥的自动化任务,一天就烧掉了 200 好意思元。
以 OpenClaw 为代表的智能体行使推高了扫数平台 Token 糜掷量。比如,2025 年 3 月 3 日至 9 日当周,OpenRouter 前十大模子周调用量臆想 1.24 万亿 Token。至 2026 年 2 月 16 日至 22 日当周,仅前十大模子周调用量就杰出了 8.7 万亿 Token,增长近 7 倍。编程任务在平台 Token 糜掷中的占比也从 2025 年头的 11% 升至 2025 年底的 50% 以上。
当单次任务 Token 糜掷从几千增至几十万,中好意思模子间的价钱差距从可忽略的老本转动为每月数百甚而上千好意思元的显贵相反。
2026 年 2 月 19 日前后,好意思国大模子公司 Anthropic 更新工作条件,回绝用户将 Claude 订阅账号阐述接入 OpenClaw 品级三方器具,要求通过 API 按量计费。随后 Google 也推出肖似适度。关于每天需频繁调用 API 的智能体行使,模子遴荐中的价钱身分红为绕不外去的问题,设备者被推上了按量付费的赛谈。
在智能体中枢的编程场景上,中好意思模子才气已较为接近。
SWE-BenchVerified 是由普林斯顿大学探求团队爱护的一项编程才气公开评测,作念法是让 AI 模子去诞生 GitHub(寰球最大的开源代码托管平台)上信得过的代码问题。根据该评测公开名次榜的数据,2026 年 2 月 13 日发布的中国模子 MiniMaxM2.5 拿到了 80.2%,2 月 5 日发布的好意思国模子 ClaudeOpus4.6 为 80.8%,两者差距唯有 0.6 个百分点。
在才气邻近而价钱悬殊的情况下,设备者的遴荐赶快响应在了数据上。
2026 年 2 月 9 日至 15 日当周,中国模子 Token 调用量达 4.12 万亿,初度杰出好意思国模子的 2.94 万亿。随后一周,中国模子调用量升至 5.16 万亿,三周时期增长 127%。同期好意思国模子调用量降至 2.7 万亿。
中国大模子为什么能失色国大模子低廉这样多?
工信部信息通讯经济各人委员会委员盘和林向经济不雅察报默示,原因主要有两点:一是中国算力基础设施限制大、复用率高,报价较低;二是中国算力集群中存在遍及自建算力,得到老本低于国际。
此外,期间阶梯也影响老本。有业内东谈主士告诉记者,面前主流中国大模子遍及采纳 MoE 架构,也称为"混杂各人模子"。通俗地说,一个 MoE 模子天然参数总量很大,但每次运行时只激活其中一小部分参数来处理任务,而不是全体参数,21点游戏官网这大幅裁汰了每次推理所需的筹划量。
不同旅途
硅谷风投契构 a16z 合鞭策谈主 MartinCasado 在 2025 年底默示,在使用开源期间栈的 AI 初创公司中,约 80% 的公司使用中国模子。他随后在酬酢平台上补充证明,这并非指 80% 的好意思国 AI 初创公司皆在使用中国模子,而是那些遴荐开源期间阶梯的公司中(约占沿路好意思国 AI 初创公司的 20% 至 30%),约 80% 使用了中国模子。
记者凝视到,GitHub 上已出现多个匡助设备者在不同模子间优化老本的开源器具。其念念路多为将任务按难度分级,肤浅任务交由免费或廉价的中国模子处理,复杂任务再调用高价好意思国模子。
其中一个名为 ClawRouter 的形貌在文档中给出了对比数据,流露采纳这种搭配步地后,平均老本从每百万 Token25 好意思元降到了约为 2 好意思元。Anthropic 的居品 ClaudeCode,在官方文档中也采纳了肖似的分层筹算,默许用最低廉的模子处理日常任务。
这种模式大致成立的前提是中国模子在践诺类任务上才气满盈。在编程方面,前边提到的 SWE-Bench 数据依然证明了这小数。而在编程以外,中好意思大模子举座才气差距有多大呢?
LMSYSChatbotArena 是面前寰球公认度最高的 AI 模子评测平台之一,其作念法是让真东谈主用户在不知谈模子名字的情况下同期试用两个模子,然后投票选出更好的阿谁,特地于一场 AI 之间的盲品测试。
在其兑现 2026 年 3 月 25 日的轮廓排名中,前五名均为好意思国公司模子,中国模子中排名最高的 DeepSeekV3.2Speciale 位列第六。在挑升测试复杂推理才气的 HardPrompts(高难度领导词,挑升用于测试模子处理复杂推理和多步逻辑任务的才气)类别中,中好意思模子的差距更为昭着,第一梯队仍主要为好意思国模子。
编程才气接近、复杂推理尚有差距,这是当下中好意思大模子之间相反化才气的体现,亦然"分层调用"这套作念法成立的基础。
不外,和 30 年前被锁在低利润率的代工场商不同,中国大模子厂商在价钱上并莫得一直往下走。
事实上,从 2024 年开动,中国大模子行业曾发生过一轮价钱战:2024 年 5 月,字节越过旗下火山引擎豆包大模子以 0.0008 元 / 千 Token 的价钱激励"价钱战",阿里云、百度智能云接踵跟进。尔后近一年,行业资历 Token 价钱下落杰出 90% 的阶段,部分厂商推理算力毛利率一度为负。
厂商那时的计谋所以吃亏相易限制,培养用户调用习尚。但是,2026 年 2 月 OpenClaw 走红后,Token 糜掷量增速远超预期,算力供给趋紧。
智谱首先作念出反应,2026 年 2 月 12 日发布新模子 GLM-5 时上调 API 订价,3 月 16 日发布 GLM-5-Turbo 时再次提价,两轮累计涨幅 83%。
智谱 CEO 张鹏在 2025 年度功绩证明会上默示,2026 年一季度 API 调用订价培植 83%,调用量增长 400%。根据年报,智谱 2025 年全年收入 7.243 亿元,同比增长 132%,MaaS(模子即工作)平台年度频繁性收入约为 17 亿元,12 个月增长 60 倍。
遴荐加价的不单智谱一家。2026 年 3 月 13 日,腾讯云治愈了混元系列大模子订价,部分模子涨幅超 460%。3 月 18 日,阿里云与百度智能云同日发布调价公告,AI 算力相关居品涨幅在 5% 至 34% 之间,新价钱于 4 月 18 日奏效。
中科晨曦高等副总裁李斌在经受经济不雅察报采访时称,算力系统评价规划正在发生改动,往常预计一个系统的次序是看它有若干算力,面前则要看它大致何等经济地产出 Token。
从集体降价到集体加价,转动只用了不到两年。
2026 年 3 月,国度数据局局长刘烈宏在中国发展高层论坛上公布了一组数字:中国日均 Token 调用量已打破 140 万亿,较两年前增长杰出 1000 倍。
在同月的 GTC 大会上,英伟达首创东谈主黄仁勋称,Token 将是畴昔数字天下最中枢的巨额商品。
在盘和林看来,中国大模子的竞争力很强,不是在补全,而是在引颈,尤其在 AI 行使端。但他同期默示,中国在原创性改进上还有培植空间,现时 AI 体系中的中枢架构,从东谈主工神经集结到注眼光机制,皆是国际率先提议、国内跟进迭代。中国大模子下一步需要在行使端络续发力的同期,在基础算法上伸开原创性改进。
30 年前的消费电子代工产业有一个特质,拼装门径的利润率被上游品牌商紧紧压住,不少头部的代工场发展于今的毛利率皆莫得杰出 10%。老本上风带来了订单,但未能带来订价权。
现时,中国大模子的处境看起来与当年的消费电子代工产业有几分相似,但在订价权方面似乎又颇有不同。举例,智谱加价 83% 之后,调用量增长了 400%。阿里云、百度智能云、腾讯云在 2026 年 3 月集体上调了 AI 算力和模子工作的价钱,需求并莫得萎缩,调用量在抓续增长。
在 SWE-Bench 编程评测上,头部中国模子和头部好意思国模子的差距依然减弱到不及 1 个百分点。两者在复杂推理上的差距还在,但这个差距也在快速收窄。
这次21点app,中国大模子厂商的发展旅途似乎有所不同。
米兰体育官方网站 - MILAN