仁佰策略谁在赔本5万亿模子算力？

中国是全球最大的大宗商品进口国，但目前全球大宗商品基准价格的定价权仍集中在伦敦、新加坡、纽约等国际金融中心。中国方面希望进一步增强自身对大宗商品价格的影响力，而此次开放举措也与提升人民币国际吸引力的目标相辅相成。

公募基金Top50重仓股：科技成长与高端制造核心方向超千只基金持有宁德时代、中际旭创、紫金矿业

　　作家：郑晨烨

　　封图：图虫创意

　　2026年2月9日至2月15日，在线东谈主工智能托管平台OpenRouter发布了一组数据：中国大模子的单周调用量达到4.12万亿Token，历史上初度卓绝好意思国模子的2.94万亿Token。

　　OpenRouter是一个团聚民众大模子接口的平台，被称为东谈主工智能界的“超等接口”。开发者不需要逐个去注册大模子公司的账号，只需通过该平台的调解接口，就能解放调用民众各家公司推出的各样模子，因此，该平台的使用量数据常常被视为民众大模子受接待进程和真实应用强度的风向标。

　　紧接着的2月16日至2月22日这一周，中国大模子的周调用量进一步冲高至5.16万亿Token，三周内增长了127%，在当周民众大模子周调用量排行前五的榜单中，MiniMax M2.5、月之暗面Kimi K2.5、智谱GLM-5与深度求索DeepSeek V3.2占据了四个席位。

　　凭据官方用户数据，在OpenRouter平台近47.17%的用户来自好意思国、中国开发者仅占6.01%的配景下，这组数据反馈出国际开发者对中国模子的使宅心愿正在快速上涨。

　　Token是东谈主工智能处置讲话的基本单元。在算力商场中，Token调用量是估量大模子使用强度、买卖价值与渗入深度的中枢打算，国际开发者对中国模子的高频调用，符号着东谈主工智能产业的重点正在发生改动，行业不再单纯比拼构建大模子时的“一次性试验本钱”，而是进入了高频度、常态化的“应用推理”阶段。

　　应用重点的迁徙径直导致了卑劣采购规范的转向，国产AI芯片厂商也由此得回了加速进入商场的契机。

　　五万亿Token流向了那处

　　要厘清这五万亿Token的去处，当先需要不雅察用户使用东谈主工智能的格式发生了什么变化。

　　凭据OpenRouter与风险投资机构a16z联合发布的《2025 AI使用阐述》，该平台处置的编程任务Token占比已从2025年头的11%加多到了50%以上，成为最大的单一使用品类。这一溜变背后，是东谈主工智能应用模式从“问答式”向“智能体（Agent）”模式的切换。

　　在早期的问答模式下，用户提一个问题，模子给出一个回答，单次交互赔本的Token常常在几百到几千个之间。一朝用户罢手发问，赔本也就随之罢手。但进入智能体模式后，东谈主工智能运转在后台合手续奉行多法子任务。

　　上海一家算力芯片厂商的负责东谈主告诉记者，以编程场景为例，一个智能体在招揽到领导后，会履历编写代码、运行测试、识别报错、自我修正、再次运行的轮回，为了让机器记取此前的操作，每次调用皆需要佩戴完竣的对话历史。

　　比如，现在国产大模子诸如智谱GLM-5等新一代模子一经支合手200K（约20万Token）的超长高下文窗口。这种多轮自我修正和器具链级联的模式，使得单次活跃会话的Token浑沌量呈几何级数增长。

　　另外，多模态应用的落地则进一步推高了赔本量。凭据公开数据，年头爆火的Seedance 2.0视频模子生成一条10秒、1080p规格的视频，梗概需要赔本35万Token。

　　视频生成场景单元时辰内产生的Token赔本，是传统文本问答的数百倍。

　　“现时数万亿Token级别的调用量，已不再主要由测试性场景组成，而是由一批高频、范围化、可合手续付费的买卖应用所复旧。”弗若斯特沙利文（Frost & Sullivan）中国业务独揽结伴东谈主兼董事总司理陆景向经济不雅察报记者暗意。

　　陆景先容，从新豹筹商院对国内大模子买卖生态的调研来看，现在荟萃买单的范围主要包括互联网、金融、跨境电商与文娱行业。

　　具体场景则涵盖了以下三类：第一类是企业级应用，如智能客服、智能营销、代码扶助开发、办公自动化器具等，这类应用在金融、电商、游戏行业已已毕范围化部署；第二类是互联网平台中的生成式内容奇迹，包括智能搜索、对话式助手与编造变装；第三类是AIGC（东谈主工智能生成内容）分娩器具，如短视频剧本生成、告白案牍创作、跨境电商商品态状生成等。

　　这些行业的共同特征是，业务进程中存在高比例的文本或多模态内容生成需求，且企业偶然相接大模子奇迹产生的算力本钱。

　　2026年2月10日，在郑州举行的“国产万卡算力赋能大模子发展研讨会”上，中国科学院自动化所筹商员陈盈盈暗意，驱动行业发展的中枢能源依然是大算力、大数据与大参数。但跟着模子参数目增长带来的性能培植进入瓶颈期，行业正迈向智能体、合成数据和推理狡计，数据决定了东谈主工智能的高度，环境将决定模子演进的标的。

　　应用模式的改变，阐明了调用量为何飙升，那为何国产大模子又能在新的范式下，相接住来自民众高频的调用需求呢？

　　前述算力芯片厂商负责东谈主告诉记者，现在，MiniMax M2.5、Kimi K2.5等国产模子大皆摄取了“羼杂行家（MoE）”架构。与传统的郁勃模子（Dense Model）在每次运算时皆要激活一起参数不同，MoE架构通过按需激活特定的行家网络，使推理时的显存占用镌汰了约60%，浑沌量得到显贵培植。

　　郁勃模子的联想逻辑是，处置每一个输入肯求时，神经汇荟萃的每一个参数皆必须参与狡计。这意味着跟着模子范围的增大，所需的算力与显存支出会同步呈线性增长。

趣富配资

　　羼杂行家架构则改变了这种全量运算的模式，它将模子参数分手为多个功能组，即“行家”，在奉行具体任务时，路由系统会识别需求并只激活与之关联的部分参数。这种单干机制使得模子不错在保合手弘大参数目的同期，大幅镌汰单次推理所需的灵验算力。

　　时候上的优化径直反馈在了售价上。现在中国模子的输入价钱约为0.3好意思元/百万Token，而部分国际同类家具的价钱在5好意思元独揽。此外，电力本钱亦然一个变量，中国西部算力节点的电力本钱约为每度0.2元至0.3元，而西洋地区的本钱在1元至1.5元之间。

　　这种本钱上风促成了供需连络的再均衡。2026年春节时代，国产大模子迎来密集发布潮。2月11日，智谱上线底座模子GLM-5；2月12日，MiniMax开源文本模子M2.5；2月14日，字节逾越发布豆包大模子2.0系列，与此同期，大厂围绕AI应用的红包战同步打响：百度参预5亿元，腾讯元宝10亿元，阿里推出30亿元免单打算。

　　密集的应用落地也拉动了算力赔本的急剧攀升。公开数据清楚，中国日均Token赔本从2024年头的1000亿攀升至2026年2月的180万亿级别，在这种爆发式的需求驱动下，此前深陷价钱战的国内大模子厂商运转集体调头。

　　比如，2026年2月12日，智谱AI在发布新模子的同期，晓喻上调其API（应用法子编程接口）调用价钱，部分国际订阅价钱涨幅达到30%至60%，API调用价钱涨幅最高达到100%。智谱对此复兴称，用户范围与调用量快速培植，公司需同步加大算力参预。另外，2026十大正规配资app月之暗面旗下的Kimi K2.5发布不到一个月，其国际收入便卓绝了国内收入。

　　也即是说，大模子公司正在告别亏本引流的价钱战，运转有了实打实的业务收入。五万亿Token的流向标明，东谈主工智能正在从单纯的对话框，鼎新为金融、电商与编程场景中在后台自动运转的工业进程。

　　而顺着这股成倍增长的数据流往上游看，那些承载运算任务的智算中心，挑选算力硬件的眼神也发生了变化。

　　算力采购的规范变了

　　算力商场的中枢打算正在从篡夺狡计卡转向核算单元产出本钱。

　　2025年，中国GPU算力租出商场履历了价钱下调。比如，英伟达H100狡计卡的租出价钱从岑岭时的每小时90多元东谈主民币，跌至15元到20元；A100的价钱则降至每小时3元到5元。

　　这种价钱走势背后是采购逻辑的更迭。在大模子开发初期，由于高性能芯片稀缺，商场处于资源囤积阶段，追求的是单卡的算力峰值（FLOPS）。但当推理负载成为常态后，企业运转核算总领有本钱（TCO）。

　　“客户不再只盯着单卡的全皆算力峰值，而是运转狡计每参预一元钱能疏导几许浑沌量，每赔本一瓦电能处置几许Token。”前述算力芯片厂商负责东谈主向经济不雅察报记者暗意。

　　该负责东谈主以为，现时的算力需求呈现出推理与渲染的双重特征。除了文本生成，AI智能体云底座、云手机、数字孪生及工业仿真等场景对及时交互的需求，正在拉动对全功能GPU的采购。进入推理阶段之后，国产芯片迎来了切入窗口——试验阶段行业高度依赖英伟达的CUDA生态，而推理任务则更聚焦于能耗、贯通性和供应安全。

　　TrendForce集邦琢磨分析师龚明德在回复经济不雅察报记者采访时亦瞻望，2026年推理型AI奇迹器在全体出货结构中的比重有望培植至44%，相较于2025年上涨3个百分点。

　　龚明德以为，比较追求算力密度的大模子试验集群，推理型奇迹器在底层硬件架构联想上更肃肃性价比和能效比，推理端对高端封装（如CoWoS）和高带宽内存（HBM）的严苛条目有所下调。

　　在龚明德看来，这种规格的放宽，成心于中国脉土企业在取得HBM受限的情况下，发展中等范围算力的推理芯片，并在互联网、车载系统等范围提供契机。

　　跟着行业重点转向推理和微调，企业客户在筹谋智算中心预算时，参预结构也发生了改变。

　　对此，陆景分析称，夙昔在试验阶段，参预主要荟萃在高端试验型GPU集群、超高速互联网络以及高性能存储系统，以满足万古辰、高并行度的试验需求。而在推理需求增长的配景下，企业运转更多摄取推理优化型GPU、国产AI芯片或异构算力组合。在参预结构中，软件平台、算力诊疗、模子优化器具以及推理加速框架的占比邋遢培植。

　　陆景以为，国内东谈主工智能芯片在底层软件生态诞生方面，正处于由可用向范围化商用过渡的阶段，主要国产芯片厂商已构建起包括驱动层、编译器、算子库、运行时环境在内的基础器具链体系，偶然支合手大模子试验、推理及智算中心部署。

　　现在的算力采购也一经从单卡送测进入了系统级工程拜托阶段。由于推理任务对响应延长极其敏锐，万卡范围的集群在协同责任中，网络通讯和散热智商时时比单张狡计卡的“跑分”更具决定性。

　　2026年2月5日，国度超算互联网郑州中枢节点认真上线试运行。在这个节点上，部署了3套由中科晨曦（603019.SH）提供的scaleX万卡超集群，最大可提供卓绝3万张国产加速卡的算力，这是世界首个已毕3万卡部署且本色参预运营的国产AI算力池。

　　中科晨曦高等副总裁李斌告诉经济不雅察报记者，郑州中枢节点的上线，考据了国产算力基础设施的工程化智商，行业已从早期的单点冲破，转向大范围落地部署。此前各家厂商在硬件联想、软件栈和互连条约上自成体系，导致算力资源难以跨平台诊疗。

　　“万卡集群的落地不仅是IT时候问题，更是冷却、供电等跨学科的工程化挑战。”李斌强调，要是单点时候出现短板，会径直遭殃总共这个词系统的后果，现在的系统研制冲破了传统IT时候与其他工程时候的衔尾瓶颈。

　　现在，该国产算力系统已完成了千款应用的适配。凭据国度超算互联网郑州中枢节点运维主任安磊的先容，超算互联网第一期已有645家第三方商家适配了该节点，卓绝7200款软件和源码接入。

　　在这些资源的支合手下，已有卓绝70%的国产新能源汽车在该平台上进行流体和碰撞仿真实验，举例，针对国度新出台的范例可能条目禁用新能源车荫藏把手的变化，车企需要诳骗大集群模拟门把手改为洞开式后对能效与风阻的影响。

　　此外，该集群还复旧了国产羽绒服顶级面料的研发，以及为国际耗费品牌提供智算资源支合手其在国内的优化联想。

　　这种由卑劣应用爆发倒逼上游基建升级的逻辑，也正在振荡为国产芯片厂商的业务收入。比如，凭据2026年头中国挪动的东谈主工智能通用狡计拓荒集采甘休，在总价值卓绝50亿元的订单中，采购推理型AI奇迹器7499台。其中，华为昇腾系厂商斩获了34亿元的份额，昆仑时候等国产企业的占比显贵培植。

　　另外，国产算力厂商的功绩也在夙昔一年已毕了爆发性增长。比如，2月27日，寒武纪（688256.SH）发布的功绩快报清楚，2025年营收增长453.21%，达到64.97亿元，并已毕了20.59亿元的归母净利润，这是该公司上市以来的初度年度盈利，寒武纪暗意，收入增长受益于东谈主工智能行业算力需求的攀升，公司鼓励了应用场景的落地。访佛地，摩尔线程（688795）、沐曦股份（688802）、海光信息（688041.SH）2025年度的功绩发达亦均有大幅培植。

　　瀚博半导体首创东谈主兼CEO钱军则向经济不雅察报记者暗意，物理东谈主工智能正接近要道拐点，已毕旅途依赖于从编造到试验的闭环。瀚博半导体成立于2018年12月，是一家国产高性能GPU芯片提供商。

　　钱军暗意，图形渲染行为构筑仿真与数字孪生的基础，是衔尾东谈主工智能与物理世界的第一步，该公司已在AI推理与云渲染范围设立了基本盘，现在其家具已在超10家头部互联网公司、多家运营商和央国企落地。

　　凭据伯恩斯坦（Bernstein）发布的《2025年中国AI芯片产业阐述》，中国脉土AI芯片品牌商场渗入率已从2024年的约29%培植至2025年的42%。这也意味着，在数万亿Token合手续赔本的背后，国产算力通过对行业应用的适配和本钱结构的优化，正在完成从旯旮备选向商场首选的跨越。