5版 公司  查看版面PDF

2026年

6月17日

查看其他日期

竞争加剧+成本下降 Token迎降价潮

2026-06-17 来源:上海证券报
  郭晨凯 制图

◎记者 罗茂林

今年以来一路走高的Token(词元)价格迎来反转。进入6月,全球多家大模型厂商开始重新调整Token价格,包括OpenAI在内,多家大厂先后被曝将下调Token价格,以回应企业用户对AI成本暴涨的不满。

然而,相较此前声势浩大的推广潮,此次Token价格下调更像是行业新一轮残酷竞赛的序幕。多位市场人士分析称,随着OpenAI及Anthropic等一批头部AI厂商陆续推进IPO,市场对AI公司的估值模型正在调整,能否用更低成本持续获取更多用户,成为每家公司必须面对的考验。

竞争加剧 Token迎降价潮

进入6月,Token价格开始逆势下跌。日前,头部AI公司OpenAI被曝将于6月启动新一轮调价,计划大幅下调Token计费标准。对于此次降价,外界认为将是一场面向对标竞品Anthropic的行动,目的在于争夺企业级客户。因此,不少业内人士预计,Anthropic或将跟进降价。

事实上,不仅是国际AI巨头,本月初国产大模型DeepSeek正式执行V4系列模型调价,将Token价格下调至原标价的1/4。按照官方公告,DeepSeek-V4-Flash的输入缓存命中价格是每百万Token 0.02元;V4-Pro每百万价格为0.025元。

“这成本几乎比生产对应Token所需要的电费还便宜。”一位资深AI创业者告诉上海证券报记者,作为比较,在今年4月前,Open AI最新模型每百万Token的综合成本是30美元,“前者价格相当于后者的百分之一,是量级的差别了”。

紧随其后,小米宣布MiMo-V2.5系列大模型完成调价,部分版本降幅高达99%,同时取消按上下文窗口分段计价的规则,并且Token Plan用量直接提升到原来的5倍至8倍,这意味着其每百万Token成本基本看齐DeepSeek。

6月16日,字节跳动旗下火山引擎上线Seedance 2.0 mini视频生成模型,其图生视频定价为每千Token 0.023元,视频生视频定价为每千Token 0.014元,这一定价较Seedance 2.0明显降低。此外,近期腾讯云也发布公告,大模型服务平台TokenHub将于6月15日起下调MiniMax-M3模型价格,推理输入、推理输出及缓存命中费用均下调50%。

有意思的是,今年4月,小米MiMo团队负责人罗福莉曾公开反对打价格战。她认为,低价卖Token并开发第三方框架的行为,看似吸引用户,最终会损害用户体验。

不过,也有技术工程师告诉记者,此轮Token价格的下调与罗福莉的观点并不矛盾:“她强调的是之前模型本身性能不足,不顾成本消耗Token的行为,但现在通过模型和上下文压缩等技术,Token的效率有所提升。”

价格大考来临 行业洗牌加速

从某种意义上讲,此轮降价更像是行业即将面临的一场商业大考。多位业内人士表示,随着越来越多AI公司步入资本市场,用户规模、实际效益等关键数据的分量越来越重。

“今年以来最明显的变化就是,企业端对于AI的真实需求在变多,它构成了真实的商业订单。”北京某AI大模型独角兽公司公共事务负责人对记者表示,尤其是今年以来Cloud Code崛起,大模型“编程能力”被越来越多企业看到,催生了这一轮Token用量的暴增。

以Open AI披露的数据为例,该公司最大的Token消耗者每月使用量约为1000亿Token,而在6年前,这一数据仅为10万。然而,在企业真实需求增长的同时,Token价格高企的问题日益凸显。据报道,不少美国互联网巨头在近几个月纷纷收紧了对Token使用的预算限制。

记者注意到,不少国内头部互联网公司对Token使用的态度也开始转向:从限制用量到对Token使用仅提供部分报销,显然高昂的成本让不少大公司都有些吃不消。

“模型竞赛基本到了头部决胜阶段,资本需要看到增长,这里面很重要的就是企业端用户规模。”上海某券商计算机首席分析师告诉记者。另一位某头部互联网公司AI负责人对记者坦言,竞争走到这一步,性能之争基本结束,性价比将成为重点。

但有意思的是,对不少头部公司而言,这场降价并非突如其来,相反更像一场预言的兑现。多位技术人士告诉记者,当前影响Token价格的因素无外乎两个:模型本身技术能力、硬件侧成本控制。眼下,这两个方面都在迅速突破。

在技术侧,对稀疏注意力等技术的持续优化,正在让Token消耗不断降低。以DeepSeek为例,此次最新模型公布的技术突破中就包括压缩稀疏注意力机制(CSA)和高压缩注意力机制(HCA),这两者都能大幅优化Token在单次任务中的使用。

记者注意到,包括月之暗面KiMi、小米MiMo在内,近期多款国内大模型披露的产品创新性论文中均有类似技术。

在硬件侧,按照业内共识,Token在硬件端最终的变数取决于两方面:芯片成本和电力成本。随着国家“东数西算”工程的持续推进,在不少绿电能源丰富的节点城市,电价和机房租用的成本都在大幅下降。以内蒙古乌兰察布为例,记者调研发现,包括华为、阿里、快手等国内厂商均在加快布局。

某算力中心当地运营负责人透露,由于厂商与算力中心的服务合约中电费占据大头,且多为长年合同,随着电价以及综合服务成本的快速下降,厂商Token生产的实际成本明显回落。此外,多位算力中心人士对记者表示,今年以来国产芯片产能逐步提升,其价格也在回落,带动Token成本进一步下降。

但显然,并非所有的大模型公司都能撑住此轮的价格冲击。有AI行业资深观察人士直言,部分企业实际上是在被动降价。