算力“黑洞”逼近:你的每一次AI对话,都暗中标好了价格
== 2026/5/7 16:39:18 == 热度 191
、6160分,而之前是1080分、15000分。这意味着,用户花同样的钱,到账积分却大幅缩水,相当于变相涨价。且有创作者反映,原先会员价首年5折优惠,现在则将首年优惠折扣调整为6折。然而,Token计价的上调,只是冰山浮出水面的部分。水面之下,真正的成本地基——硬件,正在经历一场更为剧烈的涨价潮。GPU方面,英伟达H100的一年期租赁价格已从2025年10月的低点约1.70美元/小时,涨至2026年3月的2.35美元/小时,涨幅近40%;Blackwell系列芯片的单小时租金更高达4.08美元,较两个月前上涨48%。按需租赁容量在所有GPU类型中均已售罄。即便是消费级显卡,如英伟达RTX 5090,也一卡难求,溢价数倍。“GPU的成本确实决定了算力的成本,也就间接掌握了算力定价权。”GPU厂商砺算科技的一位资深产品经理对记者表示,“以DeepSeek-V4 Pro为例,每百万输出Token收费三块多美元,这个价格就是主要由数据中心的建设成本决定的,这里面包含三块成本:数据中心租赁及托管费用,服务器费用和能耗费用,其中GPU属于服务器费用里比较大的一部分,如果是每张10万元的数据中心级GPU,那么其成本大约占到了总成本的近一半。”存储方面,HBM(高带宽内存)是AI训练与推理的核心瓶颈之一。据TrendForce数据,2026年第一季度HBM价格同比翻倍,供应持续紧张。三星、SK海力士、美光虽在扩产,但产能爬坡速度远跟不上智能体驱动的需求爆发。服务器与网络组件同样面临成本上行。先进封装产能吃紧,光模块、交换机等互联部件也在供需失衡中涨价。这意味着,算力成本上涨,并非仅由“模型调用更频繁”驱动,而是从芯片、存储到数据中心整条供应链的价格重估。Token单价的调高,成了这条成本传导链路的最后一站。而这些,最终都会写进消费者的订阅费里。AI产业链重构:效率决胜算力计价从粗放到精算的转折,不只影响云厂商和企业的账单,更在深层改写整个AI产业链的成本结构与竞争逻辑。新的游戏规则已经清晰:效率和性价比,才是智能体时代的生存法则。“我们虽然没有设立‘Token Hub’这样的事业群,但已从技术架构与产品矩阵全面拥抱这一变化。”优刻得产品负责人表示。他透露,客户在选择推理服务时,除了价格,还会紧盯三个硬指标:首Token延迟(TTFT)、端到端吞吐量(TPM)以及推理稳定性——延迟抖
=*=*=*=*=*=
当前为第3/4页
下一页-上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页