查看内容

算力“黑洞”逼近：你的每一次AI对话，都暗中标好了价格
== 2026/5/7 16:39:18 == 热度 191

、6160分，而之前是1080分、15000分。这意味着，用户花同样的钱，到账积分却大幅缩水，相当于变相涨价。且有创作者反映，原先会员价首年5折优惠，现在则将首年优惠折扣调整为6折。然而，Token计价的上调，只是冰山浮出水面的部分。水面之下，真正的成本地基——硬件，正在经历一场更为剧烈的涨价潮。GPU方面，英伟达H100的一年期租赁价格已从2025年10月的低点约1.70美元/小时，涨至2026年3月的2.35美元/小时，涨幅近40%；Blackwell系列芯片的单小时租金更高达4.08美元，较两个月前上涨48%。按需租赁容量在所有GPU类型中均已售罄。即便是消费级显卡，如英伟达RTX 5090，也一卡难求，溢价数倍。“GPU的成本确实决定了算力的成本，也就间接掌握了算力定价权。”GPU厂商砺算科技的一位资深产品经理对记者表示，“以DeepSeek-V4 Pro为例，每百万输出Token收费三块多美元，这个价格就是主要由数据中心的建设成本决定的，这里面包含三块成本：数据中心租赁及托管费用，服务器费用和能耗费用，其中GPU属于服务器费用里比较大的一部分，如果是每张10万元的数据中心级GPU，那么其成本大约占到了总成本的近一半。”存储方面，HBM（高带宽内存）是AI训练与推理的核心瓶颈之一。据TrendForce数据，2026年第一季度HBM价格同比翻倍，供应持续紧张。三星、SK海力士、美光虽在扩产，但产能爬坡速度远跟不上智能体驱动的需求爆发。服务器与网络组件同样面临成本上行。先进封装产能吃紧，光模块、交换机等互联部件也在供需失衡中涨价。这意味着，算力成本上涨，并非仅由“模型调用更频繁”驱动，而是从芯片、存储到数据中心整条供应链的价格重估。Token单价的调高，成了这条成本传导链路的最后一站。而这些，最终都会写进消费者的订阅费里。AI产业链重构：效率决胜算力计价从粗放到精算的转折，不只影响云厂商和企业的账单，更在深层改写整个AI产业链的成本结构与竞争逻辑。新的游戏规则已经清晰：效率和性价比，才是智能体时代的生存法则。“我们虽然没有设立‘Token Hub’这样的事业群，但已从技术架构与产品矩阵全面拥抱这一变化。”优刻得产品负责人表示。他透露，客户在选择推理服务时，除了价格，还会紧盯三个硬指标：首Token延迟（TTFT）、端到端吞吐量（TPM）以及推理稳定性——延迟抖
=*=*=*=*=*=
当前为第3/4页
下一页-上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页