随着中国新兴企业DeepSeek宣布以低成本开发出AI模型,图形处理器(GPU)的价格备受关注。有分析认为,DeepSeek使用的美国英伟达的GPU市场价格比美国企业使用的尖端产品便宜1~3成左右。似乎并不是极端便宜。
DeepSeek打破了之前的迷思,将算力消耗降了下来,为业界开辟了一个新思路。“这绝对是好事。”一位智算人士告诉数智前线,“ 如果真的按照那种算力无限膨胀、全国电力都给它的方式,确实不合理。产业本来就不应该是那个样子的 。” ...
有媒体认为这是当前预训练Scaling Law局限性的证据。就在不久前,更多算力(包括数据、GPU等),意味着更大规模的模型。而模型规模越大,性能越好。然而,随着每一代模型的推出,性能提升的幅度逐渐缩小,这也促使AI公司另寻他法,出奇制胜。
目前,英伟达GPU占据全球AI芯片市场约80%份额,其H100、A100系列产品被OpenAI、微软、Meta等企业广泛用于大模型训练,这给企业带来巨大的成本压力,同时,对单一供应商的依赖也可能制约技术迭代与产能稳定性。