"能不混就不混是当时的主流观点。"之江实验室副主任、浙江大学长聘教授何水兵在近日的智能体生态论坛上坦言,"但现在混合算力已经成为共识。"

这一转变背后,是AI行业从追求单一算力到拥抱多元异构算力的深刻变革。2025年,混合算力集群已从"权衡"选项转变为"必然技术选项",成为行业追求极致性价比的必由之路。

从"权衡"到"共识":混合算力的必然性

去年年初,建设混合万卡算力还是一种权衡;而今,异构AI系统已成为行业共识。这一转变源于AI模型快速迭代带来的算力需求激增。

"当DeepSeek把R1模型开源时,推理加速和强化学习成为新的必争之地,而当时国产加速卡的基础几乎为零;等到DeepSeek开源V3模型时,极低成本的训练把MoE模型架构推向了舞台中央,国产加速卡的训练效能需要重新爬坡。"何水兵指出,模型迭代速度远超硬件适配速度,单一算力架构已无法满足需求。

英特尔的实践印证了这一趋势。今年,英特尔将自家Gaudi 3加速器与英伟达B200 GPU结合,打造了高效的异构AI系统,将英伟达B200集群的推理极限提升高达70%。这一突破不仅验证了混合算力的可行性,更揭示了未来AI算力的发展方向。

技术护城河:从CUDA到"异构算力调度"

英伟达的CUDA已成为其技术护城河,开发者对其高度依赖。"CUDA是英伟达技术重要的'护城河',"何水兵指出,"而中国厂商正构建自己的'异构算力调度'护城河。"

"我们需要提供高效整合异构算力资源的算力平台,以及支持软硬件联合优化与加速的中间件,让异构芯片真正转化为大算力,"无问芯穹联合创始人兼CEO夏立雪表示,"包括把不同的模型在各类硬件上快速完成高效部署,让算法和算力之间形成最佳的软硬件联合优化协同。"

这种"异构算力调度"技术护城河,正在成为中国企业破局的关键。它不仅解决了算力资源的碎片化问题,更实现了算力价值的最大化。

算力混用的挑战与机遇

随着算力需求持续增长,算力混用比例正快速提升。图灵新智算创始人、董事长刘淼表示:"算力混用是未来不可阻挡的趋势,现在业内都在从需求出发,在智算集群的设计上看看如何使用异构算力调度这种技术,我们预计,异构(算力混用)的比例会越来越高。"

但挑战依然存在。无问芯穹数据显示,近5个月内,其日均Token调用量增长了5倍;9月,某图像生成智能体客户在4小时内Token调用量激增100倍,对算力调度提出了更高要求。

"AI创作体验进阶的背后,要求基础设施从聚焦推理效率提升,到为'长程任务与上下文管理、强化学习训练框架、多模态任务与资源调度'提供全面支撑。"LiblibAI联合创始人杨可嘉指出,"未来的智能体基础设施需要从模型算力调度向能力调度转变,能够针对不同时段、不同类型的应用需求进行算力的分部门、分时调用。"

未来:构建开放、统一、合作的生态

"智能算力的发展是一场涉及技术、生态和应用的全面竞赛,而建立开放、统一、合作的生态是我们共同破局的关键。"何水兵强调。

构建"混合算力"技术护城河,不仅需要技术创新,更需要生态协同。中国不缺工程师、场景、技术,缺的是系统化方法论、流程、工具、人才和用户习惯的培养。

"要破解算力混用的技术难题,需要产业界各方及学界共同努力才能实现。"刘淼表示。

从"技术护城河"到"价值创造"

无问芯穹高管指出,"做算力运营这件事情本身的商业模式非常清晰,就是通过技术能力把算力变为一个标准化的产品,然后再对它进行一个单位化的定价,并产生规模化的经济效应。"

这标志着AI算力已从"技术竞争"转向"价值创造"。当算力成为标准化产品,企业可以更专注于应用创新,而非底层算力的争夺。

结语:构建"混合算力"技术护城河的中国路径

在AI技术快速发展的今天,"混合算力"已不仅是技术选项,更是战略选择。中国厂商通过构建"异构算力调度"技术护城河,不仅打破了英伟达CUDA的垄断,更实现了算力资源的高效利用与价值创造。

随着算力规模扩大,训练作业成本将随规模呈指数级增长,能耗成本也将显著增加。到2030年,全球GPU算力集群的电力消耗将突破1000Twh,占全球电力消耗比重增长至2.5%左右。

在这一背景下,构建"混合算力"技术护城河,已成为中国AI产业突破"卡脖子"困境、实现自主可控的关键路径。它不仅是技术的突破,更是生态的重构、价值的创造,代表着中国AI产业从"跟跑"到"并跑"再到"领跑"的必经之路。

当中国厂商成功构建"混合算力"技术护城河,我们看到的不仅是算力效率的提升,更是中国AI产业生态的成熟与自信。这将是AI时代中国技术崛起的重要里程碑。