一、美国版故事:1.4 万亿美元“基建狂欢”
OpenAI 三个月内签下 1.4 万亿美元 GPU 订单,相当于印度尼西亚全年 GDP。钱从哪儿来?循环融资:A 轮投资人用 B 轮估值抵押,再向银行借钱买芯片,芯片跑出来的算力再卖给下一轮投资人。只要估值曲线向上,游戏就能继续——典型的“左脚踩右脚”式泡沫引擎。

二、中国版故事:4000 亿元人民币“私房钱”
瑞银统计,2025 年中国头部云厂商全部资本支出加起来 4000 亿元,仅为美国同类的 1/10。钱不是来自外部融资,而是阿里、字节、腾讯的“母体现金流”。
• 阿里 3800 亿元 AI 基建预算,全部来自电商与云业务的经营性现金流;
• DeepSeek 百亿级训练费用,由创始人上一轮量化对冲基金分红覆盖;
• 字节跳动豆包大模型,预算直接写进广告业务 ROI 考核表。
没有外部杠杆,就没有估值刚性兑付,也就没有“必须讲故事—必须更大故事”的死亡螺旋。

三、省钱不省性能:三条“土办法”对冲算力缺口

  1. 算法层做“时间换空间”
    用 MoE+动态剪枝,把同样参数量的模型推理能耗降 40%,落后一代的 A100 也能跑出 H100 80% 性能。

  2. 数据层做“质量换数量”
    医疗、电商、物流等垂直数据先喂给 13B 小模型,再蒸馏到 1.3B 边缘模型,用“小步快跑”方式把 90% 通用任务收敛到 1/10 算力。

  3. 工程层做“闲置换峰值”
    把电商大促凌晨 2–6 点的闲置算力切成 15 分钟颗粒,实时调度给大模型训练,全年额外挤出 8% 免费 GPU 小时。

四、结果:上架率 72%,美国却掉到 65%
发改委严控 IDC 电力指标,谁有真实订单谁拿配额。2025 年中国核心机房上架率 72%,连续六个季度稳定;美国部分超建区域却出现 65% 空置。
“算力紧缺”在中国成了护城河:客户排队等上架,云厂商有底气涨价 15%,ROI 直接回正。

五、应用层提前变现:广告、云、智能体“三连击”
• 阿里妈妈 AI 原生广告,CPM 溢价 35%,一季度贡献 60 亿元增量收入;
• 腾讯云混元大模型 API 调用量环比 +180%,首次覆盖掉训练折旧;
• 字节豆包智能体,让 40% 短视频脚本由 AI 生成,创作者 MCN 成本降 25%。
当美国同行还在讨论“如何向 C 端收 20 美元/月”时,中国已经把 AI 变成广告系统、云服务、内容生产的“隐形税”。

六、投资者的新公式:
美国 AI 估值 = 算力军备 ÷ 故事半径²
中国 AI 估值 = 经营性现金流 × 垂直数据密度
前者对利率极度敏感,后者对场景极度敏感。全球资金开始重新定价:同性能大模型,中国公司 PS 只有美国 1/3,却提前实现正向经营现金流,稀缺度反而更高。

七、留给市场的 18 个月窗口
瑞银预测 2026 年中国模型能力全面对齐 GPT-5,但资本支出仍只会增至美国的 1/8。一旦国产 7nm 集群规模出货,边际训练成本有望再降 30%。届时“省钱+赚钱”双飞轮成型,中国 AI 资产可能从折价直接变溢价。观望者只剩下两条路:要么现在学会用 ROI 模型选公司,要么 18 个月后高价追“中国性价比”。

结语
泡沫的本质是烧钱速度超过赚钱速度。当美国用杠杆把 GPU 堆成摩天大楼,中国用现金流先盖了一层可出租的“商铺”——而且已有人排队交租。十倍省钱不是吝啬,而是把资源集中在商业闭环最快的赛道。谁先跑出正向现金流,谁就拥有下一轮技术爆炸的门票。中国 AI 没烧钱,却烧对了节奏:跳过泡沫期,直接进入“自我造血”时间。