英伟达为何持续押注VASTData？AI存储正在成为新的“算力”

英伟达为何持续押注VASTData？AI存储正在成为新的“算力”｜甲子光年

创始人

2026-05-18 20:47:18

0次

从300亿美元估值，看AI数据基础设施的重构逻辑。

过去两年，AI产业最受关注的关键词几乎只有一个：GPU。

无论是 OpenAI、xAI，还是Meta、Anthropic，所有AI竞赛最终似乎都指向同一个方向——谁拥有更多GPU，谁就拥有更强的AI能力。但如今，资本市场正在发生一个重要变化。越来越多AI基础设施公司开始意识到：真正决定AI系统效率的，可能并不是GPU本身，而是GPU背后的数据存储设施。

尤其是在超大规模AI训练和推理场景下，一个越来越现实的问题开始浮现：

GPU越来越贵；
集群规模越来越大；
模型参数越来越庞大；

但大量 GPU，却正在“等数据”。在这样的背景下，AI 数据基础设施公司 VAST Data完成约10亿美元F轮融资，估值升至300亿美元，英伟达继续参与跟投。这家成立不到十年的公司，已经成为全球 AI 基础设施领域最受关注的企业之一。资本市场真正重新评估的，并不仅仅是一家“存储公司”。而是：AI时代，数据存储正在从后台基础设施，变成新的生产力核心。

1.为什么英伟达持续押注 VASTData？

很多人看到 VASTData，第一反应仍然是：“它是一家高性能存储公司。”但如果仅仅这样理解，就很难解释：

为什么英伟达会持续下注这家公司。因为今天 AI 产业真正的矛盾，已经不再只是“GPU不够”。而是：GPU越来越强，但数据存储系统越来越跟不上。在超大规模 AI 训练场景中，GPU 利用率并不一定高。换句话说，AI 训练已经不再是“单纯算力竞争”。而是 GPU、网络、存储、数据调度共同组成的超大规模并行系统竞争。这也是为什么越来越多 AI 厂商开始发现：AI 时代最大的浪费，可能不是 GPU不足，而是 GPU 在等待数据。

于是，AI 基础设施开始从“算力中心”，逐渐走向“数据中心”。而 VAST 真正的价值，也并不只是“存储性能”。它真正重要的地方在于：它试图重构 AI 时代的数据基础设施。

AI时代核心指标	重要性
吞吐能力	决定 GPU feeding 效率
低延迟	决定推理实时性
高并发	决定多租户 AI 效率
Metadata能力	决定海量小文件处理能力
数据调度能力	决定 AI 整体资源利用率

事实上，今天的英伟达，也早已不再只是 GPU 公司。从 Mellanox 网络，到 BlueField DPU，再到 NVLink、Spectrum-X、AI Factory，英伟达正在构建完整 AI 基础设施体系。黄仁勋曾多次提到：未来的数据中心，本质上会变成“AI Factory”。而 AI Factory 的核心，并不仅仅是 GPU 算力。而是数据能否持续、高速、稳定地供给 GPU。

这一观点，黄仁勋在 CES 和 GTC 上更是进一步明确表态：“KV Cache 的激增足以催生一个全新的存储市场”。这也是 GPU 厂商首次公开表态，“计算已不再是最稀缺的资源，数据供给才是核心关键”。AI 产业正从“训练为王”向“推理为王”发生阶段性转变。为了应对这一转变，英伟达推出了CMX（即G3.5层）架构，专门解决“推理太贵”的行业痛点：当 KV Cache 从显存溢出到存储池，推理成本的核心矛盾便从“算力贵”变成了“数据供给贵”，而 CMX 架构的核心就是将存储性能与 GPU 计算进行深度绑定，这套玩法本质上是“极致协同设计”——存储不再是外挂硬盘，而是 GPU 系统的延伸，这也正是英伟达越来越重视 AI 存储赛道的核心原因。

与此同时，越来越多全球头部 AI 公司与大型机构，也开始选择 VASTData 作为其 AI 数据存储底座。在大模型与 AI 云领域，VASTData 已服务 xAI、CoreWeave、Lambda、Core42 等明星 AI 基础设施企业。其中，CoreWeave 更将 VAST 作为其全球 AI Cloud 的核心数据平台，双方达成了高达 11.7 亿美元的长期合作协议。而 VAST 的客户版图，也早已不局限于 AI 创业公司。

从 NASA、美国能源部、美国空军，到 Boston Children’s Hospital、Booking Holdings，越来越多科研机构、政府部门与大型企业，都开始采用其数据平台。这背后反映出的，是 AI 数据存储需求正从模型公司，快速扩展至科研、医疗、金融、政府等更广泛行业。更重要的是，这些客户选择 VAST Data 的原因，已经不再只是“高性能存储”。

2.VASTData 真正的价值：面向 AI场景的统一数据平台

长期以来，传统存储系统服务的核心对象，主要是数据库、虚拟化、企业应用。它们强调的是稳定性、容量、数据可靠性、成本控制、分层存储 RAID 保护。随着 AI 训练、推理、RAG 与 Agent 系统的快速发展，但 AI 场景彻底改变了这一逻辑。

大模型驱动的数据系统，不再是“静态存储”，而是一个持续运行的数据流系统，其核心负载包括：

PB 级训练数据的持续读取
海量小文件与非结构化数据
GPU 集群高并发访问
训练过程中的 checkpoint 快速写入与恢复
推理阶段的低延迟实时访问
KV Cache 等动态缓存数据
多模态数据统一管理与检索
数据集版本迭代与生命周期管理

在这一体系下，传统存储架构的边界逐渐显现：它可以“存数据”，但难以“持续供数据”。这也是 VAST Data 的核心价值所在。它并不是在做“更快的存储系统”，而是在尝试构建一套：面向 AI工作负载的统一数据平台（Unified Data Platform for AI）。其本质是把训练、推理与数据管理三类原本割裂的系统，统一到同一个数据底座之上：

在训练阶段，提供高吞吐、低延迟的数据供给能力，保障 GPU 持续满负载运行，避免 I/O 瓶颈

在推理阶段，支持低延迟随机访问与 KV Cache 加速，满足高并发实时请求

在数据层面，实现多模态数据统一管理、共享与复用，减少跨系统数据搬运

在生命周期层面，支持数据版本管理与持续迭代，适配模型不断更新的需求

也正是在这个意义上，存储正在从传统基础设施角色中抽离出来，逐步演变为：

AI训练 + 推理 + 数据治理一体化的数据基础设施层。而这，才是 VASTData 被资本市场高估值看好的核心逻辑。

3.国内有对标 VASTData 的厂商吗？

如果说过去几年，中国 AI 产业最受关注的是“大模型”，那么未来几年，一个更底层的问题将越来越关键：中国能否建立自己的 AI 原生数据基础设施体系？因为 AI 时代，GPU 可以采购，模型可以开源，但真正决定 AI 训练与推理效率的，正在变成底层数据系统能力。尤其随着国产化趋势加速，这已经不只是技术问题，更成为中国 AI 产业必须补齐的基础能力。

过去，中国存储产业长期服务于政企、金融、云计算、数据库等传统场景，产品能力更多围绕容量、可靠性和成本展开。但 AI 场景第一次对存储提出了完全不同的要求——它需要存储系统具备持续、高并发、低延迟的数据供给能力，本质上是在解决“GPU 等数据”的问题。这也催生了全球存储架构路线的重新洗牌，国内开始涌现出一批向 AI 原生架构演进的厂商。

值得注意的是，当前 AI 场景下，真正成为核心的数据存储底座，其实是文件存储。因为无论模型训练还是推理，底层都需要频繁访问海量非结构化数据，包括文本、图片、视频以及各类多模态数据。相比对象存储与块存储，文件存储在并发访问、元数据管理、数据一致性等方面，更适合支撑 AI 训练与推理过程中 GPU 的实时数据交互需求。这也是 VASTData 重点布局的核心方向。

在国内，一批面向 AI 原生架构演进的厂商正在出现。其中，焱融科技是较早聚焦 AI 原生文件存储的厂商之一，目前已服务包括智谱AI、小米汽车、文远知行等 AI 与自动驾驶场景客户。但真正对标 VAST Data，并不只是“做高性能存储”，而是能否构建面向 AI 的统一数据平台能力。这背后至少包含三个核心能力：

1.极致性能与稳定可靠性。AI 集群本质上是一个持续吞吐数据的系统。存储需要在高可靠基础上，提供超高带宽、低延迟与海量并发能力，持续支撑大规模 GPU 集群的数据供给，避免 GPU 空转。

2.统一数据管理与生态兼容能力。AI 数据天然是多模态、海量且动态变化的。存储系统不仅需要实现统一管理、版本追溯与高效调度，还需要兼容不同 AI 框架、GPU、网络与协议，打破数据孤岛。

3.云原生弹性扩展与存算协同能力。AI 集群规模增长极快，存储必须具备 Scale-out 横向扩展能力，实现在线扩容。同时，越来越多能力开始向存储侧下沉，通过“以存代算”减少数据迁移损耗，提高训练与推理效率。

焱融科技全栈AI存储产品体系，图片引用来自官方

从技术路线看，焱融科技与 VASTData 已经呈现出明显相似性。双方都在围绕 AI 数据流构建统一数据平台，并持续强化：

GPU 高吞吐数据供给；
RDMA 高速网络；
全闪 Scale-out 架构；
多协议统一访问；
海量并发处理；
AI 数据流调度能力。

围绕 AI 训练与推理链路，焱融科技目前形成了三类核心产品能力：

首先是面向 AI 训练场景的 YRCloudFile。该产品针对 AI 训练负载进行深度优化，提供高带宽、低延迟的数据访问能力。其全闪一体机 F9000X 在 MLPerf Storage 基准测试中取得领先成绩，验证了其在大规模 AI 训练场景下的工程能力。

其次是面向推理场景的 YRCache。随着大模型推理时代到来，KV Cache 正成为新的数据热点。YRCache 主要面向推理阶段的数据缓存与调度，降低推理延迟，提升并发效率。

第三则是 DataInsight 全域数据管理平台，用于实现多模态数据统一管理、版本追溯与运维监控，覆盖 AI 数据全生命周期。

相较于 VASTData，焱融科技最大的独特优势，也是中国市场独有的核心变量——自主可控。尤其是在 DeepSeek 全面推动国产芯片适配之后，一个明确的趋势正在显现：AI 基础设施国产化，已经从“可选项”变成“必选项”。而在这一过程中，底层存储系统恰恰是与国产 GPU 耦合最深的基础设施之一。

AI 存储的国产适配绝非简单兼容芯片，更需要完成 RDMA 协同、GPU 通信优化、并行 IO 调优、AI 框架适配、大规模集群稳定性验证、国产生态兼容等多层深度适配。而焱融科技过去几年的研发投入，恰好集中在这些核心领域，在高性能分布式文件存储、AI 训练场景优化、国产化适配方面，其技术路线已逐步接轨国际顶尖 AI 原生存储水准，成为国产 AI 存储赛道的核心力量。

VAST Data 300 亿美元估值背后，被资本市场重新定价的，本质上已经不是传统“存储公司”，而是 AI 时代的数据基础设施能力。、因为当 GPU 集群进入万卡时代后，真正决定 AI 效率的，已经不只是芯片性能，而是数据能否被持续、高速、稳定地供给。未来 AI 基础设施的竞争，也许不再只是 GPU 数量的竞争，而是谁能建立更高效率的 AI 数据底座。AI 时代，存储产业正在迎来一次新的价值重估。

（封面图来源：焱融科技）

推理數據公司核心訓練 Factory VASTData 存儲黃仁高性能英偉達基礎設施 Data 焱融科技

上一篇：原创人死后为什么要烧纸？流传几千年的文化，难道仅仅只是迷信？

下一篇：257. 古董老枪是如何装弹的？

英伟达为何持续押注VASTData？AI存储正在成为新的“算力”｜甲子光年

相关内容

热门资讯