币安官方注册地址更新！英伟达发布ICMS平台，存储革命引爆NAND闪存热潮

2026-01-25 币界百科

在1月5日的2026年国际消费电子展（CES）上，英伟达首席执行官黄仁勋发布了名为“推理上下文内存平台”（ICMS）的全新硬件系统，旨在应对人工智能推理阶段爆发式增长的数据存储需求。这一创新标志着AI硬件架构重心正从算力堆叠转向高效上下文存储，预示着NAND闪存和SSD将接棒HBM，成为下一波增长引擎。

《韩国经济日报》于1月24日报道，黄仁勋在演讲中展示了一台神秘的黑色机架——即“推理上下文内存平台”（Inference Context Memory Platform, ICMS）。这并非普通升级，而是一次针对AI推理瓶颈的关键突破。记者敏锐指出，这可能是继HBM之后，存储行业的下一个爆发点。

该平台核心目标是解决AI推理中的“KV缓存”问题。随着生成式AI从学习转向大规模推理，尤其是多模态应用扩展，所需处理的数据量呈不规则且爆炸式增长。现有GPU显存与服务器内存已难以承载海量键值缓存，导致性能受限。为此，英伟达引入专用数据处理单元（DPU）与海量固态硬盘（SSD），构建起一个高速、大容量的缓存池，打破物理边界。

KV缓存爆炸式增长引发存储焦虑

韩媒文章强调，黄仁勋推动ICMS的核心动因在于“KV缓存”的激增。在AI推理时代，键值缓存是理解对话上下文、进行逻辑推演的关键。例如，当用户提问关于G-Dragon为何成为时代偶像这类主观问题时，AI需调用历史对话与模型内部数据进行权重分配与推理，避免重复计算与幻觉输出。

随着应用场景深化，数据量持续非线性攀升。若每次推理都重新计算，效率将大幅下降。因此，建立一个可重用、高可用的缓存机制成为刚需。仅靠昂贵的HBM或常规DRAM已无法满足未来需求，一种能承载巨量数据且保持低延迟访问的专用存储平台应运而生。

DPU驱动的9600TB巨量空间

据韩媒披露，ICMS平台采用新型“BlueField-4”DPU作为数据调度中枢，扮演类似“行政后勤官”的角色，有效减轻CPU负担。单个标准机架配备16个SSD托架，每个托架集成4个DPU，管理600TB SSD容量，总计高达9600TB。

相比之下，一套8机架的VeraRubin GPU平台总SSD容量约为4423.68TB。黄仁勋表示，借助该平台，虚拟内存容量从此前的1TB提升至16TB。同时，凭借BlueField-4的性能跃升，平台实现每秒200GB的KV缓存传输速度，有效破解大容量存储网络瓶颈。

开启NAND闪存黄金时代

ICMS平台以高性能SSD为核心，直接利好NAND闪存制造商。过去几年，尽管AI热度持续，但焦点集中于HBM，NAND与SSD未获同等重视。

英伟达将此平台定位为介于本地存储与外部存储之间的“第3.5层”。相比耗电高、成本高的DRAM，由高性能DPU管理的SSD具备大容量、高速度、断电不丢失等优势，成为存储KV缓存的理想方案。

这对三星电子与SK海力士构成重大利好。ICMS对存储密度要求极高，预计企业级SSD与NAND闪存需求将迎来量价齐升。此外，英伟达正在推进“Storage Next”（SCADA）计划，目标是让GPU绕过CPU，直接访问NAND闪存，进一步消除数据传输延迟。

SK海力士已迅速响应。公司副总裁金天成透露，正与英伟达合作开发名为“AI-N P”的原型产品，计划基于PCIe Gen 6接口，于2024年底推出支持2500万IOPS的存储设备，并预计2027年底前将性能提升至1亿IOPS，达到当前固态硬盘速度的十倍以上。

随着各大厂商加速布局，NAND闪存与SSD有望在AI推理时代迎来新一轮周期性繁荣。

随着市场变革加剧，选择安全高效的交易平台至关重要。币安提供多币种交易、低手续费和稳定服务，用户可通过官网或App下载快速注册，畅享便捷投资体验。对于希望参与加密资产交易的用户，可以选择在Binance等知名平台进行注册和交易。币安官方注册地址、最新地址及入口下载均已在官网同步更新，确保用户安全合规接入。

以下是韩媒文章全文，由AI翻译：

英伟达首席执行官黄仁勋在2026年国际消费电子展(CES)上发布了一个神秘的内存平台:“推理上下文内存平台”。今天,《科技与城市》栏目将深入探讨它究竟是什么。

关键词:KV缓存

在5日(当地时间)于拉斯维加斯举行的NVIDIA Live大会上,NVIDIA首席执行官黄仁勋在演讲结尾谈到了内存平台。我不禁竖起了耳朵。这会是下一个HBM吗?

今日之星:黑色机架式 NVIDIA ICMS(推理上下文内存存储)。图片来源:NVIDIA

首席执行官黄仁勋指着的是VeraRubin人工智能计算平台一角的一个黑色机架。这个机架,也就是我们今天故事的主角,里面存放着海量的存储空间。

首先,让我解释一下黄仁勋引入这项技术的原因。我们应该从“KV缓存”说起,黄仁勋CEO在官方场合经常提到它。读者朋友们,你们可能在最近关于GPU和AI硬件的文章中已经多次听到过KV缓存这个名字。

这个关键词在AI推理时代至关重要。它关乎AI理解对话上下文和高效计算的能力。我们举个简单的例子。假设你打开OpenAI的ChatGPT或Google Gemini,问一个关于韩国流行歌手G-Dragon的问题。

如果用户问的是G-Dragon的音乐、时尚或事业等客观信息,AI可以根据它学习到的信息回答。但是,聊了一会儿之后,用户突然问:“那他为什么会成为他那个时代的‘偶像’呢?”这就好比问了一个没有明确答案的论述题。这时,AI就开始推理了。

这就是KV缓存的关键所在:键和值。首先是键。我们很容易理解,但人工智能使用键向量来清晰地识别对话上下文中问题中的“那个人”是谁,以及答案的主题和目标(键)。然后,它会利用模型内部关于G-Dragon以及在与用户对话过程中收集到的各种数据(值)的中间计算结果,进行权重分配、推理,最终得出答案。

如果没有KV缓存,如果每个问题都像第一次一样重新计算,GPU将重复两到三次工作,从而降低效率。这可能导致人工智能出现幻觉和错误答案。然而,KV缓存可以提高效率。基于“注意力计算”的推理,会重用从与用户的长时间对话中获得的各种数据并应用权重,速度更快,对话也更加自然。

图片由 NVIDIA 提供

随着人工智能行业从学习向推理转型,这种键值缓存不再仅仅是辅助存储器。此外,所需的容量也在不断增加。

首先,随着越来越多的人将生成式人工智能融入日常生活,数据量的不规则激增不可避免。随着图像和视频服务的加入,对人工智能高级推理和想象力的需求将进一步增长,数据量还将呈爆炸式增长。

随着人工智能发现新信息的能力不断提升,它会在与用户的互动过程中,在各种场景下创建大量有用的键值缓存(KV缓存)。

面对键值缓存的爆炸式增长,NVIDIA 也对 GPU 流量进行了管理。他们将 GPU 分为两类:一类是大量生成键值缓存的 GPU,另一类是使用键值缓存的 GPU。然而,存储空间不足以存储所有这些缓存。

当然,服务器内部的内存容量很大。GPU旁边是HBM内存→如果不够用,就用DRAM模块→如果实在不行,甚至会在服务器内部使用SSD固态硬盘。然而,CEO黄仁勋似乎已经意识到,这种架构在未来的推理时代将难以驾驭。因此,他在CES上发布了这款黑盒子。

NVIDIA CEO 黄仁勋在 CES 2026 上推出 ICMS。图片由 NVIDIA YouTube 提供。

DPU 超大容量 SSD = KV 缓存存储专用团队

这台黑色服务器是“推理上下文内存平台”,简称ICMS。让我们仔细看看它的规格。

首先,驱动ICMS的设备是DPU,即数据处理单元。读者可能对GPU和CPU比较熟悉,但服务器的隐藏动力源——DPU也值得一看。

NVIDIA首席执行官黄仁勋发布了BlueField-4 DPU。图片由NVIDIA提供。

DPU(数据处理单元)就像军队中的行政后勤官。如果说CPU是连长,那么GPU就是计算突击队员。DPU负责弹药和食物的运送,甚至处理通信和移动,使CPU能够做出适当的决策,而GPU则专注于攻击。NVIDIA的新型DPU“Bluefield-4”被赋予了一项新任务:ICMS。现在,让我们仔细看看ICMS平台。这个机架总共包含16个SSD托架。

图片来源:NVIDIA

每个托架配备四个 DPU,每个 DPU 管理 150TB 的 SSD。这意味着一个托架总共有 600TB 的缓存 SSD。

这是一个相当大的存储容量。我们来比较一下。假设在 Blackwell GPU 服务器中,为了最大化 KV 缓存,我们在 SSD 放置区域安装了八个 3.84TB 的通用缓存 SSD。这样每台服务器就有 30.72TB 的 SSD,这意味着一个包含 18 台服务器的 GPU 机架的总 SSD 容量为 552.96TB。

也就是说,单个 ICMS 托架的缓存 SSD 容量可以超过一个 GPU“机架”所能容纳的容量。一个机架中的 SSD 总数为 600TB x 16,即 9600TB。这比一套完整的 VeraRubin 8 个 GPU 机架(4423.68TB,552.96 x 8)的 SSD 容量高出一倍多。

图片由 NVIDIA 提供

黄仁勋在CES演讲中表示:“以前GPU的内存容量为1TB,但通过这个平台,我们获得了16TB的存储容量。”

仔细想想,他的话似乎相当准确。一个完整的VeraRubin平台由八个GPU机架组成。每个机架有72个GPU,共计576张存储卡。将ICMS的总容量9600TB除以576张存储卡,得出约16.7TB。

虽然人们仍然担心服务器的物理距离和SSD的传输速度,但BlueField 4性能的提升缓解了这些问题。黄仁勋解释说:“我们实现了与之前相同的每秒200GB的KV缓存传输速度。”

此外,现有的GPU服务器存在网络瓶颈,限制了7.68TB和15.36TB等大容量SSD的充分利用。这项基于DPU的网络改进似乎正是为了解决这些问题。

被视为“零”的NAND闪存的黄金时代即将到来吗?

图片由 NVIDIA 提供

NVIDIA 将此平台划分为 3.5 个内存组。第一组是 HBM,第二组是 DRAM 模块,第三组是服务器内部的本地 SSD,第四组是服务器外部的存储。ICMS深入研究了介于第三组和第四组之间的神秘领域。与昂贵或耗电的 DRAM 不同,SSD 比硬盘速度更快、容量更大,即使断电也不会丢失数据(这得益于高性能 DPU),使其成为理想之选。

该平台显然为三星电子和 SK 海力士提供了巨大的商机。仅一个机架就能增加 9,600 TB 的容量,这意味着他们可以销售比现有 NVIDIA 机架多数倍的 NAND 闪存,而且这仅仅是按位计算。此外,这款产品的开发商是 NVIDIA,一家全球所有人工智能公司都梦寐以求的公司,因此商机更加巨大。

三星电子的服务器固态硬盘。即使人工智能时代已经到来,NAND闪存和固态硬盘的价格一直滞后,预计今年第一季度将出现大幅上涨。图片由三星电子提供。

过去三年,尽管人工智能市场发展迅猛,但NAND闪存和固态硬盘(SSD)并未受到太多关注。这主要是因为与在NAND闪存发展中发挥关键作用的HBM相比,它们的利用率较低。NVIDIA正从ICMS项目入手,筹备一个旨在进一步提升SSD利用率的项目。该项目是“Storage Next”(也称为SCADA,即Scaled Accelerated Data Access,规模化加速数据访问)计划的一部分。目前,执行AI计算的GPU将直接访问NAND闪存(SSD)来获取各种数据,而无需经过CPU等控制单元。这是一个旨在消除GPU和SSD之间瓶颈的大胆设想。SK海力士也已正式宣布正在开发AI-N P,以顺应这一趋势。 SK海力士副总裁金天成表示:“SK海力士正与NVIDIA积极开展名为‘AI-N P’的初步实验(PoC)。”

他解释说:“基于PCIe Gen 6、支持2500万IOPS(每秒输入/输出操作数)的存储原型产品有望在今年年底发布。”他还表示:“到2027年底,我们将能够生产出支持高达1亿IOPS的产品。”2500万IOPS是目前固态硬盘速度的10倍以上。