存储"黑科技"之IBM CAS:单机承载千亿级向量数据库,打破 "1% 数据困局",实现企业级 RAG 规模化
最近,IBM研究院与英伟达(NVIDIA)、三星共同展示了一项内容感知存储系统(content awareness storage1。该系统在单台服务器上成功支持千亿级别向量的存储与检索,平均查询延迟为694毫秒,召回精度达90%。系统硬件组合为IBM Storage Scale System 6000全闪存设备、六颗英伟达H200 GPU以及48块三星30.72TB容量的PCIe Gen5 NVMe固态硬盘。IBM Storage Scale System 6000 全闪存设备将计算与存储解耦,并通过英伟达 H200 GPU 加速索引重建,将原本基于 CPU 需耗时数小时的索引构建过程,缩短至 GPU 上的数分钟。
