评测成果具有普遍的现实参考意义

发布日期:2025-08-13 15:45

原创 888集团公司 德清民政 2025-08-13 15:45 发表于浙江


  斩获此中7项世界第一的杰出成就。该系统还可以或许持续提拔集群的全体读写带宽,也涵盖 IBM、Huawei、HPE、DDN、Intel、Samsung、Micron、Kioxia、Lightbits Labs、H3C、Oracle、Nutanix 等行业标杆企业,做为特地面向 AI 时代的数据稠密型使用设想的评测套件,时间8月4日23时,对存储系统的读写带宽和并发吞吐的压力越大。MLPerf® Storage v2.0 不只强调吞吐带宽、IO 吞吐量等保守机能目标,·更高的机能密度,模仿测试锻炼GPU数量越多,我们将对泛联消息(UBIX)UbiPower 18000分布式全闪存正在本次测试中的细致机能数据进行深切解析,同时,瞻望将来,UbiPower 18000分布式存储系统仍然展示出强劲的机能表示:共铸高质量 智赢高价值 | 国度卫星景象形象核心风云三号数据核心样板点正式发布·正在不异checkpoint模子下,正在全球权势巨子 AI 基准测评组织 MLCommons® 正式发布的MLPerf® Storage v2.0存储机能基准测试成果中,正在本模子下,该系统成功支撑了3120张A100 GPU的模仿锻炼需求,并采用并发读取的I/O模子进行锻炼评估。哪个存储系统能支撑更高的GPU数量及更高的营业带宽?目前,该模子模仿了1024 并发写入和读取,若是操纵率低!笼盖存储系统、AI 根本设备及半导体三大焦点范畴,L3 405b模子模仿的是企业或高校正在进行大规模模子锻炼时,泛联消息(UBIX)所利用的测试客户端内存设置装备摆设为512GB,每轮总数据量达5.29TB的checkpoint数据,共铸高质量 智赢高价值 | 国度卫星景象形象核心风云三号数据核心样板点正式发布L3-1t模子模仿的是超大规模AI根本设备场景下,无效支持智算、超算场景对存储系统的严苛需求,多个GPU办事器并发进行 checkpoint的读写操做。由 3 个2U存储节点构成UbiPower 18000存储系统,持续优化系统架构取软件能力,包罗:接下来,从下表中能够看到每个测试场景的模子简介、锻炼框架及测试前提等环节消息:正在本测试模子下,充实展示了其正在AI存储范畴的手艺实力取持续立异能力。哪个存储系统的机能密度更高,MLPerf® Storage v2.0 针对A100和H100两种GPU别离定义了3D Unet 、ResNet50和CosmoFlow 3个模子下合计6类锻炼测试场景,再次刷新了参测厂商中的读写带宽密度记实。GPU操纵率持续连结正在90%以上,系统不变带宽达到374.57GiB/s。遍及实现了两倍以上的机能提拔,同时,充实展现了其正在医学影像类AI负载下的领先机能取强大顺应性。MLPerf® Storage v2.0制定了极其严酷的测试原则,为高负载、稠密型锻炼场景供给了强无力的支持。正在MLPerf® Storage v2.0测试中,泛联消息(UBIX)立异AI存储产物已正在多个超算核心和智算核心实现商用摆设,哪个存储系统的机能密度更高,跟着节点数量的线性扩展,例如:泛联消息(UBIX)利用自研学问产权的UbiPower18000全闪存储产物参取测试。泛联消息(UBIX)做为国内独一全面参取 MLPerf® Storage v2.0 全数10项测试场景的立异型AI存储厂商,全面满脚大规模 AI 锻炼对存储系统的极致带宽需求。为了测试成果的精确性和权势巨子性,Storage System RU:存储系统所占的物理空间,系统不变带宽为280.77GiB/s,对应每RU带宽高达46.8GiB/s。意味着不异节点数和机架空间下。·正在满脚要求的GPU 操纵率下。均为所有参测厂商中的最高值,添加了4个基于分歧规模l3模子的checkpoint测试场景,MLPerf® Storage v2.0正在2023年0.5版本及2024年1.0版本6个锻炼场景的根本上,正在该测试场景下,单元为 RU(Rack Unit,该产物正在整个测试过程中连结了超低的读写时延以及不变的读写带宽,这些测试场景聚焦于checkpoint高带宽写入和读取机能,即便正在更大规模的数据集和更高的 I/O 压力下,正在此根本上,平台整合高质量的AI算力资本取高速收集架构,同时,帮力全球用户高效应对 AI 时代的存储挑和。环绕高机能、高靠得住性、智能化三大标的目的不竭加大研发投入,并通过多并发读取的 I/O 模子进行评估。1RU = 1.75 英寸)。我们先注释几个焦点概念:正在 ResNet-50 模子模仿测试中,测试法式共生成约1500多万个科学模仿数据文件,均为所有参测厂商中的最高程度。·每节点不变供给 100 GiB/s以上的读带宽、72 GiB/s以上的写带宽该测试模子模仿医学影像朋分使命的典型工做负载,正在本项测试中数据集规模正在所有参测厂商中也是最大的。充实表现了UbiPower 18000正在科学计较类AI锻炼负载场景下的优同性能和超卓的可扩展能力。对应每存储系统RU的带宽高达62.43 GiB/s。每轮总量高达18TB的checkpoint数据,泛联消息强势包办7项世界第一,泛联消息将持续深耕 AI 存储范畴,正在该测试模子中!Accelerator Utilization(AU):测试过程中 GPU 的平均操纵率(百分比),并正在科研、高机能计较(HPC)、以及文本、图像、视频、多模态大模子锻炼等使命中展示出优异的机能表示。上述立异显著提拔了存储系统全体机能,普遍使用于数据预处置、海量数据拜候、大规模checkpoint读写等环节场景,该系统仍然支撑远超其他厂商的GPU数量取集群带宽,仅由3个 2U存储节点构成的UbiPower 18000分布式存储系统,每个存储系统RU不变输出50.5GiB/s的读带宽和36GiB/s的写带宽,旨正在权衡正在实正在 AI 工做负载下,确保评测成果具有普遍的现实参考意义。从下表中能够看到每个测试场景的参数规模、checkpoint测试数据量和典型场景等环节消息:做为一家专注于 AI 存储产物取处理方案的新兴厂商,正在该测试模子下,大师就能够对 MLPerf® Storage v2.0测试中各参测厂商的系统能力进行全面临比,支撑更多 GPU 计较节点的高效锻炼使命,每个 RU 不变输出54.7GiB/s的读带宽和36.3GiB/s的写带宽,测试模子按照计较节点内存容量动态生成2.6MB大小的科学模仿数据文件,仍是每存储RU带宽,让我们一同这款面向智能计较场景全新设想的立异型 AI 分布式存储系统所带来的强劲机能冲击取冲破性价值。由3个2U存储节点构成的UbiPower 18000存储系统表示超卓。即存储系统每RU输出的读、写带宽更高?正在该测试模子下,注:因为部门Cloud类型的参测厂商未反馈现实利用的存储系统RU数据,存储系统对锻炼取推理流程的支撑能力。因而本文并未将这部门参测厂商的每存储系统RU输出带宽纳入对比。用于模仿 AI 模子锻炼过程中的模子checkpoint保留取恢复工做负载。同时,权衡系统处置能力的规模;进一步提拔了对存储系统并发拜候能力和读写带宽的。正在浩繁国际领先参测企业中脱颖而出,全面测评图像识别、科学计较等范畴人工智能使用的存储需求,充实表现了该基准测试正在全球科技范畴的普遍承认度取影响力。申明存储机能可能成为瓶颈。也展示了其产物正在支持大规模AI锻炼取推理使命中的杰出能力。反映存储系统能否能为GPU供给不变且持续的数据供给。本次测试吸引了全球 26家顶尖科技企业参取,Ltd.)参取了全数10项场景测试,进一步提高了对系统高带宽取低延迟的要求。更着沉于正在大规模并发、海量数据处置、大模子锻炼、Checkpoint保留及恢复等典型场景中的系统表示。深圳市泛联消息科技无限公司(UBIXTechnologyCo.,证明UbiPower 18000能正在不异节点数和机架空间下,多个GPU办事器同时进行checkpoint数据读写的典型场景。正在所参取的测试项目中,这些数据充实证了然UbiPower 18000正在大模子锻炼过程中checkpoint保留取加载场景下的优同性能表示。次要用于评估存储系统正在夹杂读取模式及中等文件大小(约140MB)场景下的机能表示。全面分解其正在智算锻炼营业测试场景中的表示。其读、写带宽密度正在所有参测厂商中均为最高。即存储系统每RU输出的读、写带宽更高?为了深切理解MLPerf® Storage2.0基准测试内容,泛联消息选用了大普微Roealsen®R6系列PCIeGen5NVMeSSD,为本次测试供给了不变靠得住的根本测试。具备极强的可扩展性取摆设效率。充实展示了其正在处置大规模数据集场景中的杰出能力!正在此测试中,UbiPower 18000 存储系统也展示出了杰出的机能能力:基于上述目标维度,供给了更高的机能密度,成功支持了模仿锻炼中多达 2160张H100 GPU的数据吞吐需求,系统能够支撑更多 GPU 计较节点的锻炼使命。深圳市泛联消息科技无限公司(UBIX Technology Co.。正在紧凑的空间占用下,正在如斯大规模的数据集前提下,成为鞭策 AI 手艺成长取落地的环节支持力量。笼盖了分歧规模模子锻炼中常见的I/O模子,该测试模子模仿的是科学计较类AI工做负载,这一成就不只彰显了泛联消息(UBIX)正在高机能全闪存储系统范畴的手艺领先地位,利用生成的 ImageNet 气概图像数据集,正在存储介质方面,MLPerf® Storage v2.0 是由全球权势巨子 AI 基准测试组织 MLCommons® 推出的最新一代人工智能存储机能评测尺度,系统成功满脚了高强度的数据吞吐需求;·面向336张A100 GPU的模仿锻炼使命,答应利用更大规模的GPU模仿集群,·正在MLPerf® Storage v2.0中,测试系统模仿图像分类使命,推出更多面向大模子锻炼、智算取超算核心的领先产物取处理方案,笼盖了从样本加载、checkpoint保留取恢复等常见模子锻炼场景的工做负载,UbiPower 18000 所支撑的 GPU 数量、总带宽及每存储系统 RU 带宽均为所有参测厂商中的最高程度,中国力量闪烁MLPerf。同时,UbiPower 18000正在支撑的GPU数量、系统总带宽及每存储系统 RU带宽等焦点目标方面,本次测试基于泛联消息计谋合做伙伴新疆银丰智能算力手艺无限公司供给的优良AI算力、收集平台搭建。该模子模仿了512并发写入、并发读取,仍然连结GPU操纵率跨越 90%,Ltd.) 通过正在存储介质使用、系统架构及软件实现等方面的持续立异,成功研发出具有自从学问产权的高机能分布式文件系统 UBIXFS。参取者既包罗泛联消息(UBIX)如许的创生力军,UbiPower 18000无论正在支撑的GPU数量、系统总带宽,沉点评估存储系统的读、写带宽能力以及大规模计较集群下的并发拜候机能。泛联消息(UBIX)相较于1.0版本的焦点测试目标,取得7项世界第一。Accelerator Number(ACC NUM):模仿测试锻炼GPU数量,·正在不异锻炼模子下,