储迅推出针对DGX的AI存储产品
随着人工智能(AI)技术的迅猛发展,越来越多的行业需要用到深度学习集群。NVIDIA不仅仅提供用于AI计算的芯片、GPU卡,也提供了GPU服务器的整体解决产品——DGX。目前有DGX STATION、DGX-1、DGX-2等几款产品。DGX是用于深度学习的性能怪兽,也非常稳定,是AI行业的用户最受关注的GPU服务器产品。工欲善其事,必先利其器,对于预算充足的项目,用户十分愿意基于DGX搭建深度学习集群。
深度学习对于数据存储的需求也日益增大。DGX-1内置了4块1.92TB的SSD,DGX-2也内置了8块3.84TB的NVMe SSD作为数据盘。但标准的存储配置无法满足用户的容量需求,更无法方便地共享数据以便更好地协调计算资源。因此,外接专用的NAS存储设备是其容量扩展的推荐方案。目前的方案有两种,一种是国外的商业产品,价格昂贵,因为DGX设备的购买已经花费了大量的预算,在存储方面再进行重度投资,就有点捉襟见肘。一种是基于开源的分布式存储自行搭建,但维护复杂,三天两头出问题,且缺乏专业的商业支持,名义上虽然节省了不少成本,但耗费的大量人力物力反而阻碍了真正的业务发展。
储迅(StorSwift)针对DGX系列GPU集群,推出了定制版的AI存储产品。同储迅企业存储产品线的其他产品类似,它具有性能优越、可靠性高、管理方便等诸多优点。该产品还专为DGX系统优化,规避复杂的安装配置问题,通过储迅的DGX套件一键接入,部署简单,上手容易。同时,针对DGX-1和DGX-2服务器的特点,储迅和Mellanox官方合作,提供了基于Infiniband的高速RDMA接入方案,能最大程度提升系统的I/O性能。
在生态建设方面,储迅和Mellanox、Seagate等业内知名公司合作,推出了覆盖硬件规划、网络部署、软件优化的整体解决方案。基于100Gb的Infiniband或者以太网,能为深度学习的用户赋予更多的性能潜力,让计算任务更轻松,客户满意度更高。
储迅简介:
上海储迅信息技术有限公司是一家专业提供高性能存储产品和解决方案的高科技公司,HPC/AI存储、去中心化存储等领域有着领先的研发能力和充足的部署运维经验,并积极为多个开源存储项目贡献代码。在HPC/AI行业,储迅的高性能存储产品已广泛应用在生物计算、冷冻电镜、人脸识别等前沿领域。