存储>技术趋势

说说Dell PowerScale非结构化数据存储的典型应用场景

作者:李丽   责任编辑:李丽 2022-04-25 12:12:42
来源:电脑商情在线关键字:非结构化存储,NAS,PowerScale,EDA,HPDA

当数据红利开始逐步取代人口红利之时,我们已经意识到以数据驱动的数字经济时代到来了,相应而生的便是数据存储和管理带来的一系列新问题。比如,IDC的数据也显示,预计到2025年全球80%的数据将是非结构化的,所有的数据会在各种场景中产生和得以使用。

中桥调研咨询高级分析师马燕认为当前存储主要面临着五大问题和挑战:一是数据的存管分离,二是数据的壁垒,三是高碳低效,四是多样性和复杂性的问题,五是数据安全。

对此,戴尔大中华区非结构化数据存储事业部总经理刘志洪分析说,对比信息化,在数字化时代,数据的管理已经发生了翻天覆地的变化。比如,在信息化时代企业主要面对的是结构化数据,通过IT技术把这些交易管理起来,就达到了信息化的目的。而数字化时代,数据就不再是简单的管理问题,因为业务、社会生活等的运行都要依靠数据来驱动,所以非结构化数据存储和管理同样要与时俱进。

戴尔大中华区非结构化数据存储事业部总经理刘志洪

戴尔科技集团专为非结构化数据设计的NAS文件存储PowerScale,不但继承了Isilon OneFS高并发带宽、快速线性扩展、灵活的多协议访问、完善的数据保护等所有技术亮点,这两年来在功能扩展、性能等方面都有着很大的提升。

比如,针对马燕提到的五大问题和挑战,PowerScale则可以从存管融合、打破边界、高效低碳、精智平台、全面防护五大措施和技术功能来帮助企业构建数据红利引擎,释放数据价值。

“PowerScale所采用的DRR技术,也就是联线数据精简压缩技术,带来的最直接的效果就是提高了存储设备的有效容量和可用容量,这就使得数据中心对能源的消耗和空间场地的使用率大大降低,也可以获得更高的性价比和经济性”刘志洪如此介绍说。

跨多个平台实现数据的快速的搜索和查询,从而实现存管融合,这是PowerScale一大显著特点。同时,PowerScale可以部署在云端、数据中心和边缘端,并通过DataIQ实现异构存储平台数据的统一的管理、跨地域数据的交互和共享,打破了壁垒

我们知道,PowerScale其实是一个横向扩展的“精智“平台,随着容量的增长,它的性能是呈线性增长的,不同类型的节点甚至不同代的节点都可以部署在同一个集群中。PowerScale还支持多协议数据的访问,也就是一种协议写进去的数据其他的应用系统可以通过其他的任何一种协议读出来,广泛地支持传统应用和现代应用,并可以通过CloudIQ可以实现全自动化的运维管理。

在了解了Dell PowerScale这些特性之后,今天我们将从芯片设计、人工智能和HPDA这些高端应用场景,来看看PowerScale在应对各种不同的工作负载所展现出来的性能。

助力EDA企业打造高效数据动能

目前Dell PowerScale在芯片行业可以说取得了非常辉煌的成绩,在全球TOP20的知名企业里,PowerScale的应用高达80%。这主要是得益于PowerScale可以轻松地应对存储芯片设计各个环节里面临的IT挑战。

首先,PowerScale拥有大规模的横向扩展能力。无法预知未来的数据量有多大,也无法预测将来要开发多少款产品形态,对于任何一家芯片设计企业而言都是常态。而PowerScale提供的灵活的横向扩展架构,就可以让用户根据需求按需扩展容量和性能。

其次,芯片设计过程中不同的阶段对存储的要求也尽不同。而PowerScale可以将全闪存、混合、归档类型节点灵活组合,根据企业业务需求、性能、容量以及不同的使用阶段,灵活组合,智能地进行数据生命周期管理,然后形成单一的文件系统,并且能够做到前端应用完全透明化。在芯片设计全流程中,数据的生命周期管理完全由PowerScale存储自动分层的能力来自动智能化地管理。

第三,芯片的设计数据永久保留。PowerScale拥有无需迁移数据更新换代的能力,可以满足企业长期数据的永久保存之需。在芯片设计行业,产品的上市周期也是核心竞争力之一。PowerScale提供了N+4的高可靠性和高安全性的数据保护的能力,让让企业轻松应对芯片设计的各个流程,加速产品上市周期。

最后,PowerScale全线产品都具备在线数据缩减的能力。从实际应用效果来看,企业真实的数据在PowerScale上能够达到2:1的有效存储效率,从而帮助客户降低存储成本。同时也帮助客户减少了机房的机柜空间,能耗等等各方面的成本的进一步的降低。

从流程上来看,芯片设计完成之后就是代工厂的芯片成品制造。此时,企业需要使用PowerScale存储收集芯片产线大数据,比如收集生产线的温度、湿度等环境数据,然后做大数据分析,通过大数据分析来提升芯片制造的良品率。PowerScale支持原生Hadoop,所以可以为HDFS大数据分析的文件系统提供就地分析的能力,也就是说数据采集过来不需要做迁移就可以直接进行分析,从而加快数据分析的流程。

助力人工智能、机器学习打破数据价值边界

各行各业与人工智能的深度融合正在加速落地,比如精准营销、智能风控、智能安防、智能家居、在线教育、远程医疗、自动驾驶、智能物流等等。这些基于人工智能对数据充分利用的过程中,无论是数据采访、准备还是数据训练和推理,各个阶段读写的数据类型不同,工作负载的不同,对存储的性能都提出了苛刻的要求。比如,对存储的吞吐量、延迟和扩容的要求等等。

在人工智能场景下,一个AI模型的诞生需要经过大量的数据采集,之后是把分类好、标注好的数据做分布式的数据训练。在数据训练这个环节,通常需要大量的、多次的反复迭代才能得到比较精准的优秀的算法模型。而这个算法的模型正是企业的核心竞争力甚至是知识产权,也是每个企业的最有力的武器。

Dell PowerScale的价值就在于,能够帮助企业从海量数据里提取出来相应的价值,然后得到相应的算法模型。

通过PowerScale,企业可以构建一个企业级的数据湖,轻松地应对海量数据的快速增长,并且真正做到伸缩自如、简捷如一。其次,戴尔通过分布式的架构以及全闪存的不同型号组合,能够帮助企业在做GPU高性能定型训练时,消除存储的IO的瓶颈,充分的发挥GPU的计算的能力。同时PowerScale一套存储就可以满足整个AI训练的各个环节使用,并且与业务系统无缝对接,帮助客户节省数据迁移的时间成本。

在数据安全方面,PowerScale本身提供了高可靠性和高稳定性,帮助客户在AI训练的时候能够提供很好的业务连续性。同时,PowerScale还提供了一系列的数据保护的机制,比如快照、备份、容灾,以及防勒索病毒的解决方案,能够帮助客户快速地进行主动防御,以及灾难恢复,将安全威胁降至最低。

助力HPDA加速数据分析效率

随着AI、大数据技术与千行百业的快速融合,数据分析和处理量急剧增长,传统的HPC已经开始向HPDA方向发展。比如,视频清晰度从2K到8K的变革,使得视频渲染数据量增长数十倍等等。这些多样化的数据密集型负载给数据存储无论是性能还是容量、协议等方面都带来了全新的挑战。

其实无论哪种类型的HPDA,PowerScale多协议的互通都能够保障不同的数据源的数据快速导入,能支持混合的工作负载。根据访问频度的不同,也就是数据的冷热程度的不同,PowerScale的文件能自动存储、迁移到最合适的存储层或者是存储的节点。

在这些应用中,PowerScale的所有节点都能被利用起来,没有任何的闲置资源,也没有任何性能的瓶颈。随着业务量的增长,每扩容一个节点大概只需要一分钟左右的时间,并且在扩容时,命名空间包括目录也会随之扩大,最大能做到100PB。

在HPDA的应用场景下,不得不提的还有PowerScale完善的数据服务功能,比如文章前面提到的数据在线缩减的DRR、可写的快照、支持加密传输的容灾,也就是ThinkIQ功能,以及数据生命周期的管理,都让众多的客户以此受益。通过海量的非结构化数据的存储,管理以及应用紧密的集成,实现了业务的敏捷、高效。

PowerScale从诞生之日起就能够在业界保持领先,不仅仅是因为它延续了前身产品的诸多先进技术,更重要的是它在功能上的与时俱进,通过丰富的产品线应对不同的业务场景,才能够帮助用户在多样的数据场景下释放数据的价值,这是PowerScale能力。



意见反馈:zhanheng@cbigroup.com

稿件投诉:zhanglin@cbigroup.com

内容合作QQ:2291221

商务合作:13391790444 詹老师

ICP备案号:川B2-20070068-15

川公网安备:51010602001511号

关注我们