
计算大会|数据存储|中国计算白皮书
东方计数和西方计数|数据传输|中国白皮书节约能源
纵观全球,随着云计算、大数据、人工智能、高性能计算等新兴数字产业和前沿技术的加速应用,数据总量大幅增长,数字经济持续繁荣,发挥重要支撑作用的存储需求也在不断扩大。新一轮科技革命和产业变革正在全方位改变社会生产生活。积累数据资源,保障数据安全,做大做强数据产业,已经成为世界主要国家共同的战略选择。
在最近举行的2022中国计算大会上,1% 3% 5 系列计算力研究成果正式发布,《中国存力白皮书》(以下简称《中国存力白皮书》)是其中一项成果,阐明了存储力的背景和定义,梳理了全球存储产业现状,分析了中国的存储能力来自地区、省和数据中心级别。
中国信息通信研究院云计算与大数据研究所副总工程师郭亮在2022中国计算大会分论坛上详细解读《白皮书》 加速数据存储的高质量发展,帮助构建新的数字经济。
党的十九届四中全会首次将数据作为生产要素参与分配。数据的作用受到国家的高度重视,存储作为数据载体越来越重要。不同应用场景对数据存储容量、数据传输速度、存储性能等的要求。都在不断进步。产业需求持续推动存储技术演进,需求更新和技术迭代共同加速存储市场进一步释放增长空间。
《中国存储电源白皮书》综合考虑了存储的容量、性能、安全、可靠、绿色低碳等特性,分析了全球存储行业的产业现状,研究了数据中心存储技术发展趋势,分析了中国各省存储电源发展的规模和质量。总体而言,我国数据存储发展的整体水平仍落后于发达国家,存储容量、先进存储设备的应用以及存储与计算的平衡都有待进一步加强。中国的区域存储能力与数据中心和计算能力的发展高度相关。东部省份数据存储能力水平较高,中西部省份冷数据存储业务占比相对较高,但整体存储规模和质量低于东部省份。最后,在展望中国发展趋势的同时对中国数据存储产业的高质量发展提出了一些建议从技术、标准和行业方面分析了美国的数据存储能力。
和背景意义
一、数据保留的定义和内涵
在国家数字经济战略下,数据作为一种生产要素,已经成为一种重要的资产。海量数据呈指数级增长,数据流加速。作为承载数据的关键设施,存储更为重要。数据存储是一个复杂的系统,包括复杂的硬件、复杂的软件和介质。各行各业数字化进程中涉及的应用创新,对数据采集、存储、传输、交易和服务提出了更高的要求。既强调存储容量足够大,又对存储的功能性、可靠性、安全性、绿色性提出了要求。
数据存储系统
数据留存已经成为数字经济背景下整个社会和行业发展的重要基础。数据留存的概念和内涵也更加丰富。是以存储能力为核心的综合能力,包括性能、安全、可靠、绿色低碳。
存储容量是应对数据爆炸式增长的基础。进入大数据时代,移动智能设备、云、物联网终端等产生的海量数据。需要存储、分析和计算,数据存储的整体需求快速增长。中国信息通信研究院发布的《白皮书》指出,2017-2021年,中国的数据输出从2.3ZB增加到6.6 zb 数据可以不要被拯救日益严重,不断增加的数据总量使得存储容量成为数据存储的核心需求。因此,业界正在积极探索存储容量改进方案。一方面,通过存储硬件的结构改造和高科技散热技术增加硬盘的密度,从而增加单位空间的数据存储容量。另一方面,软件纠删码等技术的应用也可以减少冗余,提高磁盘利用率。
数据存储性能是有效数据处理的关键。在关系到国计民生的重要领域政府事务、金融、交通、电信、医疗等行业对读写速度快、非易失性、无机械设备、抗震性能好、温度范围宽、功耗低、噪声传播少的存储提出了更高的要求。数据存储性能是充分释放数据元素价值的基础,是数据有序流转、运营流转、场景应用的有力支撑。在新兴的信息技术领域,比如人工智能,数据存储性能,比如读写速度,决定了人工智能算法能否快速获得足够的训练数据,从而不断优化算法,打造敏捷模型。
数据的安全性和可靠性是发挥数据价值、保障数字社会健康发展的保障。数据的安全性和可靠性是指所有数据在其生命周期内的完整、一致和准确的程度,尤其是在自然灾害、电力等设施故障和设备故障时。在人为破坏、勒索软件、网络攻击等影响下。仍然有可能实现三不二永远关键数据系统-无数据泄漏、无数据篡改、无数据丢失、始终在线业务和始终合规访问。目前数据中心行业实现存储安全可靠的途径主要有容灾和备份:容灾手段来确保连续性和弹性灾难情况下的业务系统;"备份确保灾难条件下数据完整性的方法。
低碳是未来数据存储的必要因素。为响应国家双碳战略的要求新建大型和超大型数据中心的PUE低于1.3,绿色低碳水平高于4A 工信部、发改委等提出的政策文件已经实施,数据中心存储正朝着绿色节能、低碳的方向发展。数据存储设备使用过程中的电力消耗和冷却能耗是数据中心能耗的重要组成部分,单位存储容量能耗逐渐成为数据中心综合能耗水平和可持续发展能力的评价因素之一。数据存储的绿色低碳发展逐渐受到企业和政府的重视。一方面,使用绿色节能的存储设备可以为企业降低总拥有成本;另一方面,通过使用低能量的储能装置,达到减少碳排放的目的,获得环境和社会价值。
二、数据保留的重要作用
数据作为一种关键的生产要素,推动了数字经济的快速发展。
作为数字经济时代最核心、最有价值的生产要素,它正在加速渗透,成为全球经济增长的新动力和新引擎,深刻改变着人类社会的生产和生活方式。5G、人工智能、云计算、区块链、工业互联网等ICT新技术、新模式、新应用,都是基于海量数据。随着数据量的指数级增长,数据分析算法和技术的迭代更新,数据的创新应用和产业优化升级,数据对社会变革的影响深远。将数据作为推动数字产业化和产业数字化的关键要素,促进数字技术与实体经济的深度融合,可以为数字经济提供持续动力,充分利用海量数据要素,大力发展数字产品制造、数字产品服务、数字技术应用和数字要素驱动型产业等。培育经济发展新的增长点;将数据要素与其他生产要素相结合,可以提高其他生产要素的匹配效率,激发其他生产要素的创新活力,进而提高生产的质量和效率,促进国民经济质量和水平的整体跃升。
数据存储作为数字基础设施的核心部分,支撑着经济社会的稳定运行。
数据的价值需要结合计算能力、存储、网络等相关设备,以基础设施的形式服务于经济和社会。数据存储是计算基础设施的核心组成部分,是信息的起点和终点。高质量的数据存储基础设施和产业生态不仅能够推动数据存储的发展,还将带动更广泛的社会和经济衍生影响。在图像采集领域,交通、医疗、制造等行业。正在不断扩大他们对高清图像的应用。而在制作大量4K、8K文章和数亿像素的高清图片作为数字制作素材的同时,他们需要更多的存储空间。在高性能计算领域,如气象预报、卫星遥感、灾害模拟等重要行业,需要存储大量数据以保证性能容量的横向扩展。在实时信息处理领域,如金融、医疗等行业,需要数据存储系统来满足快速增长的在线并发访问和全天候在线业务的需求。
数据存储惠及企业,助力行业数字化转型。
近年来,越来越多的企业开始关注数据的价值,收集、保留和分析生产经营中的数据,增加了对数据存储、管理和使用的需求。各行各业都通过数字化转型提高了企业的运营效率,不仅可以提高企业自身的运营效率,还有助于提升供应链的可控性,为商业决策提供更多支持。一方面,数据存储在一定程度上解决了数据流通不畅的问题,上下游用户可以通过线上平台传递需求和供给信息。上游厂商,如服装代工厂、布料厂商,在生产和供货时可以通过数据判断趋势,调整企业的制造策略,实现资源的有效配置。银行、保险公司、物流公司等。也可以因为更准确的生产和需求数据输入而更好地开展业务,这可以保护他们的业务,并实现产业链的不断完善。另一方面,各个企业因为自身生产效率的提高,降低了订单的次品率和延迟交货率,缩短了生产周期,使供应链更加稳定。
数据存储产业发展分析
一、政策分析
数据存储在国家数字经济发展中发挥着重要作用。为了形成数据存储产业的发展思路,加强存储产业的自我控制,打造数字经济供给侧的竞争力和可持续发展能力,各国出台了各种政策,保障数据产业链高效可靠的采集、存储、传输、交易和服务。
1、世界各国
2020年,英国颁布了《数字中国发展报告(2021年)》,其中明确指出数据是世界的驱动力的现代经济,而数字产业是构建世界最重要的支撑保证美国领先的数字经济。人们希望公众能成为蓬勃发展的数字经济的积极参与者。
沙特阿拉伯在2020年发布了《联邦数据战略》,其中明确指出从传统的经济活动到更大的基于数据的活动,数字经济的中心地位将会凸显。
新加坡2020年发《国际数据战略》,明确写明继续支持战略和新兴技术的发展,加强数字化能力向产业的转化。其目的是实现新加坡成为智慧国家的雄心,利用数字经济的增长机遇,继续加强数字经济、数字政府和数字社会的建设。
2021年,德国颁布了《沙特数字经济政策》,其中明确指出应努力构建一种数据文化,以确保公平和防止数据垄断,增强德并使德国成为欧洲数据共享和创新应用的领导者。
世界各国半导体产业发展布局
美国高度重视半导体存储芯片的战略价值,不断完善政策体系,不断丰富行业标准,规范存储行业。美国政府以政策为出发点,鼓励本土半导体厂商进行技术创新,完善专利保护法,全面保护半导体存储相关技术。
在国内需求有限、国际竞争激烈的环境下,韩国美国半导体产业保持良好的发展态势和强大的产业优势。韩国通过BK21 和BK21 计划,并于2016年启动半导体希望基金,投资半导体相关企业。2021年5月,韩国政府正式宣布k半导体战略预计未来10年将投资约4500亿美元。
日本振兴的对策美国半导体工业已经制定。2021年6月,日本政府对半导体、数字基础设施和数字产业进行了全面部署,制定了《研究、创新和企业2025计划》。2021年底发布《联邦政府数据战略》,致力于提高日本半导体企业的收益。
3、中国将数据提升到生产要素的地位
中共中央政治局就实施国家大数据战略进行第二次集体学习时指出,推进实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好服务中国经济社会发展和人民生活水平的提高的生命。
2019年11月,中共十九届四中全会明确列出数据作为生产要素的第一次《半导体数字产业战略》,并提出完善劳动力、土地、知识、技术、管理、数据等生产要素按市场评估投入,按贡献确定报酬的机制,这体现了党中央准确把握了信息技术发展的特点和未来趋势,也凸显了数据在数字经济时代的重要性。
2020年4月,中共中央、国务院发布《半导体产业紧急强化方案》。数据作为一种新型的生产要素,正式出现在官方文件中。将数据纳入要素范畴,意味着数据与资本、劳动力等传统要素具有同等的地位和作用。这对于探索建立统一的数据标准,支持各领域的数字基础设施建设,促进中国的数字经济。《中共中央关于坚持和完盖中国特色社会主义制度推进国家治理体系和治理能力现代化若干重大问题的决定》,《关于构建更加完善的要素市场化配置体制机制的意见》,还强调加快数字基础设施建设,统筹安排绿色智能数据和计算设施,加强数据采集、数据存储、处理和智能分析能力。
《“十四五”国家信息化规划》 iss
2022年1月发布的《“十四五”信息通信行业发展规划》明确表示数字经济是促进公平和效率的新经济形态,坚持应用牵引和数据赋能。坚持数字化发展方向,发挥中国优势的海量数据、广阔的市场空间和丰富的应用场景,充分释放数据要素的价值,激活数据要素的潜力,以数据流推动生产、分配、流通、消费的高效融合,促进数据技术产品、应用范式、商业模式和体制机制的协同创新。"
4、新的数据中心为数据存储的发展带来了新的机遇。
2021年,《中共中央国务院关于新时代加快完善社会主义市场经济体制的意见》、《十四五数字经济发展规划》等数据中心政策文件的发布,为数据中心行业创造了良好的发展环境,刺激了数据留存需求。随着中国的登陆随着美国东西方计算项目和新数据中心行动计划的实施,数据中心已经成为业界各方讨论的热点话题。只有数据存储能力与计算能力和网络资源协同发展,新的基础设施才能充分发挥数据元素的价值。新的数据中心是一个新的基础设施,具有安全可靠的功能,提供高效的计算服务,并支持成千上万的应用程序。计算服务的提供需要数据存储能力的支持。
工业互联网、人工智能等新兴技术的可靠稳定应用,离不开数据存储。当存储效率和容量能够达不到要求,计算能力几乎无法发挥作用。同时,经济社会运行中产生的各种数据与物理世界发生交互后,最终处理的结果会返回到数据存储系统中进行存储,从而指导模型和算法的准确性和可用性提高,更好地支持下一步的数据分析。
二、行业分析
随着数据存储形式的不断变化,全球数据存储行业也在从单纯关注数据存储的容量向高效、经济、可靠、节能等方面扩展,以更好地应对不断增长的数据量、数据多样性和实时性等对存储的新要求。
1、磁存储市场占比较高。
根据存储介质的不同,现代数据存储可分为三类:光存储(CD、DVD、蓝光存储)、磁存储(磁带软盘、机械硬盘)和半导体存储。其中,半导体存储广泛应用于数据存储领域,是存储技术发展的趋势和方向之一,包括易失性存储器DRAM和非易失性存储器NAND FLASH、NOR FLASH等。
由于技术原因,光存储的应用场景受到限制。光存储作为最早的数据存储技术,容易受到摩擦等外界影响而损坏,在存储容量、存储密度、访问速率等方面都受到一定程度的限制。但由于光存储技术寿命长、安全可靠、成本低,被业界认为适合数据冷存储和存档数据的长期备份。
磁存储被广泛使用。磁带存储在海外发展较早。微软Azure、亚马逊AWS、谷歌等全球知名的云服务提供商都采购了大量的磁带来备份和归档关键数据,长期保存冷数据。软盘存取速度慢,容量小,但可移动,便于携带。它们适用于需要物理移动的小文件。机械硬盘以其低廉的价格和较高的存储容量占据了一定的市场份额,但也存在存储时间短、能耗高、存储密度低等问题。
半导体存储器已经成为一种重要的存储介质。近年来,以半导体为代表的新一代全闪存技术发展迅速。半导体闪存是新一代存储介质,因其断电不丢失数据、高性能、快速读取、大容量、绿色节能等特点,已被企业信息系统广泛使用,并逐渐成为存储行业的主要介质。在全球整个半导体市场中,存储器约占三分之一的规模,是最大的半导体细分市场之一。半导体正在成为工业中的主流存储器
2、中国美国的存储技术水平取得了显著的成绩,与美国企业还有一定的差距。
在数据存储的全球市场份额中,美国企业处于垄断地位。Gartner2021发布了2021年存储魔力象限报告。企业级备份和恢复解决方案的魔力象限全是国外公司,包括Commvault、Rubrik、VeeamCohesity、Veritas Technology、Dell Technology等美国公司,占据了数据保护、备份和恢复的主要市场;在主存储的魔力象限中,Pure Storage delltechlogynetapphpe IBM等美国公司在全球的占比相对较高,日本的Hitachi Vantara和以色列的Infinidat也处于领先地位,只有中国企业华为技术有限公司进入。凭借优秀的产品能力,在亚太地区得到广泛应用:在分布式文件系统、对象存储等幻方图中,以Del Technology、IBM、Pure Storage、Qumulo等美国公司为主。
近年来,国内数据保护领域涌现出众多优秀企业,包括蓝海大脑、华为、爱树、鼎家、新华三、浪潮等。IDC显示,在数据复制和保护系统市场,国内企业在本地市场的份额逐渐增加。2021年,华为、爱树、鼎家、新华三占据了42%的市场份额,其他占据40%的品类也包括了大量的国产厂商。在软件定义存储(SDS)和超融合存储(HCI)系统市场,软件定义存储(SDS)和超融合存储(HCI)系统市场前五大供应商均为国内企业,市场份额超过70%。
3、不同行业容灾水平参差不齐,急需构建典型领先场景。
随着经济社会的高质量发展,我国逐渐重视数据安全,对数据存储的可靠性提出了相应的要求。可靠的数据存储是计算基础设施建设的基础,数据中心行业开始重视数据安全和容灾备份建设,以应对各种数据安全事故。最近《全国一体化大数据中心协同创新体系算力枢纽实施方案》已经发布实施。保护数据安全已成为数据存储发展的关键,存储的可靠性建设将加快,以应对数据安全风险和数字经济时代的挑战。
我国大部分行业的信息容灾建设体系亟待完善,普遍存在备份,无灾难恢复和缺少异地灾难恢复。数据安全风险要求高的行业,如金融、运营商等行业,具有信息化程度高、信息安全要求高的特点,行业容灾系统建设相对完善。典型的容灾应用行业具有很大的示范意义。根据容灾设备出货量统计,金融行业。如国有银行/大型股份制银行,数据备份建设比例达到92%左右,但异地备份比例只有10%左右,业务系统容灾比例不到40%,异地容灾不到30%。
国内行业数据灾难恢复覆盖率
其他行业信息化发展起步较晚,灾备系统建设也相对滞后。31个省(直辖市、自治区)只有5%的政务云部署了同城灾备,异地灾备比例更低。大部分省级政务云仅部署了简单的本地备份,缺乏数据中心容灾能力,难以满足核心系统业务连续性和数据安全性的要求。在教育方面,以高校为例,数据容灾比例很低,容灾建设比例不到1%。只有哈工大等少数学校部署了异地容灾系统,同校区备份比例平均在25%左右,异地只有2%左右。医疗领域的灾难恢复系统的特点是水平参差不齐。几乎所有
事物的演变一般遵循螺旋发展的规律,数据存储产品和方案的演变也是如此。业务需求和技术进步是螺旋式发展的两个主要驱动力。从八、,90年代最初的电子化、信息化,到互联网,再到现在的全方位推进数字化,未来的数字孪生、元宇宙,数据规模成千上万倍增长,移动互联网的发展,带来了并发访问量百倍增长,业务7*24连续服务,毫秒级响应体验。
存储技术和产品已经从最初的磁带和磁盘发展到DAS、SAN、NAS等专业存储设备,以及现在的全闪存存储和分布式存储等。在性能、可靠性和容量这三个核心方向。再加上接入协议、存储网络等技术的演进,数据存储容量也在快速提升。
1、存储介质技术升级可以增加存储容量,同时降低单位存储成本。
存储介质从传统的磁介质转变为闪存介质。目前,采用GMR巨磁阳效应磁头和SMR波纹叠盘技术的企业级机械硬盘(HDD)单盘容量可达18TB。通量-微波辅助磁记录(FC-MAMR)、微波辅助交换-微波辅助磁记录(MAS-MAMR)、热辅助磁记录(HAMR)、石墨烯涂层等新技术的研究与应用。将在未来几年内使单个磁盘的容量增加一倍,满足冷暖数据的近线存储需求。
同时,随着半导体介质制作工艺的快速提升,3DNANDFlash已经实现了176层制作工艺。与此同时,闪存颗粒的存储密度已经从SLC(单级单元)、MLC(多级单元)到TLC(三级单元),正在向QLC(Ouad-LevelCell)演进。随着闪存技术和工艺的提升,SSD的单盘容量已经达到30TB以上。在同样的应用场景下,SSD数据访问比磁盘快100倍左右,吞吐量高100倍,单个磁盘的IOPS高1000倍以上,在提供高性能的同时降低了成本,可以更好地为热数据提供在线存储。辅助磁记录、晶格介质存储、全息存储、DvCo5材料存储等高密度关键存储技术不断研发创新,更好地应对了数据存储容量和存储密度日益增长的需求。
辅助磁记录技术写入存储介质时,最小磁化区域被聚焦光束加热,解决了少量热量对纳米级比特区域的干扰,有效地利用了热量,保证了纳米级比特单元受热时保持磁化;点阵存储通过光刻在点阵介质上分割出均匀的栅磁单元,单比特占用空间少,存储密度高。全息术使用消费光学和人工智能技术将数据存储为可重写全息图。借助商用高分辨率摄像技术和深度学习技术,HSD设备负责任地迁移到云端,缩短了读写时间,提高了实时访问效率。DvCo5材料存储为超高密度热辅助数据存储设备提出了高效节能的解决方案,使数据在写入时能够快速磁化,材料能耗更少,性能更好。
2、NVMe在主机和存储设备之间创建高速通道
随着存储协议的发展,存储介质的变化和网络带宽的提高所带来的好处得到了充分的发挥。NVME (Non-Volatile Memory Express)是非营利组织NVMExpress发布的规范,定义了主机软件通过PCle总线与非易失性存储器通信的方法,是SSD的协议标准。它通过与CPU的PCle通道直接通信、更深的队列深度、简化操作系统协议栈等一系列手段,全面提升了SSD的性能。NVMe系列标准规范了SSD访问接口,确保了NVMe在网络架构、接口管理、服务器和系统管理方面的标准化和清晰化。是所有形态的PCle固态硬盘(SSD)的行业标准(u2、m。2、 AICE DSFF)。
除了基本的NVMe规范,它还包括NVMe Overfabric (NVMe-of),用于规范网络架构上NVMe命令的使用,以及NVMe管理接口(NVMe-MI),用于服务器和存储系统管理NVMe/PCleSSD。随着采用NVMe接口规范的技术从硬盘到固态硬盘,再到单片机的发展,存储性能有了很大的提高。与以前的硬盘技术相比,通过NVMe访问存储介质所需的时间减少了1000倍。
NVMe协议逐渐成为主流,固态硬盘的接口也在从传统的SATA/SAS向PCle转变。使用NVMe协议后的PCle接口可以进一步释放固态硬盘的性能,提高响应速度。随着NVMe的发展,它逐渐被应用到存储网络中。目前主流的NVMeover面料方式有两种,分别是NVMe over FC和NVMe over RoCE。其中,NVMeoverRoCE基于开放式以太网,具有带宽大、时延低的优势。随着技术的逐渐成熟,已经大规模投入实践。NVOVEROCE在性能、成本等方面的优势。将促使架构逐步转型,存储网络逐步转向全IP。在获得较高传输性能的同时,具有以太网运维管理相对简单的特点。
目前PCle 6.0规范已经正式发布。预计最高写入速度为11GB/s,最高读取速度为12GB/s,而PCle5.0SSD设备将于2022年正式上市。PCle系列规格的带宽速度如下所示。
PCle系列规格带宽速度
PCle市场规模持续扩大,服务器设备是标准迭代升级的主要受益者。随着企业SSD的发展,PCle将在2021年获得更大的发展机会,并在未来五年持续增长。服务器厂商推出了很多支持PCle4.0的服务器主板,可以使用NVMe硬盘。当PCle50商用后,市场规模将进一步扩大,这将大大降低其存储在整个计算机系统中造成的性能瓶颈,而NVMe存储设备将是最受益的设备。到2023年,服务器设备将率先实现PCle60应用,为人工智能、数据中心、物联网、航空航天、军事等提供有效支撑。并为高性能计算中心提供基本的存储设备支持。
3、存储系统工程和算法进化确保数据存储的安全性和可靠性
存储是数据安全的最后一道防线。随着企业数字化的深入,数据安全风险变得复杂多样。从数据的增长到架构的复杂,如何保证数据的可靠性和安全性是数据存储的关键。在存储系统层面,通过使用多控制/集群架构、关键组件冗余、热插拔、多路径软件、负载均衡、在线扩容、在线升级等技术,大大提高了系统可用性。在算法层面,算法的改进提高了SSD的使用寿命。由于固态硬盘的使用寿命取决于NAND闪存的擦除次数,因此固态硬盘的使用寿命是用户最关心的问题。但随着写入算法的不断进化,SSD的使用寿命在软件层面可以得到最大限度的延长。在实际使用和更换周期中,SSD的实际故障率低于机械HDD,使用寿命不会成为其瓶颈。在数据保护方面,双活存储已经成为保证关键业务系统连续性的主要方案之一,并且可以扩展到两地三中心避免在自然灾害、电力等设施故障、设备故障、人为破坏、勒索病毒、网络攻击等影响下的数据恢复能力和业务系统的连续性。
中国数据存储能力发展分析
一、中国数据存储发展分析
与发达国家相比,我国数据存储发展的整体水平还有一定差距。根据罗兰计算,美国单位GDP的库容高于中国,中国的支撑作用经济发展中的储蓄有待加强。从规模上看,根据中国信通院的统计,中国的总存储容量h
数据存储发展水平关系到数字经济的规模。数字经济规模越大,数据资源越丰富。东部沿海地区经济相对发达,数字经济规模大,所以东部地区的数据存储能力在规模上有很大优势。此外,数据存储能力的发展水平与数据中心的建设和计算能力有关。东部仍是数据中心建设和运营的主要区域,数据存储能力的发展规模和质量均居全国前列。中西部地区数据存储发展水平相差不大。结合《新型数据中心发展三年行动计划(2021-2023年)》的计算分析,中西部地区数据存储总分、规模和质量得分略低于全国平均水平。相比其他地区,东北地区数据存储规模和质量较差,指标值小于全国平均水平,发展空间较大。
2021年中国区域能力发展
在东部省市,数据存储发展水平全国领先。北京、上海、广东及其周边省份对数据计算的需求更多,数据中心的市场规模不断上升,为数据存储创造了良好的发展环境,数据存储的发展也受到重视。这些省份对数据处理的时效性和安全性要求很高。在计算和存储热点数据时,他们追求的是数据访问和读写的速度,带动了本地和外围存储能力的发展。从规模上看,广东省是东部省份中存储规模最大的,2021年总存储容量超过90EB。随着5G云计算、人工智能等新一代信息技术的快速发展,信息技术与传统产业融合加快,数字经济蓬勃发展。北上广等发达地区对数据计算和存储的需求正在快速上升,这也将带动本地和外围存储容量的增长。从质量上看,全国先进存储占比差别不大,平均先进存储占比13.5%左右。在东部一些经济发达的省份,如北京、河北省,先进存储占15%以上。一线城市对数据处理的时效性和安全性要求更高,热点数据计算需要高性能的数据存储。新的业务场景对存储质量也有更高的要求。在存储规模越来越大的背景下,一线城市也将更加注重先进存储、存储性能等存储质量。
中西部省市数据存储能力发展水平普遍低于东部,但部分核心省份发展较好。湖北辐射带动中部地区和长江中游地区,支撑长江经济带发展。数据存储需求多,数据存储能力发展水平好。重庆和四川是西部大开发的重要平台,经济发达,对数据存储、传输和处理有很多需求。这些需求带动了作为数据载体的数据存储能力的快速发展,数据中心行业发展良好,数据存储能力水平相对较好。受政策的影响一边算计东方一边算计西方、北京、上海、广州、深圳等一线城市的部分数据存储应用逐渐向西部地区转移,促进了当地数字经济和信息产业的发展,如贵州省、新疆、内蒙古、甘肃省、陕西省等。这些大数据产业蓬勃发展,充分发挥了当地大数据资源的价值,数据中心产业发展迅速。受政策和自身资源禀赋的影响,数据存储规模不断增大。部分中西部省份资源丰富,但网络带宽小、跨省数据传输成本高、计算能力需求有限的现状不容忽视。由于计算能力的发展,数据存储能力的发展水平较差。随着由东方计数和西方计数,Gui
目前,数据存储的整体容量集中度较高。容量排名前7的广东、江苏、上海、北京、河北、浙江、贵州占全国总容量的52%,北上广总存储容量超过230EB,约占总容量的30%。为了提高数据中心标准机架的效率,为计算能力提供更好的数据支持,需要关注数据中心单机架的存储容量,即单机架生存指数。全国各省单帧存储容量一般在120 TB-180 TB之间。湖北、广东、北京、浙江、江苏单机架存储容量超过150TB,其他省份单机架存储容量在130-150 TB之间。今后,受计算从东方到西方的数据,以响应加速数据中心向西大规模布局,特别是对网络要求不高的业务,如后台处理、离线分析、存储备份等,预计八大枢纽省份的数据存储能力将继续扩大。
2021年中国部分省份现有产能规模
中国的整体数据存储质量有待提高。存款余额方面,按照《数据安全法》计算,大部分省份存款余额得分在25-55之间,天津、新疆、湖北等省份存款资源相对均衡,得分大于60。与发达国家相比,中国我国存款余额总体上仍有一定缺口。在先进存储方面,各省先进存储比例差不多,全国平均约占13.5%,对存储质量要求较高的一线城市先进存储比例最高,仅为17%。除了新疆和青海,其他省份的高级存储分数都在25-65之间。虽然广西整体仓储规模较小,但先进仓储设备的选择和应用占比较高。在存储性能方面,北上广及其周边地区的存储性能总容量相对较高。广东、江苏、河北、北京、浙江存储性能总和均超过16GIOPS,海量数据驱动存储性能提升,其他省份存储性能也差不多。在一些数据经济规模较小的省份,存储性能得分不到10分。
2021年中国部分省份存蓄平衡计算、蓄存性能和提前蓄存比例
四、数据中心存储开发分析
国家数据存储发展的应用依赖于省级数据中心存储设备的部署。为了加快存储的高质量建设,在评估数据中心存储容量时,需要综合考虑存储容量、性能、安全、可靠、绿色低碳等维度,如存储容量、容量增长率、先进存储比等具体指标。
数据中心生存能力评估框架
上表是数据中心生存能力评估的基本框架,包括4个维度,7个方面,10个具体指标。从可生存性的定义出发,从存储容量、性能、安全可靠、绿色低碳四个维度对数据中心可生存性的评估框架进行评估。其中,存储容量包括存量和增量,存量反映的是数据中心提供的整体存储容量有效保存和支持业务产生的各种数据的能力;增量响应用于衡量投入能否保证生产要素增长率与存储能力相匹配,支持前沿技术的部署,持续提高竞争力。性能包括平衡性和敏捷性,平衡性反映了计算能力和存储能力这两个核心关键资源之间的协同利用效率。敏捷度衡量的是先进生产力闪存在数据存储领域的部署,能否满足数据存储和调用效率的要求。可靠的响应企业抵御数据破坏性事件并在事件发生后快速恢复的能力。低碳包括经济和绿色。经济性是指企业存储投资的成本,包括总拥有成本,如劳动力和能源消耗,其他
例如,某股份制商业银行总行数据中心,存储存量超过30PB,存储容量利用率约为70%,规划年容量增长率为5%,可以满足该行产生的即时数据存储和传输需求境内外结算系统、网上银行系统、资金托管和估值系统、债券交易管理系统等信息系统。此外,由于银行日常业务运营对数据存储调用的及时性、准确性和安全性要求较高,数据中心大面积部署半导体全闪存,全闪存容量占比近60%;对于重要的业务数据,整体的容灾覆盖率在20%左右。RTO时间恢复目标是,灾难发生后,从IT系统宏机导致业务停止的时刻,到IT系统恢复支持各部门运行的时刻,业务恢复运行的时间间隔仅为5分钟,RPO恢复点目标为0,即灾难发生时数据不会丢失。数据中心既保证了存储规模和性能,又兼顾了绿色低碳。其单位存储运行成本为3.5万/台,存储设备能耗水平约为35W/TB。
目前,为了充分发挥新数据中心的角色,有必要协调存储、计算能力和网络的发展。新的数据中心已经开始关注存储规模和质量。规模上,百度云计算(阳泉)数据中心存储容量超过6EB,可存储的信息量相当于中国30多万个国家图书馆的图书总量,为百度搜索信息流、智能云、智能驾驶等业务:中国联通贵安云数据中心拥有5000TB高效存储和3000TB对象存储,可支持国家部委、政府机构、国际知名云计算厂商、大型互联网厂商、银行、保险机构等众多客户。在质量上,中国电信南京(稽山)云计算数据中心采用HDD和SSD相结合的存储模式,其中SSD占比较高。目前园区存储容量可达50PB,可有效支撑各类云平台的PB级业务场景,实现海量数据存储和高性能计算分析。中国丫某大数据产业园项目采用分布式存储技术,存储容量近300PB,可满足400多家企业的云服务。2020年,园区数字经济及相关产业规模将超过200亿元。
中国数据保留
发展前景和建议
一、数据存储发展前景
1、中国美国存储市场将继续攀升。
根据中国信通院《中国综合算力指数(2022年)》,2021年,中国中国工业数字化规模达到37.18万亿元,占数字经济的81.7%,成为数据经济发展的强大引擎。海量数据的计算和传输需要存储技术提供数据服务,因此存储行业逐渐形成了涵盖技术设备、系统平台、业务应用服务等全方位的产业链体系。
根据IDC的数据,中国的规模2021年,美国存储市场将达到59亿美元,比2020年增长18%。预计存储市场将在未来五年内继续增长,如下图所示。十四五规划和新的基础设施投资计划等文件鼓励用户投资数据中心和基础设施,推动企业数字化转型,实现业务和应用数字化,增加数据消费和存储支出,这将进一步扩大中国的规模美国存储市场。
中国美国存储市场预测
2、对非结构化数据存储的需求推动了分布式存储的快速发展
5G、大数据等技术让数据挖掘得到更广泛的应用。面向未来,以文章、图片、文档为代表的非结构化数据将占到80%以上,成为分布式存储的主要消费者。市场方面,分布式存储和更多关键业务的整合成为存储市场的主力军。随着网络的发展
根据数据整个生命周期中热、温、冷的不同,对存储设备的要求也不同。未来暖数据的存储将逐渐向高性能、大容量、高性价比三个方向演进。为了追求极致的读写能力,适应业务系统越来越高的性能要求。SSD在存储阵列中使用的比例逐渐扩大,全闪存存储阵列开始出现在企业的数据中心,呈现快速增长的趋势。全闪存存储阵列不仅仅是一个全闪存盘的硬盘,还需要从系统层面进行优化,最大程度的激活闪存容量。目前,业界出现了许多新的存储介质技术,如SCM、PCM、MRAM、ReRAM、FeRAM等。这些介质在性能、容量、成本、寿命、能耗、可扩展性等很多方面都有更强的表现。它们支持字节级访问和持久化,不需要移动数据,但其成本较高,或将成为热点数据存储的主流存储方式。
4、存储网络的以太网改造已经成为热门话题。
存储网络是指连接应用主机和存储的高速网络,其基本要求是大带宽、低延迟。传统以太网存在丢包问题,网络质量差。FC网络以其大带宽、低延迟的优势成为存储网络的主流解决方案。而FO技术长期被欧美少数公司垄断,技术壁垒高,产品价格高,生态孤立。近年来,无损以太网发展迅速,结合RDMA、NVME等技术形成的NVMeOVERROCE成为存储网络的重要解决方案,具有良好的网络性能和生态开放性。
5、 存储和计算的集成开始显示其独特的优势。
内存集成是一种计算单元和存储单元紧密耦合的方式,即存储单元与计算单元集成在一起,打破了计算能力和存储的界限,有效改善了功耗墙和内存墙的问题。与传统的冯诺依曼架构相比,有望大幅提高能效。基于SRAM(静态随机存取存储器)、NORFlash(非易失性闪存)等成熟存储器的存储和计算一体化有望率先大规模商用,并将在末端和边缘侧的人工智能推理运算中展现10倍能效优势。新型非易失性存储器如RERAM(电阻式存取存储器)、PCM(相变存储器)和MRAM(磁性随机存取存储器)的集成存储和计算的探索正在加速。由于其高性能和低功耗,有望在数据中心实现突破。对于要求极高的最热数据的实时处理,存储与计算的一体化具有良好的性能,可以打破存储墙,消除不必要的数据移动延迟和功耗,利用存储单元提高计算能力,将计算效率提升数百倍或数千倍。但是,它的价格相对较高。对于实时的热数据,合理的规划和分类冷热数据,可以实现整体架构的总成本最低。
二、数据保留高质量开发的建议
数据存储在国家信息技术和高科技领域发挥着越来越重要的作用,已经成为数字经济发展的战略要地。《中国综合算力指数(2022年)》,《中国数字经济发展白皮书》,强调加快数字基础设施建设,统筹绿色智能数据和计算设施,增强数据采集、数据存储、处理和智能分析能力。作为数据存储的载体,它引起了社会的广泛关注。
目前,数据存储仍然面临许多挑战。一方面,海量数据呈指数级增长,数据流动加速。另一方面,承载数据的存储器、数据网络等关键数据基础设施在可靠性、安全性、可持续供给等方面仍存在诸多挑战和问题,亟待引起重视,出台政策促进相关产业发展。要推动国家数据存储能力高质量发展,首先要从战略上更加重视存储这个关键。从大数据时代全球竞争和国家数据安全的战略高度出发,以先进存储、存储与核算平衡、容灾覆盖为牵引,研究形成指导我国发展的具体政策和规划美国数据存储产业,建设一批存储产业和数据存储应用示范项目,加快数据存储设备和技术的自主可控,降低存储技术和制造业的对外依赖,提升中国美国在数据存储领域的国家竞争力。
技术方面,一是加快部署新一代存储技术,推进存储核心技术底层研发,攻关关键技术,升级存储介质。设计、数据保护等关键技术层面,创造全球存储新高。二是鼓励联合攻关存储技术瓶颈,发挥行业创新龙头企业的创新引领优势,广泛动员国内相关领域的科研院所、高校和龙头企业,开展存储全产业链的产学研协同,提升存储产业的国际竞争力。第三,进一步完善数据产业人才培养机制,确立多层次、多元化的人才培养目标,鼓励培养兼具专业理论和行业知识的复合型人才,鼓励地方政府引导企业完善人才激励机制,引进和留住高端存储专业人才,优化人才区域和行业布局。
在标准方面,应尽快研究建立存储的行业规范和标准,完善数据存储效率、数据保护、数据容灾、绿色低碳等关键标准体系。一方面,鼓励存储相关企业和研究机构开展标准和评估体系研究,鼓励行业龙头企业通过硬件开放、软件开源、生态伙伴等策略,给予合作伙伴尤其是创新型小微企业充分的发展空间,共同探索形成存储行业标准。另一方面,促进数据存储产业的国际交流与合作,加强与国际标准组织的合作,加速中国的国际化美国技术标准,积极参与数据存储国际规则和技术标准的制定。
产业方面,一是构建先进的存储应用生态系统,推动存储产业相关供应链的整合;二是提升产业链供应链保障能力,构建产业集群梯级发展体系;第三,建设面向金融、医疗、教育等重点行业的示范应用项目,树立高效存储、先进存储、均衡存储与核算、存储安全的标杆。比如,在安全可靠方面,推进政务云、国家综合大数据中心、行业大数据中心、智慧城市等场景的灾备系统建设,在全国范围内重点建设一批数据灾备示范基地和示范项目,以落实标准和政策,带动各行各业,更好地应对数据安全风险。
蓝脑液冷服务器HD210 H系列突破传统风冷模式,采用风冷与液冷混合模式。3354服务器中主热源CPU采用液冷冷板冷却,其余热源仍采用风冷冷却。最多支持9个NVIDIA、Intel、AMD GPU显卡和2个CPU处理器。架子的存储空间可以大大









