用大数据处理思路保护数据

面对虚拟化、非结构化数据等新挑战,昆腾提出的解决思路其实很简单,也很直接,就是区分不同的数据类型和需要,然后采取不同的更有针对性的保护方式。这其实就是今天人们处理大数据的基本思路。

  在云计算、大数据等新概念出现后,主存储,也就是在线存储,其性能、可靠性、可管理性、可扩展性等会得到用户更大的关注;二级存储,也就是备份数据,对它的保护和快速、可靠的访问也必须得到应有的重视。举一个简单的例子,当用户的服务器都虚拟化后,如果仍然采用原有的针对物理环境设计的备份工具和设备,那么虚拟环境中的数据保护效率肯定会大打折扣。虚拟化环境下的数据保护还只是新出现的数据保护挑战的冰山一角,大量涌现的非结构化数据的保护、远程异地容灾的需求、海量数据的归档和索引等,这些新问题都需要一一解答。

  昆腾作为独立的数据备份专业厂商,针对上述数据保护方面的新挑战,给出了自己认真思考后的答案——第三代数据保护解决方案。昆腾解决数据保护问题的核心理念是先将数据按不同类型区分开,然后按照不同类型数据的价值、对数据保护的具体需求提供相对应的数据保护方案,从而实现对数据的有效管理,并为进一步的数据挖掘打下基础。

  非结构化数据保护是重点

  以前,在数据量不太大,用户还有比较充足的备份窗口时,不考虑数据类型和具体的备份需求,一股脑儿将数据备份到磁带或磁盘上,这种“粗放型”的数据保护方式可能还行得通。但现在,考虑到虚拟化、大数据、成本和数据管理等方面的重重压力,人们不得不革过去这种“粗放型”数据保护方式的命了。昆腾提出的解决思路其实很简单,也很直接,就是区分不同的数据类型和需要,然后采取不同的更有针对性的保护方式。这其实就是今天人们处理大数据的基本思路。

  昆腾亚太区架构师刘松涛介绍说,将用户的应用系统、数据进行分类,首先应关注的就是传统的结构化数据。备份结构化数据依然可以用昆腾的DXi磁盘备份设备,或磁带备份设备。其次,用户应重点考虑对虚拟机的保护。比如,用户可以采用昆腾的vmPRO并配合DXi设备,进一步压缩数据,甚至可以将数据备份到云中。最后,数据保护现在面临的最大挑战就是对大量非结构化数据的备份和归档。

  “现在比较流行的方式是,大量视频、音频和图片等非结构化数据不再做备份,而是进行归档,在归档过程中达到数据备份的目的。另外,对非结构化数据进行保护还要考虑归档数据如何快速访问的问题。”刘松涛说,对非结构化数据的保护开启了昆腾所说的备份新纪元,“如果用户依然采用传统的备份方法去备份虚拟机,其实也行得通,但备份效果肯定不好,而且会增加购买备份软件的成本,还需要更多的设备空间。现在增长最快的就是非结构化数据。如何更好地备份和归档非结构化数据是下一代数据保护技术必须解决的问题。”

  昆腾的下一代数据保护解决方案,可以通过智能的数据移动来支持客户的独特工作流程。例如,昆腾的分层存储解决方案、新的备份和归档方法,甚至可以支持不可预测的备份需求,并且可以利用基于云的对象存储等技术、策略和其他经济高效的存储(如LTO和LTFS)技术达到对数据分而治之的目的。

  分层存储与新一代备份技术的结合

  刘松涛表示,如今,越来越多的客户不是使用RAID,而是利用闪存来提升工作速度。因此,分层存储解决方案必须与闪存紧密集成。端到端的昆腾信息工作流程(QTM Information Workflow)能够确保数据在需要时可随时随地接入,并且支持整个数据生命周期的管理——从数据捕获开始到处理,再到最后长久保存,以便将来重复使用。

  上述数据保护的新理念可以具体落实到昆腾的新一代数据保护解决方案中。用户可以根据自己的工作流程和应用场景进行选择。

  昆腾vmPRO软件和昆腾DXi重复数据删除设备的组合,可以更好地实现虚拟机的备份,不仅可以节约备份时间,而且可以大幅降低数据保护的成本。昆腾StorNext存储管理器,结合StorNext Q系列磁盘与磁带库,可以帮助大型零售商实现智能的内容归档,在提高生产力的前提下,让用户可以轻松地浏览和检索用于营销和内部沟通的视频数据。在视频监控应用中,昆腾StorNext存储管理器与昆腾Scalar i6000 LTO磁带库是一对好搭档,将视频文件放到磁带上可以提高成本效益。面对海量数据的归档需求,昆腾Lattus对象存储是一个理想的解决方案,它可以把静态文件内容归档到近线存储上,并将存储和备份的成本降低20%~40%。

  数据分而治之

  美国Santa Barbara学院在数据备份方面的实践就是昆腾所倡导的新一代数据保护的典型。通过部署昆腾vmPRO软件和DXi系列重复数据删除设备,美国Santa Barbara学院很好地保护了该校的虚拟机数据,把虚拟机的备份和恢复时间缩短了90%。

  在该校的主数据中心,虚拟机通过vmPRO软件进行备份并直接将数据写入到DXi设备中。物理服务器仍然由Symantec NetBackup进行备份,但数据直接写入到磁盘上,并备份到相同的DXi中。备份文件同时被复制到位于远程数据中心的第二台DXi设备上,实现异地灾难恢复。在部署了昆腾的新一代数据保护方案后,以前每周备份最少需要三天时间,而现在只需4个小时。尽管该学院的IT预算紧张,但可以借助昆腾DXi的可变长度重复数据删除功能,经济高效地完成为期6个月的数据归档任务。 美国Santa Barbara学院利用昆腾的数据保护技术和方案,重塑备份工作流,破解了虚拟环境数据保护的难题。该学院通过建立一个新的备份工作流来管理数据增长,同时降低对磁盘存储的依赖,为未来更多战略性项目的实施铺平了道路。

  昆腾新一代数据保护方法论和相关解决方案在智能地分析用户数据需求的基础上,将数据分流至不同的存储设备,不仅可以大幅降低总体拥有成本,而且可以构建起智能的、适用于用户数据全生命周期的自动存储保护架构,解除用户对于数据安全的后顾之忧。

时间: 2024-08-25 09:20:58

用大数据处理思路保护数据的相关文章

Linux分区加密保护数据

一.首先创建分区 二.创建新的加密卷 加密分区 解密分区 创建文件系统 创建挂载点,然后挂载 卸载加密卷,并锁定加密的卷 下次要是再想使用这个加密卷怎么办? 再次打开加密卷就OK啦! 关于上面的图片解释下,作者刚刚改变映射名称时候,手动是可以挂载和打开的,第一次不知道怎么回事,挂载不上去,说是文件系统不对,搞了好一会都不知道怎么回事,所以重新格式化了一下,即重做文件系统: mkfs.ext4 /dev/mapper/jiami,第一次做的映射名是mydisk,建议这个映射名还是不要改的好,每次打

如何保护数据不丢失

如何保护数据不丢失 保护数据不丢失,可分为多个保护级别.这些级别是根据数据的可用性包括RTO(恢复时间目标:使系统恢复所需要的时间)和RPO(恢复点目标:可接受的数据丢失量)来划分的. 保护级别越高,RTO和RPO也就越少;不过实施的相对成本也就越高.这些级别分别是备份.本地复制.远程复制和实时连续复制. 1.备份 备份是为了在系统出现故障时进行数据恢复,包括磁带备份和磁盘备份等. 磁带备份(B2T,Backup To Tape)是经典的备份方式,将数据备份到磁带上.磁带备份具有容量大.成本低的

MySQL创建字段+数据处理函数+汇总数据(聚集函数)+分组数据

[0]README 0.1)本文部分文字描述转自"MySQL 必知必会",旨在review"MySQL创建字段+数据处理函数+汇总数据(聚集函数)+分组数据" 的基础知识: [1]创建计算字段 1)problem+solution 1.1)problem:存储在表中的数据都不是应用程序所需要的.我们需要直接从数据库中检索出转换,计算或格式化过的数据: 1.2)solution:这就是计算字段发挥作用所在了, 计算字段是运行时在 select语句内创建的: 2)字段定

使用VMware Workstation虚拟机保护数据

使用VMware Workstation虚拟机保护数据 虚拟化实践者之一2016/4/2610:53:13王老师,workstation虚拟机能不能实现,使用一定期限后,自动销毁或不能用啊王春海2016/4/2610:54:59你详细的描述一下你的要求虚拟化实践者之一2016/4/2611:04:46其实就是想对一个文件夹的内容保密,不想让别人拷走王春海2016/4/2611:05:01bitlocker虚拟化实践者之一2016/4/2611:05:19我们领导的意思,看能不能通过虚拟机来实现这

混合云备份如何保护数据并节省成本

网络攻击.人为错误.暴风雪或飓风等情况都可能让你的企业无法正常运作.当这些事件发生时,如果企业没有提前制定计划来维持正常运行和生产力,这可能带来毁灭性的影响. 在很多情况下,现在的全面计划需要依靠混合云备份.曾经昂贵的耗时的数据备份过程已经演变成既可以保护你的数据又可以在几分钟内帮助你恢复业务的做法.现在的专门业务连续性做法可以让企业保护整个系统,以及各个设备设置和快照. 下面让我们看看混合云备份如何帮助你保护你的数据.你的声誉和你的钱: 混合云备份过程会生成一个本地备份和复制的异地备份,同时为

开始准备AWS Developer认证考试--服务器端加密保护数据S3

您有三个互斥选项,具体取决于您选择如何管理加密密钥: 使用具有 Amazon S3 托管密钥的服务器端加密 (SSE-S3) – 使用唯一密钥加密每个对象.作为额外的保护,它将使用定期轮换的主密钥对密钥本身进行加密.Amazon S3 服务器端加密使用可用的最强数据块密码之一(即 256 位高级加密标准 (AES-256))来加密您的数据.有关更多信息,请参阅 使用具有 Amazon S3 托管加密密钥的服务器端加密 (SSE-S3) 保护数据. 使用具有 AWS KMS 托管密钥的服务器端加密

mysql之数据处理函数与数据汇总函数

一.数据处理函数   1.函数 与其他大多数计算机语言一样, SQL支持利用函数来处理数据.函数一般是在数据上执行的,它给数据的转换和处理提供了方便. 注意:函数没有 SQL的可移植性强.能运行在多个系统上的代码称为可移植的( portable).相对来说,多数SQL语句是可移植的,在SQL实现之间有差异时,这些差异通常不那么难处理.而函数的可移植性却不强.几乎每种主要的 DBMS的实现都支持其他实现不支持的函数,而且有时差异还很大.为了代码的可移植,许多 SQL程序员不赞成使用特殊实现的功能.

阿里云发布vSphere虚拟机备份服务 ,网络带宽有限条件下依然能有效保护数据

在6月上旬举行的云栖大会上海峰会上,阿里云发布了vSphere虚拟机备份上云服务(HBR for vSphere),并已经在7月份开始邀测.利用混合云备份服务可以将虚拟机镜像备份上云,避免了传统备份方案复杂的软件部署,存储资源规划,异地备份保护等难点,客户在网络带宽有限的条件下依然能够有效地保护vSphere虚拟机数据. 常见虚拟机备份技术的挑战 传统常见的虚拟机备份方式是把虚机机当做单独的主机,在每台虚拟机上安装备份软件,然后备份到本地的存储,这种方案可以用在虚拟机数目不大的环境,当虚拟机规模

【数据处理】为什么数据要取对数

平时在一些数据处理中,经常会把原始数据取对数后进一步处理.之所以这样做是基于对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系,取对数作用主要有:1. 缩小数据的绝对数值,方便计算.例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了,例如TF-IDF计算时,由于在大规模语料库中,很多词的频率是非常大的数字. 2. 取对数后,可以将乘法计算转换称加法计算. 3. 某些情况下,在数据的整个值域中的在不同区间的差异带来的影响不同.