Page 31 - BP_202109
P. 31
处理的原始数据,这些数据被称为源数据或原子数 在不给用户增加负担的情况下优化存储成
据。数据在没有特定组织的情况下在其中被推送的 本,采用自动化方法可以称为“体贴周到”。这样
巨大位元桶是数据湖的一种形式。处理后的数据被 的架构亦称为分层存储,它们并不新鲜,特别是对
称为“熟”数据,但这种称谓不多见。 于本地设施。在非云数据中心中,在可访问性和
原始数据不一定被称为“信息”,原因是需有 速度非常重要的情况下,使用高性能存储进行编
一个抽象或应用层面的使用,通过处理完成,将其 辑、合成或渲染的实践是很常见的,这就是所谓的
价值从原始提升到信息目的。数据坑是建立在大数 第1层(Tier 1)存储。
据技术基础上的单一用途的数据集市,本质上是来 大型SAN或光纤通道数据存储可能是一个费
自数据湖的提取物。 钱的主张。并非所有的数据工作流程都需要这个
能力,所以需求不高的数据通常被推到第2层(中
按需存储 层)环境中。很少被使用或留出来用于保护或冗余
人们都不愿意为自己不需要或不用的东西付 (长期)的存档数据被认为是第3层(Tier 3),
费。在云中,存储服务是按需提供的,可根据需要 它可能在磁带或对象存储器(或两者)上。有些人
弹性增减存储容量。选择云存储消除了购买、管 还可能把第3层用作一次性事件,将数据推送到云
理、折旧和维护存储基础设施的需求(图2)。 上(称为深度存档),因为他们知道短期内不需要
快速调用。
云存储优点
通过智能降低成本
在云存储历史的早期,将数据移动到不同的数
可扩展
据容器是人工和通过用户的具体指示完成的。虽然
更深存储可能有成本优势,但对于那些早期的云存
储用户来说,这种人工工作并无好处。
灵活
随着各种新服务的出现,数据量的增加以及
用户对云提供商的接受度(即信任度)的不断提
多用户 高,情况已经变化。
通过学习数据使用模式的元素,2017-2018年
期间引入了云存储层间无人参与的云存储迁移。
更简单的数据迁移 通过在云存储之间自动迁移数据,用户和云提供
商获得了新的优势。通过简单地识别数据的访问
时间,云提供商将把休眠状态存储器转移到一个
更低成本的灾难恢复 “更深”的层次,无需联系数据的用户/所有者。
用户通常在注册或建立特定SLA时授权自动迁
移。 操作可能通过与工作指令或行动有关的用户
图2 云存储的5个主要优点
界面或API。随着时间的推移,向这一做法增加智
云模式从根本上降低了每GB存储的成本。 能也在不断发展。智能分层为云服务提供商提供了
不过,云存储提供商,也被称为托管服务提供商 将存档层扩展到其它层的机会,这反过来相应地改
(MSP),可能会增添与那些自有的、本地存储 进了成本结构。
不同的营运开支。增加的运营成本可能会令某些基
于云的技术变得较昂贵,这要看是否考虑了存储的 适应性
使用方式和使用时间等因素。在选择和构建云存储 当使用云存储服务时,用户应该观察自动化选
解决方案时,要寻找各种选项。 项,并通过云提供的模型评估分层和自动化存储选
项的价值。对于持续数月到数年的大型项目,一系
体贴周到的访问重排 列指引可能是适当的。使用跨多个活动的共享数据
云提供商为其各种服务、实用工具和体系结 集的小型项目可能会产生不同的答案。
构编制了许多有用且适当的名称。截至2021年, 在沿着任何云存储路径走之前,要对特定工作
Azure和AWS各提供200多种不同的产品和服务。 流的数量、频率、容量和适用性进行试验。不要让
根据适当价格调整数据存储器并利用云中的不同位 “我没有注意到这”的借口成为更高的存储成本的
置的概念是一个日益流行的话题。 理由,这样做提供不了更好的结果。 B&P
31