浅谈云存储技术与应用
甘 肃 科 技 纵 横甘 肃 科 技 纵 横 2010 年(第 39 卷)第 3 期 浅谈云存储技术与应用 张 明 (国家广电总局 2022 台丙机房,新疆 喀什 844000) 摘 要 IDC 研究表明,从 2006 年到 2010 年,全球数据信息总量增长 6 倍以上,一些新推出的磁盘阵列中已经普遍采用了 750GB 或 1TB 的 SATA 硬盘 。目前已知存储密度最高的磁盘阵列可以在 4U 空间内提供高达 42TB 的存储容量 。随着数据量 的不断增加,人们开始对数据存储逐渐苦恼,云存储技术作为一个新兴的技术已经开始走进了我们的生活,帮我们解决了这 一难题 。 关键词 云计算( cloudcomputing);云存储( cloud storage);网格计算( Grid Computing) 近年来云存储变得越来越热,大家众说纷 “云 ”,而 且各有各的说法,各有各的观点,那么到底什么是云存 储云存储是在云计算( cloud computing)概念上延伸 和发展出来的一个新的概念 。云计算是分布式处理 ( Distributed Computing) 、并行处理( Parallel Comput ing)和网格计算( Grid Computing)的发展,是通过网络 将庞大的计算处理程序自动分拆成无数个较小的子程 序,再交由多个服务器所组成的庞大系统经计算分析 之后将处理结果回传给用户 。通过云计算技术,网络服 务提供者可以在数秒之内,处理数以千万计甚至亿计 的信息,达到 “超级计算机 ”同样强大的网络服务 。云存 储的概念与云计算类似,它是指通过集群应用 、网格技 术或分布式文件系统等功能,将网络中大量各种不同 类型的存储设备通过应用软件集合起来协同工作,共 同对外提供数据存储和业务访问功能的一个系统 。云 存储( cloud storage)这个概念一提出,就立即取得了很 多 IT 公司的支持和关注 。全球最大的网上书店亚马逊 公司( Amazon) 在两三年前就推出的 Elastic Compute Cloud( EC2弹性计算云)云存储产品,旨在为用户提供 互联网服务形式同时还提供更强的存储和计算功能 。 内容分发网络服务提供商 CDNetworks 和业界著名的 云存储平台服务商 Nirvanix 联合发布了一项新的合 作,并宣布结成战略伙伴关系,以提供业界目前唯一的 云存储和内容传送服务集成平台 。微软也在 2008 年就 已经推出了提供网络移动硬盘服务的 Windows Live SkyDrive 为 25G 的网络存储空间 。近期, EMC 宣布加入 道里可信基础架构项目,致力于云存储环境下关于信 任和可靠度保证的全球研究协作, IBM 也将云存储标 准作为全球备份中心的 3 亿美元扩展方案的一部分 。 与传统的存储设备相比,云存储不仅仅是一个硬 件,而是一个网络设备 、存储设备 、服务器 、应用软件 、 公用访问接口 、接入网 、和客户端程序等多个部分组成 的复杂系统 。各部分以存储设备为核心,通过应用软件 来对外提供数据存储和业务访问服务 。见图 1 所示 图 1 云存储系统的结构模型 ( 1)存储层存储层是云存储的最基础的部分,处 于整个系统架构的最底层 。存储设备可以是 FC 光纤通 道存储设备,可以是 NAS 和 iSCSI 等 IP 存储设备,也 可以是 SCSI 或 SAS 等 DAS 存储设备 。云存储中的存 储设备往往数量庞大且分布多不同地域,彼此之间通 过广域网 、互联网或者 FC 光纤通道网络连接在一起 。 存储设备之上是一个统一存储设备管理系统,可以实 现存储设备的逻辑虚拟化管理 、多链路冗余管理,以及 硬件设备的状态监控和故障维护 。 ( 2)基础管理层基础管理层是云存储最核心的部 分,也是云存储中最难以实现的部分 。基础管理层通过 集群 、分布式文件系统和网格计算等技术,实现云存储 中多个存储设备之间的协同工作,使多个的存储设备 信息技术 15 1 / 4 2010 年(第 39 卷)第 3 期 甘 肃 科 技 纵 横甘 肃 科 技 纵 横 可以对外提供同一种服务,并提供更大更强更好的数 据访问性能 。CDN 内容分发系统 、数据加密技术保证云 存储中的数据不会被未授权的用户所访问,同时,通过 各种数据备份和容灾技术和措施可以保证云存储中的 数据不会丢失,保证云存储自身的安全和稳定 。 ( 3)应用接口层应用接口层是云存储最灵活多变 的部分 。不同的云存储网络运营商可以根据实际业务 类型和需求,开发不同的应用服务接口,提供不同的应 用服务 。比如视频监控应用平台 、IPTV 和视频点播应用 平台 、网络硬盘引用平台,远程数据备份应用平台等 。 ( 4)访问层任何一个授权用户都可以通过标准的 公用应用接口来登录云存储系统,享受云存储服务 。云 存储运营商不同,云存储提供的访问类型和访问手段 也不同 。 在国外,已经有非常多的企业开展了云存储服务, 最典型的便是 Google 的 Gmail,同样,以亚马逊为主的 云存储厂商已经为许多大型企业甚至中小型企业开展 了大量云存储服务,但是目前,在国内,云存储可以说 只是在一个刚刚起步的阶段,很多企业的 CIO/CTO 甚 至都不明白什么是云存储,很多企业的 CIO/CTO 对云 存储还是持有怀疑态度,大约有 70的企业不愿意将 企业内的数据存放在云上,主要是从安全性的角度考 虑,但是,数据信息对于企业业务投入越来越大,将迫 使企业特别是对数据安全性非常高的金融业逐步走向 云 。国内的企业观念更习惯于花钱购买硬件产品而非 服务,作为存储需求最大的政府 、电信 、金融三个行业, 现在都已都拥有自己的数据中心 。在中小企业市场,目 前 90的中小企业在存储采购只有 10的水平,目前, 国内采购云存储能力还是非常低,云存储市场的潜力 还是非常大 。iStor 去年在北京举办了题为 “云运算带来 的存储变革 ”的研讨会,受到国内外存储厂商和媒体的 极大兴趣和关注 。iStor 的 iSCSI 存储系统市场,是以 10 万兆以太网而闻名,公司现任 CEO 黄景聪表示 iSCSI 市场仍然保持高速增长,随着远程办公室 、多媒体 、互 联网数据中心(云存储)等应用的发展, iSCSI 由于其天 然的对互联网,甚至是未来物联网的良好支持与融合 性,仍然是目前最热门的存储领域之一 。全球信息管理 解决方案的领导者 EMC 公司与中国电信股份有限公 司上海分公司在去年也宣布正式推出面向家庭和个人 用户的运营商级的云信息服务 “e 云 ”,它可以按照用 户的个性化定制,自动将信息备份到中国电信上海公 司的 “e 云 ”数据中心,当遇到电脑破坏 、数据破坏 、误删 除 、远程办公等情况时,可以通过互联网恢复在 “e 云 ” 备份的任一个时间点的数据,据悉, “e 云 ”由中国电信 上海公司提供机房 、销售 、带宽 、第一线技术支持等所 需要的产品运营环境,由 EMC 公司提供设备 、软件 、二 级技术支持和技术开发 。在中国电信上海公司 “e 云 ”这 一首创的服务中, EMC 公司注入了在国际上经过百万 级用户和 PB 级数据存储验证的 Mozy 在线数据备份服 务模式, EMC 公司子公司 Decho 全新开发的个人信息 管理服务模式;中国电信上海公司则提供了雄厚的带 宽资源 、高可靠的机房环境,成功运作上海热线网站 、 号码百事通 、IPTV、商务领航 、互联星空等互联网服务 的经验,以及从长三角辐射全国的市场渠道 。XIV 是 IBM 提供的新一代存储产品,它采用网格技术,极大的 提高了数据的可靠性 、容量的可扩展性 、系统的可管理 性 。它具有海量存储设备 、大容量文件系统 、高吞吐量 互联网数据访问接口和高级管理系统的设计特征 。XIV 由于其独特的设计,使之天生就具备海量的存储能力 与强大的可扩展性,能够满足各种 Web20 应用的需 求,是一个理想的实现云存储的产品 。XIV 产品具备 IBM 信息管理 、保护 、归档等重要职能,是 IBM 信息基 础构架和存储关键的组成部分,也是 IBM 能够重新定 义存储的理念的一个产品 。XIV 结构把中端和高端存 储的特点结合在一起,当用户有了新的业务,或者数据 快速增长,并能够预计未来业务有高速度增长,数据类 型复杂的环境 。 惠普在云存储方面也具备丰厚的技术储备和积 累,例如 SFS 技术,存储网格技术等等 。ExDS9100 ( StorageWorks 9100 ExtremeDataStorage) 是针对文件 内容的海量可扩展存储系统,该系统结合了惠普 Poly Serve 软件 、BladeSystem 底盘以及刀片服务器以提高性 能,还使用了被称为 “块 ”的存储 。ExDS9100 专为简化 PB 级数据管理而设计,为 Web20 及数字媒体公司提 供的全新商业服务,包括图片共享 、流媒体 、视频自选 节目及社交网络,所带来大量的以文档为基础数据完 全满足即时存储与管理的需要 。同时可满足石油及天 然气生产 、安全监控及基因研究等大型企业的类似需 求 。ExDS9100 是一个统一的系统,配备以下三种主要 配件 Peranceblock 方面高能效的 HPBladeSystem 机箱配备刀片服务器,可满足海量高性能运行的需求 。 基本配备包括四块刀片,可扩展至 16 块刀片配置,每 个单元拥有高达 128 个核心,性能可以达到每秒 32GB。Capacityblock 方面基本配置提供三个高可用 性的存储块,及高达 246TB 的存储容量 。最高配置能支 持达 10 个存储块,提供 820TB 的存储容量 。Software 方 信息技术 16 2 / 4 甘 肃 科 技 纵 横甘 肃 科 技 纵 横 2010 年(第 39 卷)第 3 期 面该系统采用 HP 的文件集群技术,满足 Web20 及数 码环境的严格要求 。为降低系统的复杂性及成本,应用 程式可直接在服务器模组上运行,删除不必要的软件 层 。透过单一的图像管理界面,用户能够轻松管理更多 的存储产品和设备 。随着云存储技术应用的成熟,已有 越来越多的企业加入到了云存储的大军 。 云存储技术相对于传统的存储技术有很大的优 势 。云存储是通过将文件复制并且保存到不同的服务 器,解决了潜在的硬件损坏而导致数据丢失的难题 。云 存储知道文件存放的位置,在硬件发生损坏时,系统会 将自动执行将读写指令连接到存放在另一台存储服务 器上的文件,以保持服务的继续 。传统的存储系统升级 时,需要把旧的存储设备文件备份出来后,然后停机换 上新的存储设备,这将导致服务的停止,云存储并不单 独依赖一台存储服务器,因此存储服务器硬件的更新 、 升级并不会影响存储服务的提供,系统会将旧的存储 服务器上的文件迁移到别的存储服务器,等新的存储 服务器上线后,文件会再迁移回来 。在新增一个服务项 目时,有时会对数据的增长判断错误,导致提前采购的 浪费,云存储的扩容非常简单,并且分配给每个项目的 存储容量可以超过实际的存储容量,例如硬盘总容量 只有 100TB,系统却可以设置 200TB 甚至 300TB 的容 量给项目使用,等到 100TB 快用完时,再采购服务器即 可 。这对存储服务供应商特别有利 。传统的存储采用串 行扩容,不管它接多少扩展箱,总是有个极限,云存储 采取的架构是并行扩容,容量不够了,只要采购新的存 储服务器即可,容量立即增加,几乎是没有限制的 。传 统的存储是基于物理卷作映射的,如果应用端需要同 时读取好几台存储时,必须将每个存储都连接到应用 端,这对需要能同时看到所有数据并作索引的应用是 很困难的 。云存储提供统一的名称,允许应用端用这个 名称存取整个存储池的数据,这对于应用端开发非常 方便 。当有好几台存储设备时,不可避免的,会有工作 量分配不均的现象,有些存储没有在使用,有些则负载 过量,这会导致整体存储效能的瓶颈,云存储会将工作 量均匀分配到不同存储服务器,避免个别存储服务器 工作量过大造成瓶颈,以使得存储系统发挥最大效能 。 传统的存储管理非常复杂,不同存储厂商有不同的管 理界面,数据中心人员经常需要面对不同的存储产品, 这种情况下,了解每个存储的使用状况(容量 、负载等 等),变得非常复杂 。对云存储来说,再多的存储服务 器,在管理人员眼中,只是一台存储,管理人员只要在 整体硬盘容量快用完时,采购服务器即可,每台存储服 务器的使用状况,都可以在一个管理界面上看到 。传统 的存储对硬盘的一致性要求近乎苛刻,必须同厂牌 、同 容量 、同型号,否则系统运作很容易出现兼容性问题 。 IT 产业每时每刻都在发生变化,系统在使用 23 年后, 硬盘损坏时,往往找不到同型号的硬盘更换,使用云存 储则不存在这个问题,云存储的设计原理对硬盘一致 性没有要求,不同介质 、容量 、厂牌 、型号的硬盘,都可 以一起工作,这样可以保护用户先前硬件的投入,不会 浪费 。但是,云存储的建设需要大量的投入,中国国内 的企业很少有这么大的实力 。如果国内企业来承建云 存储,则需临着非常大的资金压力 。国内的云存储市 场,大部分客户都是政府或者大型企业,客户群比较局 限 。建立云存储服务,在国内用户没有达到一定数量的 情况下,如何维持一个云存储数据中心是个非常大的 难题 。另外,在你决定选择一家云存储技术提供商之前 必须弄清所有关键问题如果数据保密性 、隐私性 、销 毁保密的信息以及安全性出现问题,谁来负责如果数 据丢失,是谁的错现有一些主要提供商的服务等级协 议关于某些条款的描述是非常模糊的,例如承诺恢复 和确定数据损毁 。 虽然云存储服务还有很多问题,但它已经成为未 来存储发展的一种趋势 。目前,云存储厂商正在将各类 搜索 、应用技术和云存储相结合,以便能够向企业提供 一系列的数据服务 。未来中国云存储市场的发展趋势, 主要还是要从安全性 、便携性及数据访问等角度进行 发展 。从云存储诞生,安全性一直是企业首要考虑的问 题之一,对于想要进行云存储的客户来说,安全性通常 是首要的商业考虑和技术考虑 。但是许多用户对云存 储的安全要求甚至高于它们自己的架构所能提供的安 全水平 。既便如此,面对如此高的不现实的安全要求, 许多大型的可信赖的云存储厂商也在努力满足它们的 要求,构建比多数企业数据中心安全得多的数据中心, 并通过可与 NSA(美国国家安全局)媲美的加密层和保 护层来保护存储中的数据 。随着新的技术的应用,用户 可以发现云存储具有更少的安全漏洞,而且云存储所 提供的安全性水平要比用户自己的数据中心所能提供 的安全水平还要高 。一些用户在考虑托管存储的时候 还要考虑数据的便携性,一些大型服务提供商所提供 的解决方案承诺其数据便携性可媲美最好的传统本地 存储 。在未来的几年内,云存储将拥有强大的便携功 能,可以将整个数据集传送到你所选择的任何媒介,甚 至是专门的存储设备 。最新一代云存储有突破性的成 就,体现在客户端或本地设备高速缓存,( 下转 95 页 ) 信息技术 17 3 / 4 甘 肃 科 技 纵 横甘 肃 科 技 纵 横 2010 年(第 39 卷)第 3 期 (上接 17 页 )将最经常使用的数据保持在本地,从而有 效地缓解互联网延迟问题 。通过本地高速缓存,即使面 临最严重的网络中断,这些设备也可以缓解延迟性问 题 。这些设备还可以让经常使用的数据看起来像本地 存储那样快速反应 。通过一个本地 NAS 网关,云存储甚 至可以模仿中端 NAS 设备的可用性 、性能和可视性,同 时将数据予以远程保护,且这种数据保护水平只有少 数企业才能做到 。如今网络运行商仍将继续努力实现 容量优化和 WAN(广域网)优化,以保证互联网带宽完 全适合超大数据量访问云存储从而尽量减少数据传输 延迟性 。此外,一些厂商还将提供一套组件,在完全本 地化的系统上模仿云地址,让本地 NAS 网关设备继续 正常运行而无需重新设置 。如果大型厂商构建了更多 的地区性设施,那么数据传输时间将更加缩短,更重要 的是,即使你的本地数据发生了灾难性的损失,厂商们 也可以将数据再重新传输给你 。 参考文献 1 王灵俊 云计算 21 世纪的商业平台 M 北京电子工业出 版社, 2008 2 邹恒明 计算机的心智操作系统之哲学原理 M 北京机 械工业出版社, 2004 3 张云涛,龚玲 .数据仓库与数据挖掘 M 北京电子工业出 版社, 2004 篇法等 。 2.1 风格法 人们在运用语言进行表达时,会呈现出不同的格 调 、风范和色彩 。有的人表达言辞犀利,有的人表达含 蓄婉约;有的人表达轻松活泼,有的人表达严肃庄重 。 这些有的是天生的,有的是受长期环境的影响练就的 。 总之,每个人的书面语都表现出自己的风格特点,反映 了各自的个性 。正因如此,我们便可以使用风格法来进 行语言识别 。风格与人的性格 、职业 、身份 、文化 、出身 都有直接的关系,它是由个人习惯应用的句式 、选择词 语的特点和独特的修辞方式等综合形成的 。我们通过 分析语言材料中的风格特征 、某些词语出现的频率 、遣 词造句的习惯等方面,就可以为破获案件找到线索,进 而找到作案人 。 2.2 语体法 我们知道,语体有口语 、书面语或口语书面语混同 之分 。这是由于针对不同的环境,人们在运用语言时会 自觉不自觉地有所取舍,以适应不同的场合 。可以说, 不同的人使用不同的语体,不同的语体反映不同人的 特征,它们之间有着有机的联系 。试想,一个大字不识 的文盲,要他写出文绉绉的东西来恐怕是不现实的;同 样一个受过良好教育的人,要他写出粗俗的文字也很 难做到 。一个文化人,即使想要写成粗俗的言词,也往 往会在语句中间流露出有文化的痕迹,因为习惯一旦 养成是不容易改变的,其长期的职业 、工作性质的熏陶 会在他的笔下有意无意地得到体现 。这些早已经潜移 默化成为其个人语言特征的一部分,是无法掩饰的 。基 于这些不同的语体特征在不同人身上的表现,便可对 案件侦查产生积极的意义 。 2.3 语篇法 一个人布局谋篇,常常会受其思维定势的影响,形 成某些固定的程式 。有的人喜欢开门见山,有的人喜欢 曲径通幽;有的人喜欢总分总的结构,有的人喜欢总分 或分总的结构;有的人分段比较自然,该长则长,该短 则短,条理清楚;有的人不分段或段落很长,前言不搭 后语 。这些现象都反映出作案人的文化水平 、个人修 养 、语言结构的使用特点,可以有效地为案件侦破提供 有价值的信息和线索,充分体现文如其人 。例如某乡乡 长张某收到一封敲诈勒索的匿名信,写道 “张某记着, 你小子不带 2 万元在某日晚 11 点到乡东头老槐树下 等着,老子就放你的血,并要你全家的狗命 ”这里不难 看到写信者所用的句式为口语句式,口气粗大凶狠,直 截了当,言辞激烈,可以判断为年轻粗暴 、文化教养不 深的男性所为 。后经布网守候,抓获犯罪嫌疑人,证实 该判断是准确无误的 。 因此,无论是风格法,还是语体法和语篇法,都是 以特定的语言材料为基础,通过分析 、归纳语言材料表 现出来的语言特征及用语规律,确定可能的犯罪嫌疑 人 、被告人,确认相关的语言证据,最终促进司法活动 的顺利完成 。只要熟练灵活地加以运用,切实掌握语言 识别,那么对于及时准确地打击违法犯罪将有着深远 的意义 。 参考文献 1 季华权 .言语识别纵论 J .江苏公安专科学校学报, 1995( 3) 47. 2 王洁 .法律语言学教程 M .北京法律出版社, 1997 2. 3 潘庆云 .跨世纪的中国法律语言 M .上海华东理工大学出版 社, 1997 344. 财经与法 95 4 / 4