javazx 发表于 2017-3-16 16:06:11

《大规模分布式存储系统》第12章 云存储【12.2】

12.2 云存储的产品形态
早在2006年3月,Amazon就推出了针对企业的S3简单存储服务(Amazon Simple
Storage Service),它是Amazon云计算平台(Amazon Web Service,AWS)的一种对象
存储服务,用于存储照片、图片、视频、音乐等个人文件。S3被认为是目前最为成
功的云存储系统,它定义的云存储应用编程对外接口(API)被Google Cloud
Storage、阿里云开放存储服务(Open Storage Service,OSS)、盛大云存储等国内外云
存储系统所效仿,成为业界对象云存储系统的事实标准。Amazon S3以桶(bucket)
或者目录为单位管理对象,每个桶包含若干个对象(Object),每个对象可以是照
片、图片、视频、音乐等个人文件,支持REST、SOAP以及BitTorrent下载协议。
Amazon S3的应用编程接口如下:
●List Bucket:列出桶中所有的对象。每次操作最多返回1000个对象,如果桶中
元素超过1000个,可以将前一次获取的最后一个对象的主键作为本次获取的起始
点,直到遍历完成。另外,本操作还支持前缀查询,即只列出桶中主键前缀为特定
值的对象。
●Put Bucket:创建一个桶,创建桶时可以选择桶所在的数据中心。
●Delete Bucket:删除一个桶,桶删除之前必须确保其中所有的对象已经提前被
删除。
●Head Bucket:判断桶是否存在且具有访问权限。
●Put Object:创建一个对象并加入到桶中或者修改一个已有对象。如果对象多版
本策略生效,S3会自动为每个新建对象生成唯一的版本号,同一个对象可能存储多
个版本。
●Get Object:读取对象的数据及元数据,元数据包括对象长度,MD5哈希值,
创建时间等。
●Delete Object(s):删除一个或者多个对象。
●Head Object:获取对象的元数据。
S3支持几GB甚至上TB的对象,如果对象过大,可以使用多次上传接口:
●Initial Multipart Upload:初始化多次上传,获取多次上传的编号(upload
ID)。
●Upload Part:上传部分数据,每次请求都要带上上传编号以及本次上传序号
(part number)。如果前后两次上传的序号相同,后一次上传的内容将直接覆盖前一
次上传的内容。
●Complete Multipart Upload:完成多次上传,S3会将之前上传的部分数据连接为
一个大对象。
●Abort Multipart Upload:中止多次上传请求。
用户可以将本地的文件通过Put接口上传到云端,如果文件太大,可以分多次上
传;用户也可以通过List方法读取云端某个桶中包含的所有文件或者通过Get方法读
取某个文件。另外,如果文件太大,可以指定读取的数据范围,从而分多次读取大
文件。
作为AWS的存储部分,Amazon S3云存储服务针对企业和程序员,需要自行开发
使用界面,除此之外,云存储还可以以单独的产品形态提供给个人用户,比如
Amazon“云盘”(Amazon Cloud Drive),苹果iCloud,Google Drive,Windows
LiveSkyDrive,Dropbox,金山快盘等,这类产品称为个人云存储产品。简单地说,个
人云存储产品主要定位是用来存储个人文件的,而且从电脑到手机,从苹果到安
卓,个人云存储可以跨平台,走到哪里,都能访问到你的个人文件,就像使用U盘这
么简单,但又无须随时携带,更不用担心这个U盘会丢失。相比云存储平台,个人云
存储不需要专门的计算实例来托管应用程序,个人用户可以通过各种终端设备,如
PC机,平板电脑,智能手机直接访问云数据中心的存储服务,将终端设备中的个人
数据实时同步到云存储中。通过个人云存储服务,可以实现多个终端设备之间数据
同步,数据分享,备份等功能。
除了个人云存储产品,云存储也经常用于企业的数据集中备份,存档。中小企
业往往没有自建云存储的能力,内部数据管理也比较混乱,通过企业云存储,可以
省去自建和管理的麻烦,并提供一定的灾难恢复能力。
最后,大型互联网服务的后端也构建在互联网内容提供商的私有云存储系统之
上,Google,Amazon,Facebook,Taobao等互联网内容提供商都维护了各自的私有
云存储系统。云存储产品形态如图12-2所示。
图 12-2 云存储产品形态


页: [1]
查看完整版本: 《大规模分布式存储系统》第12章 云存储【12.2】