目前,一些公司、开源组织和学术界都提出了云计算平台或基础设施。比较著名 的有:
(1) Google 的云计算基础设施:
它主要由分布式文件系统 GFS,大规模分布式数据库 BigTable,程序设计模式 Map/Reduce,分布式锁机制 Chubby 等几个相互独立但关系紧密的系统组成。
(2)IBM“蓝云”计算平台:68520
该平台由一个数据中心、IBM Tivoli 监控软件(Tivoli Monitoring)、IBM DB2 数 据库、IBM Tivoli 部署管理软件(Tivoli Provisioning Manager)、IBM WebSphere 应用服 务器,以及开源的虚拟化软件和一些开源的信息处理软件组成。“蓝云”采用了 Xen、 PowerVM 和 Hadoop 技术,来帮助用户构建云计算环境。
(3)Amazon 的弹性计算云: 它建立在公司内部的大规模计算机、服务器集群上,为用户提供网络界面,来操
作在“云端”运行的各个虚拟机实例。用户对自己的虚拟机拥有完整的访问权限,包 括对该虚拟机 OS 的管理员权限。
(4)学术领域提出的云平台:
Luis M.Vaquero 等[12]设计了云计算平台的层次结构。在该结构中,服务提供商 (Service Providers)负责为服务消费者(Service Users)通过网络访问提供各种应用服务; 基础架构提供商(Infrastructure Providers)则以服务的形式为服务提供商提供基础设
施。这样就降低了服务提供商的运营成本,表现出更大灵活性和可伸缩性。 澳大利亚墨尔本大学(University of Melbourne)的 Rajkumar Buyya 等[13]提出了一
种云计算平台原型,它面向市场资源分配,其中包括用户(Users/Brokers)、服务等级 协议资源分配器(SLA Resource Allocator)、虚拟机(VMs)、物理机器(Physical Machines) 等 4 个实体(层次)。
清华大学张尧学[14] [15]教授的研究团队提出了“透明计算平台”。该平台的体系结 构[16]包括:(1)透明客户端(Transparent clients)包括各种 PC、笔记本、PDA、智能手机 等;(2)中间的透明网络(Transparent network)整合了各种网络传输设施,用以在各种透 明客户端与后台服务器之间完成数据的传递,使用户无须意识到网络的存在;(3)透 明服务器(Transparent servers)不拒绝任何可能的方式来提供服务,可以通过当前流行 的 PC 服务器集群方式,也可通过使用大型服务器等方式。论文网
(5)开源云计算平台:
由于有 Yahoo、Amazon 等公司的直接参与和支持,Hadoop 已然是目前最成熟、 应用最广的云计算开源项目,也得到了研究界的普遍关注。例如,Facebook 使用 1000 节点的集群运行 Hadoop,以存储日志数据,支持在 Hadoop 上运行的数据分析和机器 学习程序;百度用 Hadoop 处理每周 200TB 的数据,进行网页的数据挖掘工作和搜索 日志的分析。很多高校和科研院所也对 Hadoop 进行了各方面的研究,包括作业调度、 数据存储、性能优化、资源管理、系统高安全性和可用性等方面,得到的许多研究成 果大多以开源的形式贡献给了 Hadoop 社区。
此外,国内外的许多开源云计算平台项目也都具备了相对较为完备的体系结构, 比较成熟的包括 AbiCloud、Eucalyptus、Nimbus、MongoDB、ECP 等项目。
大数据已经成为了一种发展趋势,未来,由于信息技术的发展,人们会越来越多 地认识到大数据的价值。如何更好更快地利用这些数据将成为人们研究的重点, Hadoop 及其相关的技术将必不可少。而本文所研究的内容,也是适应这种趋势的一 个尝试。
云计算平台的国内外发展研究现状:http://www.youerw.com/yanjiu/lunwen_77082.html