虚拟化技术还要翻越“七座大山”(1)(2)
第四座大山:虚拟SMP高性能服务器技术
由于DHVMM提供了部件虚拟化技术,由此计算所发展了新型的内存共享技术和动态部署技术,因此,传统的SMP服务器的体系架构已经不能满足需求,必须研究新型的体系结构以构建大型虚拟SMP高端服务器。完全支持目前的TCC协议的transactional shared memory(事务块共享存储)技术还是很难直接应用在实用的高端商业虚拟服务器中,其中的原因与传统的高性能计算技术一样,还是应用并行化的困境,还没有高效的编译器能够自动将主流系统软件和大型应用软件如Oracle数据库事务化(transactionalize),因而不得不依赖于编程人员的经验和智慧。
另一个目前难以克服的障碍是事务块共享存储技术中引入了对要读取的共享变量的"预测",因此就必须考虑预测失败的异常处理。通常的做法是回溯(rollback),因而代价高昂。考虑到这些现实的阻碍,需要研究创新的基于软件实现的虚拟SMP体系架构,要求能不依赖于编译和手工进行事务块共享存储的优化,要面向部件虚拟化技术,使其具有良好的可扩展性和高可用性,既支持传统的共享内存和消息传递编程模式,也支持UPC和TCC等新的编程模式,以提高系统的生产率。
第五座大山:对PB级存储的支持
现代的高端商用服务器面临对存储能力的巨大需求,因此计算所研究的服务器必须能够提供PB(Peta Byte,1015)级存储能力的支持。传统的PB级存储系统可能是基于光纤通道(Fibre-channel)的SAN存储网络,也可能是基于 infiniband网络技术的存储系统,例如Oracle RAC。而计算所将把两者的优势结合起来,研究一种基于Infiniband 网络技术的SAN存储系统(IB-SAN Infiniband Based Storage Area Network)。同时,加入磁盘部件的虚拟化技术,这个技术不仅是前面提到的DHVM的基础之一,也是IB-SAN的基础。
对于GPU,内存和磁盘从本质上来说是没有区别的,都是用来提供和存储数据和指令的,差别在于访问速度和由此决定的成本。在PGAS编程模型中,存储空间应该是统一的(包括内存和磁盘,本地和远程),以此为基础构建分布式基于软件(也支持硬件)的RAID以提高存储的可靠性和吞吐率。
第六座大山:支持GB级I/O的刀片服务器
机群架构是目前服务器领域的最重要体系结构。将标准服务器通过网络以松散耦合的方式集中在一起,统一运行、监控管理和维护就是所谓的机群系统。它可以用远低于原来大型机系统的费用来获得高性能的服务,具有很高的性价比。
但是随着机群计算结点数目的日益增加,传统机架式机群系统的不足就日趋明显。第一、受机柜高度和传统1U机箱的限制,计算密度比较疏松; 第二、安装维护工作量大、成本高; 第三、对于大规模机群,功耗日益成为瓶颈; 第四、缺乏智能而有效的管理监控。
针对上述问题,2000年左右,工业界出现了刀片服务器,刀片服务器就是一个卡上的服务器--在一个单独的主板上包含一个完整的计算机系统,包括处理器、内存、网络连接、少量的本地磁盘存储,并提供外部存储访问的途径。每个刀片服务器都有其自己的操作系统,因此管理员可以为不同的应用或终端用户分配单独的刀片服务器,并且刀片服务器的插入或移去不影响其他刀片服务器的运行(热插拔)。如果将多个刀片服务器插入一个共享机箱中,那么该机柜的基础设施,例如电源、冷却设备、网络交换机和硬布线等就能够共用,同时具有冗余特性。所以,计算所将研制高性能的基于Infiniband的刀片服务器作为目标平台,研究新型支持多核CPU的计算刀片、主板、相应的输入/输出模块和管理与交换模块,并设计相应的机械结构,解决散热问题。
第七座大山:虚拟机技术下的入侵防护
计算所研究的虚拟SMP是由物理独立的服务器构成系统,共同为用户服务。它们通常是松散耦合,通过高速互联网络连接起来,因此极易受到网络的攻击。为此,必须结合计算所研究的服务器体系结构特点,研究虚拟全域可扩展分布式入侵检测引擎(Virtual Intrusion Detection System Sensor; VIS),探测能力服务域内基于物理和软件虚拟机之上的内外网攻击行为。
分享按钮