当阿里云神龙遇上ZStack,弹性裸金属服务器了解一下?

2020-07-29 10:05:46

我们每个人都在享受云时代的红利。

对于普通人来说,在互联网APP上动动手指点外卖,扫码购物骑单车,这些行为大大便利了我们的生活。

对于搭建这些APP平台的程序员来说,开放的云环境、统一的架构也让他们无需考虑底层架构到底采用的是哪个品牌的产品,一份代码就能搞定全局。

对于一线的运维和管理人员来说,逐一调试设备的时代已经成为了历史,一键点击、集群部署,大大降低了原有工作强度。

所以,越来越多的企业用户接入云端,开始享受云服务特别是公有云服务的便捷。但就是在这样的过程中,许多用户也发现,云主机的性能往往跟不上企业的业务需求——云主机的硬件配置比不上物理服务器,导致了计算性能跟不上,IO磁盘读写速度跟不上诸如此类的问题。难道身处云时代的我们就要受限于这样的性能困局吗?

当然不是。

从一代裸金属到弹性裸金属服务器

业界一直在追求,让物理服务器拥有强大的性能与云端平台的便捷管理特性,被定义为裸金属服务器。裸金属服务器的发展大致来说经过了两个阶段。

第一代裸金属解决的方式是通过ISO安装操作系统,或通过预先准备好的磁盘镜像克隆操作系统。然而,除了不灵活这个固有缺点外,最大的问题是慢。在网络和存储方面,既无法通过隔离创建虚拟化网络,也无法使用本地盘以外的存储。

总而言之,一代裸金属是非常传统的IDC管理服务器技术,以至于在云计算平台中使用时,我们完全感受不到云平台带来的便利性。

可见,别看个性鲜明,性能卓越,但是裸金属服务器的发展也并非是一帆风顺。

早在2010年,裸金属的概念就在业界开始传播,包括Softlayer和Rackspace就曾经推出过类似的 “裸金属云(Bare Metal Cloud)。但是在那个云计算还处在蒙昧期的阶段,这种裸金属云的命运也注定就是昙花一现。

直到2016年,RackSpace开始采用OCP服务器和OpenStack的Ironic进行管理,算是为裸金属应用开了一个好头。

真正的裸金属技术,应该让服务器在云平台中有跟虚拟化一样的体验,一句话概括:可以像虚拟化一样使用云平台的所有功能。

2016年,阿里云内部开始研发兼具虚拟机弹性和物理机性能的计算类服务,也就是2017年阿里云对外发布的基于神龙架构的弹性裸金属服务器,又称神龙裸金属。

通俗来讲,弹性裸金属服务器就是传统物理服务器的升级版:既具备传统物理服务器的卓越性能,又具备云主机一样的便捷管理平台,兼容了双方的优点,在满足核心应用场景对高性能计算及稳定性需求的同时,还兼具云计算的弹性、灵活和传统物理机安全物理隔离的特点。

而在随后的2017年开始,裸金属服务明显抬头,包括BAT在内的许多国内IT巨头也开始研发类似产品。时至今日,裸金属的概念已经成为了行业热门。就在不久前,阿里云和华为云都分别发布了新一代的裸金属服务器。

从虚拟化到裸金属,一个时代的轮回

为什么在推出10年之后,裸金属服务器才终于大热了呢?归根结底,还是因为基于传统虚拟化技术的云计算无法满足用户所有的应用需求。我们知道,虚拟化是云计算的核心,甚至在云计算早期更有“云即虚拟化”的说法。就事实来看,虚拟化也为云计算发展提供了强大的平台与基础,借助于虚拟化的优势,云计算颠覆了传统数据中心的硬件架构,更赋予了硬件一定程度的可编程能力。

你可能总听说SDS软件定义存储、SDN软件定义网络等名词,甚至你也听过“软件定义一切”这种说法。但你是否知道?在虚拟化技术出现之前,所有的硬件都是物理形态的,在出厂之前就已经被预制,无法更改。而虚拟化技术带来的根本性变革,是让一台服务器可以同时运行多个操作系统,使得原有的计算、存储、网络资源能够被重新定义,我们才实现了更多的云主机功能。

这就好比手机时代的变革。在10多年前的诺基亚时代,我们使用的手机功能都是固定的,包括QQ聊天和贪吃蛇这样的基础应用都并非是手机标配,而是需要购买特定品牌、特定型号的手机才能使用。智能手机的出现彻底改变了这一局面,无论是苹果还是安卓手机,用户都可以自主安装想用的软件,这也恰恰是互联网时代的典型特征。

虚拟化也同样赋予了传统服务器以“新生”。在使用虚拟化技术之后,用户已经不用考虑如何实现硬件之间的复杂连接,也不需再考虑运行何种操作系统平台。只要实现了硬件互通,剩下的就都交给虚拟化来完成。从计算、存储到网络的整体虚拟化,包括XEN、KVM、VMware等虚拟化软件的出现,使得硬件获得了前所未有的利用率提升,而其带来的灵活性与可编程能力,更是云时代的最大价值。

但是虚拟化并非无懈可击。在为用户带来低成本、高灵活性的同时,虚拟化软件的损耗和不稳定性也带给了用户焦虑。例如我们常讲的“IO路径过长带来的损耗”。没有虚拟化的时候,一个IO操作可能只有2~3步就能触达硬件;但有了虚拟化后,一个IO操作可能要经历6~7步才能到达硬件,每增加一步就多一分损耗。这种损耗在本质上是不可避免的,只能是通过一些技术优化来尽量降低,例如KVM中使用的virtio驱动、Intel的VT指令等。

性能不稳定的问题则更加严峻。对于企业级业务来说,稳定性始终是摆放在第一位的,但是虚拟化之后,许多性能不足的服务器都会出现多个虚拟机之间争抢资源的情况,严重的时候这种争抢也会造成服务器宕机。当然用户可以选择性能更好的服务器,但是这种不稳定的隐患却并非消除,更是加剧了整个集群的风险。

Facebook上最大的游戏公司Zynga就遇到过这样的事情。为了获得虚拟化带来的灵活性,Zynga选择在自家的40000台服务器上运行虚拟机,以此希望最大程度使用物理机的性能,又获得虚拟化的便利。但测试后发现,每台服务器带来的综合性能损耗在10%左右,这意味着40000台服务器就损失了4000台,这是非常大的一笔成本,为了灵活性付出的性能成本。

最终,Zynga采用了裸金属技术,去掉了虚拟化,让操作系统和应用又重新运行在了服务器上。转来转去,似乎又回到了原点。但是,这真的只是原点吗?非也,正如历史发展的螺旋式上升一样,如今的裸金属服务器也有了脱胎换骨的变化。

神龙服务器+ZStack,不一样的精彩

上面我们用了很多笔墨谈了虚拟化与云计算的关系,也简单回顾了裸金属的历史,这都是为了大家更好的理解虚拟化对于裸金属的价值。从某种意义来说,虚拟化就是云计算的核心,同样也是裸金属区别于传统物理服务器的核心。而神龙裸金属服务器所要实现的,就是将虚拟化的思路应用于传统服务器当中,并赋予这些服务器云平台的种种特性与能力。

如果只需要一块小小的神龙芯片,就能将云端的诸多虚拟化功能“无缝同步”到私有云或混合云环境当中,你是否会感觉惊喜呢?

日前,云轴科技(ZStack)公司宣布与阿里云达成合作,双方联合推出基于弹性裸金属技术的神龙私有云平台,通过神龙服务器和ZStack软件的结合,可以将阿里云在公共云领域独有的技术实践成果,敏捷的输出给私有云和混合云用户。

这是一种前所未有的硬件解决方案,也是目前业内首家也是唯一一家基于弹性裸金属技术的“神龙私有云”解决方案,这个方案的推出,奠定了神龙私有云的技术影响力标杆。“我们的很多工作可以由神龙芯片来完成,实现了平台跟处理器一定程度的解耦,也大大提升了系统的适配性。通过这种方式,我们具备非常好的跨平台能力,也能够轻松实现云端管理。”阿里云神龙产品负责人王志坤如是说。

那么,如此神奇的功能是如何实现的呢?这就不能不提到“神奇”的神龙芯片。我们可以这样理解它的实现原理:以往虚拟机是运行在虚拟化软件之上的,我们通过编程虚拟化软件来实现隔离,为虚拟机构建各种网络、存储的拓扑结构;而在神龙服务器上,物理服务器的IO部分是运行在神龙芯片之上的,我们通过编程芯片来实现隔离,为物理服务器构建网络、存储的拓扑结构。

“当把这张芯片搭载在物理服务器后,服务器上运行的操作系统,可以通过自带的front-end pv driver直接访问外部的网络、存储设备,让服务器直接接入云平台提供的网络和存储功能。由于神龙自带了SDN、SDS的北向接口,用户还可以通过对神龙芯片进行编程,为服务器灵活地构建各种网络和存储的拓扑”,ZStack创始人兼CEO张鑫补充道。

这种全新的“神龙私有云”也让用户眼前一亮,来自ZStack的数据显示,目前该方案已经拥有25分钟部署4500个云实例的生产实践,相对于传统服务器的逐一部署来说,在效率方面简直是天壤之别。而在软件层面,ZStack云平台的存储和高级网络功能也让用户耳目一新,IO与网络能力的全新分配也为用户提供了更多性能优化的空间。

“传统IT模式线接好后,设备器配置好后,就不能变了。而如今我们提供的神龙私有云则完全可以使用SDN技术构建新的网络,分布式技术也可以动态为服务器分配磁盘。这就突破了很多传统裸金属的局限性,更加方便灵活,甚至与在公有云里边使用虚拟机一模一样”,说到神龙私有云优势时,张鑫眼中是掩饰不住的兴奋。

性能领先与体验提升固然让人激动,但客户同时也看重成本的控制,尤其是在使用这种新技术的时候也更为谨慎。那么相对于以往方案,神龙私有云的成本会有明显的提升吗?其实在谈到这个问题的时候,我们首先要明确一个概念——对于企业级应用来说,成本并非是一次性采购的费用,还包括在生命周期内所产生的额外投入,比如机房、电力、运维人员等等。

就好比买车——我们不能只看到买车时交的全款或者首付,还要包括后续的保养、保险、故障维修等等。如果按照5-8年的汽车使用寿命来看,这期间投入的成本也是非常可观的数字。

神龙私有云虽然额外配置了神龙芯片,但因为采用了同一个资源池,使得成本并没有明显的上升,却赋予了IT系统更强的灵活性,也能够满足更多样化的应用场景需求。因此就成本来说,神龙私有云可以很好的替代现有裸金属或传统服务器的方式。

如前面所说,如今神龙+ZStack解决方案的应用前景已经非常明朗。通过神龙私有云,客户环境中的物理机服务器不再是传统的服务器,而是可以通过ZStack部署、销毁、控制的智能服务器,不仅能够直接部署业务应用,也可以当做承载虚拟机的物理机去使用。这一切既可通过ZStack UI界面操作,也可通过ZStack API接口控制,让服务器从人工手动操作时代进入到了可编程、自动化时代。

正因如此,神龙私有云一经发布就受到了业界的广泛关注。在对于性能要求严苛的高性能计算领域、追求最大性能优势的容器场景和高度安全性的信创场景中,神龙私有云都能够游刃有余。尤其化解了信创环境中的异构计算平台的多样化问题——异构平台原本受限于指令集,许多虚拟化程序都需要额外编写,支持效果也不理想;但是借助于神龙芯片,可以屏蔽掉信创芯片中的指令集差异,免除了构建虚拟化软件技术与原芯片之间做适配的漫长工作过程。信创的芯片只要接上神龙,就可以使用国内主流云平台的一切功能,原有的存储、网络虚拟化也都可以在芯片上完成,实现了国产服务器+国产操作系统在物理环境的高效、稳定运行。

如今,基于弹性裸金属技术的神龙私有云已经落地了不少案例,其中最大规模的客户已部署了数百台神龙服务器。仅通过两台物理机安装ZStack软件,就能够管控数百台至数千台神龙服务器,获得完整的云平台功能,这应该是目前世界上门槛最低、技术最先进的裸金属解决方案。

正如张鑫所说,神龙私有云不仅仅在中国是第一次,在世界范围内也是第一次。这种解决方案彻底改变了原有私有云环境中繁琐的配置与固化的应用问题,让私有云用户在本地也能够体验到与公有云一样的便捷与弹性。

裸金属的全新时代,正在向我们走来。

关闭
精彩放送