刀片服务器在中小企业中的风险——破除刀片服务器的迷思

刀片服务器是当今数据中心中最热门的趋势。我相信你已经听过这样的宣传:成本更低、效率更高。诚然,刀片服务器在过去几年里取得了长足的进步,看起来比以往任何时候都更出色,但要考虑将刀片服务器引入你自己的企业,这是一件应当非常慎重地加以考量的事情。刀片这一理念本身固有许多隐藏的风险,它们常常被忽视,而这些隐藏的风险可能在你早已认定刀片服务器这一思路之后,仍久久萦绕、困扰着你。
在我们深入探讨刀片服务器本身之前,我想先讨论一下刀片服务器究竟是什么。根据 Wikipedia 的说法:“刀片服务器是经过精简的计算机服务器,采用模块化设计,以尽量减少物理空间的占用。标准的机架式服务器(至少)只需一根电源线和一根网线即可运行,而刀片服务器则移除了许多组件,以节省空间、降低功耗并满足其他考量,同时仍然具备被视为一台计算机所需的全部功能组件。”明确刀片服务器的定义十分重要,因为有一种做法已经变得司空见惯,尤其是在二手服务器市场中——经销商会用“刀片”一词来指代标准的 1U 和 2U 机架式服务器,企图借此混淆那些刚接触刀片市场的客户。刀片服务器是一个特定的硬件类别,需要配合机箱使用,而不仅仅是“小型”服务器。刀片服务器使用机箱中的共享组件,例如电源和远程管理控制台,从而减少了每台独立刀片服务器中所需的组件。
刀片服务器的第一个风险是成本。刀片机箱通常非常昂贵,尽管刀片服务器本身往往比其机架式对应产品更便宜。在对某大型刀片供应商产品的一次快速价格比较中,机箱的价格约为 5,000 美元,最多可容纳八台刀片服务器。每台刀片服务器大约比该供应商规格相同或相近的机架式服务器便宜 500 美元左右。这意味着,按目录价计算,来自该供应商的一个满配刀片机箱,将比同等算力的传统外形规格设备贵 1,000 美元。而每一个未被填满的刀片插槽,都意味着额外 500 美元的亏空。
刀片的成本不仅仅是一个总成本因素。刀片机箱通常可容纳八到十六台刀片服务器,必须预先购买。如果你需要的服务器数量足以匹配一个机箱的容量,那么这就不成问题;但如果你眼下只想购买一台服务器,那么你可能正在为预期中未来服务器集群的增长进行一笔可观的投资。这既意味着风险增加,也意味着一笔有悖于你资金时间价值的投资。
硬件成本始终是一个难以精确确定的数字。供应商所报出的价格很少反映实际情况,而且正如大多数公司所知,只要你坚持要求,就能拿到大幅降低的价格。举例来说,我就知道有公司免费拿到了它们的刀片机箱,这彻底改变了刀片服务器的成本核算。但同样需要记住的是,如果刀片机箱可以免费获得,那么传统机架式服务器很可能也能拿到大幅折扣。因此,即便目录价并非绝对价格,它往往也是判断相对价格的一个不错的依据。具体情形会因人而异——因此,要针对你的特定状况以及你从供应商处所获得的交易条件,进行尽职调查,做出恰当的成本分析。
刀片的第二个风险是技术过时。传统机架在数十年间几乎一成不变,而刀片机箱则是新生事物,且相对处于不断变化之中。自 2001 年问世以来,已有数代刀片机箱更迭交替,迄今为止,每一个后续世代都要求企业更换其机箱以支持新的刀片服务器。如果你购买服务器的频率不够高、数量不够大,不足以证明机箱技术更替换代的合理性,那么这就是一个高风险。随着技术的成熟,这种变化的速度正在放缓,但风险依然存在。在对刀片服务器进行恰当的成本分析时,需要将这种变化速度纳入考量。
第三个风险是供应商锁定。传统机架技术是与供应商无关的。大多数企业不仅会在其机架中混搭服务器,还会混搭电池、路由器、交换机、监控设备及其他装备。刀片则是与特定供应商绑定的。对于大型企业而言,这几乎或完全无关紧要。但在服务器数量有限的小型企业中,不放弃使用不同供应商和技术的能力可能至关重要。这既可能成为对技术的限制,也会限制企业未来获取优惠供应商价格折扣的议价筹码。
以一家希望在当下运行配备 Intel Itanium 处理器的 HP Integrity 刀片的企业为例。它们投资购置了刀片机箱并开始使用。三年后,它们购买了运行于 Sun UltraSparc 或 IBM Power 处理器之上的软件。为了使用刀片,这些技术中的每一种都将需要其各自品牌的刀片机箱,并将大大增加小型企业中机箱无法被填满的风险。使用传统机架式服务器在技术上要灵活得多,因为每家供应商通常会提供一套基于 RISC 或 EPIC 的系统,以及一套基于 AMD / Intel 的通用商品化系统。如果你想要的不止于此,那么对于小型企业来说,刀片将变得相当难以管理。我曾亲身与那些经常像这样使用多种技术的企业打过交道,这使得刀片在当下成为一个极为艰难的选择,更不必说还要考虑未来潜在的平台决策了。此外还必须提到 Apple Mac OSX 的使用,由于 Apple 并不提供刀片服务器,因此任何基于 OSX 的服务器部署都无法集成到刀片机箱中。
第四个风险是共享背板及其他关键组件。刀片机箱尽管通常以海量冗余和真正令人惊叹的设计构建而成,却仍然代表着一个必须加以考量的单点故障。如果你的机箱发生故障,你失去的将不只是一台服务器,而是多达十六个物理服务器平台。对于机架式服务器,你只需添加一台额外的服务器即可增加冗余——通常是为每台你所需的服务器配一台与之匹配的服务器。而对于刀片,要达到同等级别的可靠性,你就必须拥有冗余的机箱。同样,对于大型企业而言,这微不足道且显而易见。而对于小型企业来说,为实现完全冗余而突然需要拥有双机箱,往往会导致它们干脆放弃这一级别的保护,从而增加风险。
第五个风险在于灵活性的代价。小型 IT 部门可能并不经常四处搬动其设备。不过,这种选择通常是存在的。如果一家小型企业拥有三台服务器,并用一台崭新的设备替换了其中一台,那么几乎总是可以选择将旧服务器重新部署到公司其他地方的另一个角色上——也许是在某个分支机构。而对于刀片,旧的刀片只能重新部署到拥有与其被取出的机箱相匹配的刀片机箱的地点。这是一种在服务器生命周期后期所丧失的机会成本,并且在刀片的成本分析中常常被完全忽视。如果没有一个现成的位置来安置一台较旧的服务器,那么在刀片模式下,它被弃用而非重新部署的可能性就要大得多——除非该公司规模足够大,拥有许多同一世代、且有可用空间随时准备接纳一台较旧服务器的机箱。
刀片的第六个风险是高昂的存储成本。如今,存储本身就是一个独立的话题,可选方案有 SAN、NAS 和 DAS。各种规模的企业都在迅速转向 SAN 和 NAS,只要部署了足够的网络存储,便可以缓解与刀片服务器相关的诸多存储风险。然而,许多企业却陷入了循环论证:以刀片为由证明 SAN 的合理性,又以 SAN 为由证明刀片的合理性。从整体视角来审视服务器与存储的全局至关重要。
一台典型的刀片服务器只能容纳一到两块 2.5″ 的 SAS 或 SATA 硬盘。这远少于一台典型的机架式服务器所能提供的潜在存储空间。在流行的 2U 机架式配置中,常常可以见到八到十六个硬盘托架可供使用——有时使用的是 3.5″ 硬盘而非 2.5″ 硬盘。一款流行且极具成本效益的 2U 服务器,可以在十四个盘位上容纳 28TB 的低成本存储。你无法将这种类型的存储装入刀片机箱。由于根本无法提供本地磁盘空间,刀片服务器的拥有者被迫使用极少量的直连存储,转而改用 SAN 或 NAS——即便对于那个特定应用而言,DAS 本可以提供更好的性能和(在其他方面)更低的成本。
为弥补这一需求,大多数刀片供应商都提供存储刀片——它们是充当微型、低容量 SAN 设备的刀片服务器,可直接装入刀片机箱。这些设备通常容量相当低,往往只有六块硬盘,而且与其他提供存储的方式相比相当昂贵。此外,它们还会占用一个关键的机箱盘位,从而移除了刀片机箱实现服务器密度所必需的潜在插槽之一。因此,一个配有两块小型存储刀片的八盘位刀片机箱,将只能容纳六台刀片服务器。
显然,购买一个刀片机箱并不意味着你已经放弃了在适当时候同时使用机架式服务器的能力。你可以继续混搭使用。但是,要达到使小型企业能够在成本上证明刀片基础设施合理性所必需的数量,往往要求采购大幅倾向于刀片服务器,以便尽可能高密度地填满机箱。
刀片的许多风险都在于潜在的机会损失。小型企业尤其要靠灵活与敏捷,才能发挥最佳表现并最有力地与大型企业竞争。而刀片恰恰是敏捷的反面。它们需要大规模的、预先的基础设施规划,其中包含技术上、物理上和地理上的锁定。即便一家企业提前做了规划,并且看不到任何采用上的障碍,这也并不意味着未来不会因缺乏有效适应不断变化的业务状况的灵活性而错失良机。一旦刀片机箱就位,采购决策几乎必然会基于已经做出的投资来做出,而不再仅仅基于什么才是对公司最有利的。这并非一定会发生,但几乎肯定会发生。既有的投资需要得到保护。这是人们会有的自然反应。
话虽如此,刀片服务器对于某些企业而言仍然可能很有意义。由于其共享的系统组件,刀片服务器通常比其非刀片对应产品消耗更少的电力。不过,务必要考虑存储区域中的功耗差异,因为刀片将功耗从服务器转移到了 SAN,常常会在电力究竟流向何处的问题上造成误导。一处的节省,只有在成本不会于另一处再度出现时才有价值。
当有机箱可用时,刀片易于运输和迁移。这可能是一个比表面上看起来更为重要的因素,尤其是当它意味着有好几名额外的员工都有能力迁移一台服务器时。几乎任何人都能抬起并搬动一台刀片服务器。
当与一套非常激进的 SAN 基础设施相结合时,刀片可以为虚拟化环境带来极大的益处。这种组合为那些规模足够大、能够善加利用的企业带来了最大限度的成本和灵活性优势。然而,中小企业市场大多由那些会觉得这种方案代价过于高昂的企业组成,因此该解决方案将继续被限定于中小企业范畴中规模偏大的那一端。事实上,虚拟化将减少大多数企业所需的服务器数量,从而使得向较小型企业证明刀片合理性变得更加困难——在过去这些企业本可能需要十几台甚至更多服务器,而如今只需两到四台便不仅能够达到、甚至能够超越早先的服务水平。
如果你能够支撑足够的密度,或者拿到真正激进的供应商优惠,那么只要你对照自身的风险来加以核算,刀片就可以相当具有成本效益。刀片总是要稍微更具风险一些,但如果购买它们能够显著降低你的成本,那么承担这份在灵活性上的风险或许就非常值得。机箱的成本在此是一个关键因素。如果你的机箱是免费的,那么一套刀片系统的成本节省一下子就可能变得极为可观——尤其是在采购了大量刀片、从而带来非常好的机箱密度的情况下。
刀片服务器是一项出色的技术,对未来展现出极大的前景。随着机箱生命周期放缓、新技术涌现、成本降低、出货量增加,并且有望随着与供应商无关的标准的出现,我确信刀片将成为即便是最小型数据中心中事实上的标准。我认为这至少还需要再经历一个市场周期才会真正发生。在我看来,最有可能的是,还要再过五到七年,这种外形规格才会在通用用途上真正取代机架式服务器。
