您还未登录! 登录 | 注册 | 帮助  

您的位置: 首页 > 软件开发专栏 > 网络/安全 > 正文

数据中心升级前的11个关键注意事项

发表于:2022-03-03 作者:Stephen J. Bige 来源:企业网D1Net

升级仍然是提升数据中心IT容量的主要手段。他们通过更换老化或性能不佳的IT资产来建立弹性、提高性能、降低运营成本、增强安全性,并降低停机时间。但升级总是带有风险因素:疏忽和错误可能导致意外停机、工作负载可用性问题、中断以及不可接受的管理或安全漏洞。重要的是在第一次升级时就成功完成,或者至少在出现问题时有效地回退。

成功和具有意义的数据中心升级的关键是做好准备。了解目标和实现每个目标的途径,并克服前进道路上的障碍,为升级过程带来巨大的好处。

1.了解企业的业务需求

当业务领导者选择不必要的技术投资或缺乏明确的投资回报率标准时,就会出现一些成本最高和风险最高的错误。升级不应作为新技术的展示,而应有助于企业更有效地运营和更具竞争力。他们应该专注于以下方面:

  • 扩展重要资源,例如存储或计算;
  • 为更多、新的或更新的应用程序启用新的工作负载;
  • 支持额外的员工、用户或交易;
  • 降低每用户或每笔交易的成本;
  • 构建IT能力,例如工作负载弹性、业务连续性和灾难恢复。

例如,服务器升级可能支持将多个工作负载整合到一个系统上,从而降低电力、空间和系统维护等成本。向基础设施添加存储设备就像向现有服务器添加新硬盘一样简单。其中包括一个冗余的负载平衡服务器,以提高关键工作负载的可用性。

2.确定升级目标

在明确定义业务需求的情况下,确定升级项目的范围,并确定受升级影响的硬件、软件、服务、策略、流程和工作流。

升级从来都不是一个全有或全无的决定。升级范围可能非常狭窄和具体,因此需要提前明确确定范围以防止潜在的灾难性疏忽,例如意外的硬件或软件版本不兼容的情况。

考虑到原有工作负载和依赖于工作负载的硬件的老化,企业可以将重要的工作负载重新设计为更新的软件产品,在功能强大的新服务器硬件上部署更新的软件,并淘汰老化的硬件。在这种情况下,主要升级目标将涉及原有服务器及其原有应用程序。

此外,需要考虑次要范围,例如依赖项。例如,如果老化的应用程序依赖于较旧的数据库,企业是否必须升级该数据库及其硬件?应用程序或系统管理等实践被视为依赖项,应该将它们包括在范围内。

3.创建升级路线图

一个升级项目或目标通常涉及多个分散的升级任务。例如,升级可能涉及向数据中心基础设施添加两个服务器机架,但这可能还需要增加电源和冷却能力升级或增强WAN访问。

即使是像服务器升级这样简单的事情也可能涉及支持工作。例如,要将2U服务器添加到完整机架,企业可能需要先重新安置一台或多台其他服务器以腾出空间。这些考虑可能看起来很琐碎,但即使是很小的细节也可能会延迟升级。

企业需要检查预期目标及其依赖关系,这可能只是简单地重新定位硬件以获得适当的机架空间,或者在升级之前升级支持平台,例如数据库及其服务器。

4.确定升级技术

确定要升级的新产品可能很简单,比如为存储升级选择新磁盘,或者为新服务器选择品牌、型号和负载。更大的升级需要更多的考虑。例如,如果需要更新一组相关服务器,需要评估先进技术平台的潜力,例如超融合基础设施。

使用不熟悉的硬件和软件进行升级会带来灾难,所以尽可能在提交产品之前进行测试。使用实践评估和原则来验证新的硬件和软件产品,并了解它们的部署、设置、配置和互操作性注意事项。

5.清理或增强现有基础设施

数据中心中的一切都有一个生命周期,而老化的基础设施可能会对业务构成障碍。当企业检查基础设施以确定升级的范围和要求时,需要花费更多时间来考虑可能不直接影响预期升级的任务或项目,但在更广泛的意义上仍然可以受益于业务和基础设施,包括以下内容:

  • 为关键应用程序增加冗余;
  • 从不再需要的应用程序中删除冗余;
  • 更新老化的布线以促进更大的网络带宽;
  • 更新配电和备用电源,例如PDU和不间断电源系统;
  • 重新定位机架并关闭开放的硬件间隙以增强冷却气流;
  • 审查系统管理工具和功能。

这种切换或二次升级可以提高数据中心的性能、可靠性和效率。

6.准备文件

大多数数据中心硬件和软件都需要各种各样的部署细节。其详细信息包括默认网络地址、许可数据(例如激活码)以及设置和配置的详细说明(例如产品手册和用户指南)。

组织这些数据,并在启动升级任务之前确保一切可用。否则,由于缺少详细信息,业务将面临无法接受的延误和不必要的取消风险。例如,新的软件产品可能需要许可证号或激活码。IT人员并不希望凌晨执行升级时来获取这一信息,因为供应商的销售和支持人员可能无法及时响应。

7.备份并准备恢复

当今的虚拟化数据中心环境使得将工作负载转移到其他服务器变得相对容易,这使企业能够更换和配置服务器。同时,企业可以使用复制或快照技术复制在虚拟机内运行的工作负载。尽管如此,还是会发生错误和意想不到的后果,即使是看似简单的升级也可能会匆忙中偏离方向。在升级之前和升级期间,使用简单的指导方针为最坏的情况做好准备,例如:

  • 对升级过程中涉及的任何服务器应用程序或存储系统执行完整备份;
  • 测试修复过程并确保修复工作顺利进行;
  • 确保参与升级任务的IT人员都能成功执行恢复或回滚;
  • 记录现有硬件和软件的当前配置(即使企业计划淘汰这些产品),以便在必要时将它们恢复到已知的工作状态;
  • 记录升级期间发生的所有更改,例如更改IP地址或将虚拟机移动到不同的物理服务器,并确保这些更改反映在系统或更改管理工具中。
  • 准备好在多个地方备份和恢复数据。

8.让利益相关者了解情况

升级可能会中断常规业务并使重要的工作负载长时间不可用。这会影响员工、业务合作伙伴、客户和业务领导者。数据中心升级应始终将利益相关者纳入流程。

升级项目通常涉及许多任务。因此,单独处理每项任务,并将其传达给利益相关者。常见的通信包括以下内容:

  • 告诉利益相关者计划进行哪些升级、为什么需要进行这项工作、应该提供哪些更改或新功能以及工作何时进行;
  • 提醒利益相关者升级计划,通常包括导致实际升级任务的一些提醒;
  • 如果遇到问题或延迟,向利益相关者发送更新;
  • 一旦升级任务完成并恢复正常功能,就向利益相关者发送提醒通知。

此外,如果出现问题,需要提供准确的联系信息以供支持或帮助台访问。例如,如果软件升级带来了新的特性和功能,需要提前对支持人员进行这些更改的培训,以便他们能够有效地解决用户的疑问和问题。

9.验证部署

在完成升级任务之后,测试并验证硬件或软件部署是否正常工作。例如,新的服务器应该运行良好并具有安全配置。当企业重新安装或将工作负载迁移回服务器时,这些工作负载应该可以通过内部部署数据中心网络访问。在这个阶段,IT人员必须对性能进行基准测试和衡量,对升级问题进行故障排除和修复,或者在需要时执行回滚。只有当知道一切都按预期工作时,才应该在企业LAN或互联网上打开资源以供一般使用。

升级可能会破坏系统或应用程序管理工具。捕获所有数据中心系统和安全管理工具中升级任务所涉及的任何更改,或准备使用收集的文档人工输入更改。一些管理平台需要额外安装代理或驱动程序,然后管理工具才能正确监督新资产。

10.在必要时系统地展开部署

分阶段推出涉及高度不确定性或风险的升级项目。例如,更新任务关键型遗留应用程序及其相关硬件涉及同时部署新资产(与当前资产并行),并打开环境部分进行测试,而不是简单地在升级中替换应用程序和硬件。由于原始硬件和软件仍然可用且可运行,因此这将在升级上线后将意外问题的影响降至最低。

如果新资产按预期运行,企业可以系统地将其他用户组迁移到新资产。当成功迁移所有用户并彻底验证新资产之后,就可以退出并删除旧资产,这是一项较小的清理升级任务。

11. 遵守数据中心标准

对数据中心的设计、实施、性能或可用性没有既定要求。然而,政府、利益相关者、合作伙伴和客户已经开始期望在一定程度上遵守某些标准。升级项目是检查数据中心标准并考虑采用现有标准的绝佳机会。

众多代码和最佳实践标准可以对数据中心进行验证,包括Uptime Institute、电信行业协会942、美国国家标准协会/BICSI002-2014、EN50600和一系列可选标准,例如能源和环境设计领导力、绿色地球仪和能源之星。企业了解每个标准的作用,评估其重要性或对企业的业务的好处,并计划实施所需的标准作为正在进行升级的数据中心项目的一部分。