随着全球数字化转型的脚步加快,云技术的不断发展,越来越多的企业和个人开始将应用和数据迁移到云服务器上。 2023 云栖大会现场,阿里云高 级技术专家程哲桥进行了一场主题为“云迁移的方法和工具”演讲分享,讲述了阿里云通过近十年的技术沉淀,提出“五阶十八步”的方法论,发布云迁移中心,实现一站上云。并分享了“集成化工具平台是解决运维复杂性的最 佳实践”的观点。
云迁移的完整链路
现阶段,云计算已经被划分到国家发改委明确的“新基建”范围中,作为数字经济核心的基础设施,企业上云已经成为了各个企业实现数字化转型最初也是最重要的一个步骤。企业通过云迁移进行业务创新,实现敏捷灵活管理降低运维成本,最终提高企业的发展动力和竞争力。
云迁移是一个过程,其主要目标是把原有IT基础设施上的数据、应用程序等数字资产,迁移前往云厂商的过程。这个过程可以涵盖系统和应用程序迁移、存储和文件迁移、数据以及数据库系统迁移等不同类型。
云迁移的策略权衡与技术风险
Gartner早在 2010 年就发布了“5R”模型,定义了将特定应用程序迁移到云上的所有可用选项。即Rehost、Refactor、Revise、Rebuild和Replace。
Rehost(也称为Lift and Shift,原封不动的迁移)是将系统/应用从本地迁移到云环境而不进行修改的方法,所以也被叫做原封不动的迁移。最常见的就是直接选择合适规格的云上弹性计算服务器ECS,将云下的所有应用,数据库,中间件等都部署上去。
Revise(也称为Re-platform,包含少量修改的迁移)是保持系统的原有结构,同时进行少量的关联组件替换。最常见的就是将应用依赖的关系型数据库,其他缓存、消息中间件、大数据组件迁移到云上兼容的PaaS 层产品中,例如选择阿里云 RDS MySQL版本替代自建MySQL。
Refactor(也称为Re-architect,重新设计适应云环境的迁移)区别于Rehost和Revise, 是重新设计了应用系统,对既有应用进行彻底变革(重新设计),常见的做法往往是彻底的云原生和微服务重构改造,从而进一步利用好云的便捷性、灵活性、稳定性。
企业将业务迁移到云计算系统,可以实现许多以前根本不可能实现的事情。因此选择一个适合自己的云迁移策略就变得极为重要。 程哲桥提出企业上云需要综合考虑“上云收益”“技术方案” “技改成本” ,权衡技术风险和成本收益,从而寻找到最合适企业现状的云迁移策略。
对企业而言,做出一个云迁移决策是一件非常重要的事情。
并且之后,如何将规划落地、执行,还要在数月乃至更久的执行过程中,持续保障项目推进,技术风险可控,最终保障预期的上云收益,控制过程中成本。在短则数月,长达以年为单位的云迁移中,每一步过程实则都伴随着大大小小的风险与未知,这些都是企业上云忧虑之处。
阿里云技术服务经过近 10 年的经验沉淀,总结提出了云迁移五阶十八步的方法论,包含云迁移的全过程阶段,并以此构建了云迁移中心(Cloud Migration Hub,简称CMH)
阿里云云迁移的五阶十八步
CMH一站集成式云迁移
将一个企业站点,完整迁移是一个非常复杂的过程,在云迁移的整个过程中,需要分析调研、规划设计、方案设计、开发实施、线上推广五个完整步骤。
目前在常规的云迁移过程中还需要涉及大量的人工介入环节,除了不可避免的架构师和技术专家的评估、规划之外;还需要运维工程师执行大量的运维动作,例如源端系统调研、目标端资源创建、迁移任务配置,数据一致性校验,迁移过程监督等。稍有不慎就有可能为业务系统带来其他稳定性风险。
阿里云提供的集成化的工具平台CMH,就是用来辅助完成云迁移过程中所有线上运维动作。通过CMH 提供的工具能力以及调度其他云迁移的产品,实现企业一站式、引导式的云迁移。
2023 年云栖大会现场,程哲桥详细讲解了阿里云云迁移中心CMH的设计理念和产品结构,揭秘了使用云迁移中心CMH过程中,各阶段所运行的工具与其复杂的工作原理,佐证了 “集成化工具平台是解决运维复杂性的最 佳实践”这一核心理念。
CMH云迁移阶段工具
程哲桥在演讲中表述阿里云不光是能够面向企业提供全生命周期的云迁移服务,还希望能为广大开发者提供自服务的云迁移工具产品,希望通过云迁移中心CMH的集成化、一站式的思路,帮助大家降低云迁移的门槛。
云迁移中心(CMH)集成化一站式完成云迁移,可以分为以下四个阶段:
调研阶段
CMH自研的调研工具,分为三种调研方式。
自建代理采集,无侵入的Agent
通过其他云厂商的SDK
通过内置的电子表格来进行人工访谈和信息录入
CMH集成了多家云厂商的API 和阿里云配置审计,能够帮助用户快速的完成云上总拥有成本(TCO)的分析对比以及源端的资源调研。
另外CMH还支持了自建数据中心的迁移、跨友商的云迁移、阿里云内部跨地域跨可用区的迁移等多种迁移场景。基本覆盖了各种常见的云迁移情况。
筹备迁移实施阶段
CMH支持将自动化调研获得的数据,一键映射到阿里云最适合的云产品。并且通过基础设施即代码(IaC)的理念,为用户生成资源编排代码并且一站式完成资源创建。
服务器迁移,简称为SMC
阿里云自研的云服务器镜像迁移工具,支持物理机和虚拟机的迁移。通过数据传输和镜像构建。SMC可以支持市面上大部分的服务器,并且块复制确保效率,支持无代理迁移减少业务影响,还支持增量同步减少停机窗口
数据库工具,简称DTS
阿里云数据库能力矩阵中的王 牌之一,除了数据迁移,还可以承担跨地域,跨城市的数据同步能力来构建容灾。还提供丰富的数据订阅功能用于在离线数据分析。经过 12 年的产品迭代,其超高的性能,其稳定性和安全性都有极大保障。
存储迁移,在线迁移服务
针对存储迁移,提供了推拉两种常规性方案,能通过线下Agent 的模式解决网络打通的问题,更好的将较为封闭的IDC 数据通过各种网络方案推到云上。另外也支持更为简单的拉模式,通过网络直接其他云环境和边缘节点。
大数据迁移,数据集成
Dataworks数据集成是稳定有效、弹性伸缩的数据同步平台,致力于提供在复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力,是将其他存储介质 的数据集成到云上大数据平台的利器。支持近 50 款不同的数据源,并且对于全量+增量的迁移场景做了一体化的能力,支持了丰富的流量控制,数据过滤等企业级数据集成能力。
割接阶段
将系统切换到目标端,这个过程被称之为"割接"。上云时系统的割接窗口往往很短,需要一个简单、便捷、有效的数据校验方案确保数据在源端和目标端的一致性。 CMH割接模块实现的轻量级的数据校验方案,能够在 5 分钟完成整个站点的数据二次验证,让企业在系统割接时更放心。另外其即将上线的割接监控能力可以将割接过程可视化,让用户更加直观了解业务流量走向和迁移系统健康度。
使用Advisor 巡检云上架构
完成上云之后,阿里云也提供了面向云卓越架构的巡检优化产品智能顾问。其基于云卓越架构 (Well-Architected) 方法论和阿里云客户稳定性工程师 (CRE) 的最 佳实践,预制丰富的巡检规则进行风险发现和待办跟进。此外,针对于稳定性、成本优化、容量水位等多个场景,智能顾问提供针对性的巡检编排,提供更好的用云体验。 例如在稳定性专项中,我们会提供用户维度的可用性查看,配额溢出的提醒以及故障时变更审计。帮助用户第 一时间判别故障的属性。
优秀的实践案例,是云迁移集成化工具平台解决运维复杂性最 好的证明
程哲桥在演讲现场举例,在一传统企业云迁移过程中,其IDC中拥有大量烟囱式的陈旧系统,系统之间的交互形式也是通过相互暴露固定的IP和端口地址来互相访问,在控制成本下保障企业正常业务运行,就意味着云迁移必须IP不变。
阿里云技术服务专家在构建了一个中转VPC ,并且使用CMH 批量驱动下,得以完整、有效的实现云迁移方案,并保障过程网段不冲突。
得益于云迁移中心CMH的集成化能力,全程有效的利用源端和目标端之间的带宽资源,大大缩短迁移时间和人工看护成本,让整个迁移周期缩短了数周,综合提效60% 以上。
截止 2022 年数据阿里云云迁移中心实现了 15 项技术创新, 9 项专利申请,参与发布了《企业上云白皮书》 、《云采用框架白皮书》 、 《Alibaba Cloud Migration Whitepaper》,目前已完成了近千家海内外企业云迁移,其中包括海外GoChina客户,以及国内传统企业客户。
时至今日,云迁移虽然已经是常见的技术问题,但因为涉及到企业内外的复杂系统与协作,依然是一个企业数字化过程中的重要命题,随着云技术供应商不断构建更具吸引力的产品和服务并持续简化迁移流程,阿里云的云迁移中心在大量实践验证下,极大的发挥集成化工具平台的优势,未来云迁移也将变得越来越简单,越来越智能。