全面拥抱云原生,上海电力多云治理实践深度解析

发表时间:2022-07-28 18:15
7月21日-22日,由中国信通院和中国通信标准化协会联合主办的“2022年可信云大会”在京顺利召开。云优化治理分论坛上,骞云客户国网上海市电力公司(以下简称“上海电力”)云平台负责人康恺受邀发表了题为《上海电力的多云治理之路》的主题演讲,从公司云架构、云原生的技术演进,以及如何上云、用云、管云等多维度分享上海电力的数字化变革之路。
云计算作为新型基础设施的核心环节,是支撑数字经济发展、推动企业数字化转型的关键技术底座。随着我国云计算领域的不断发展以及政策的大力推动,企业在云端部署业务系统已经成为了一种趋势,越来越多的企业开始着手关键业务系统上云,用云逐步迈入深水区。

一方面,越来越多的企业基于云原生落地应用,容器、微服务、服务网格等技术成为企业云上业务快速迭代的关键生产力;另一方面,企业开始拥抱多云混合部署模式,多云成为企业上云用云首选。近年来,国网上海电力持续在云计算领域进行创新,以满足日益增长的业务需求。

01

云架构&云原生的技术演进

在2018年以前,上海电力还处在一个IOE的时代,以设备为中心,商业套件为主,采用了一些虚拟化的软件,比如VMware、PowerVM等。2018-2020年,以资源为中心,上海电力引进了一些私有云国网云产品,主要是OpenStack云平台、华为云平台等,并开始着手去IOE化。
2021年以来,上海电力业务上云逐渐开始向容器化、微服务化演进,Docker、K8S、Spring Cloud框架等云原生应用开始逐步运用。在2022-2024,即今后的2-3年内将逐渐以应用为中心,基础架构全面的云化,逐步推进使用微服务2.0(Service Mech)、无服务器(Serverless)等云原生的一些新技术。
上海电力的云原生建设之路,采取了垂直纵向和水平横向两个维度分阶段逐层推进的模式。垂直方向主要是从技术框架维度进行云延伸技术平台的建设,包括异构混合多云,云原生操作系统到PasS平台、云原生应用管理平台等等。
水平横向主要是从应用的架构维度进行传统应用的上云迁移和云原生应用的改造建设。其进程主要包括存量的、非关键的应用的托管迁移上云,和传统核心的应用的局部化云原生改造,以及由此而带来的云上云下新架构的混合云原生应用模式,最终实现应用系统从On Cloud到In Cloud的转变。
图片

02

从上云、用云到管云的不断探索实践

上海电力公司结合业务实际应用,在上云、用云、管云几个方面,力求全面完整的对云平台的运维运营工作进行总结。
上云方面,根据《国网云组件的应用规范》,《上云信息系统上线管理办法》等相关要求,对新建系统入云、迁移改造入云等工作进行架构评审,分为4个阶段和17个步骤,分别为调研评估、规划设计、迁移实施和迁移验收。
用云方面,经过2-3年的建设,上海电力不断构建既适合自身当前的业务需求的现状,又能满足未来业务需求发展的云原生技术平台和技术体系,取得了显著的成效。依托CMP云管平台、运营中心管理平台、态势感知大屏、i国网移动应用等技术的支撑。目前已经覆盖了从开发交付到运行运维的全流程,实现了敏捷化自动化的资源交付、持续发布、态势感知、告警分析等能力,通过掌握云平台应用系统的实时运营状态,实现了营运一体化。
图片
利用运营中心的资产树结构,直观的展示应用的服务层级以及实时的状态,达到一图观全景,并实现了资源申请、资产变更、持续发布、监控告警、日志分析等日常的运维活动,达到一图管运维,逐步实现了Serverless的目标;用户所见即服务,无需关心底层平台的使用方式、实现方式,实现了多云的统一纳管,用户的无感知使用,达到了用云亦无云的目标。
管云方面,上海电力高度重视云平台顶层设计,在使用上要求简化清晰,在运行上要求安全稳定,在执行上要要求严格管控。按照自身的管理模式,不断摸索,解决了当前云平台版本的一些问题,如权限管控难、容量限制等。通过架构优化和指标体系完善,实现了企业的精细化管理,优化网络隔离方式,完善监控告警机制,降低运维成本,提升资源使用效率,减少资源浪费,提升交付效率。
图片
(以上内容根据《上海电力的多云治理之路》演讲内容整理汇总而成)

03

骞云云原生运维管理平台

如何为上海电力多云治理赋能

通过云平台的不断摸索建设,上海电力逐步形成了基于vSphere、OpenStack、华为云的多云环境,以满足不同的业务需求。但多云环境也带来一定的运维管理方面的挑战:
1、多云造成多个资源孤岛,对资源交付和运营中心(ITSM+CMDB)建设带来额外复杂度;
2、手工创建资源,创建资源后还要进行存储挂载、堡垒机注册、APM监控注册等工作,复杂度高,交付慢;
3、一个完整资源交付涉及系统、网络、数据库多个部门协作,流程长,效率低等。
2021年,上海电力正式携手骞云科技,着手探索运营中心平台的建设。依托骞云科技云原生运维管理体系中的云自动化管理平台(CMP),上海电力在底层异构IT基础设施和用户需求之间构建统一的云自动化平台,向下统一纳管各类异构的基础设施,向上集成上海电力IT服务管理门户运营中心,高效率的构建各类IaaS资源。形成异构资源、云管平台、运营中心新的三层架构的电力云,实现更加标准化、自动化、规范化的资源交付,简化跨部门协作的耗时和复杂度,向需求方呈现更加高效、敏捷、可控的云服务。
图片
1、异构多云统一管理,屏蔽异构差异性,便于运营中调用,配置信息自动入CMDB
云自动化管理平台(CMP)对接底层多个资源池,对多个云平台的模板、规格进行统一管理,对提供的各种计算、存储、网络资源进行封装,然后向运营中心提供统一的服务目录和运维操作。运营中心通过调用云管平台的API创建资源,传递相应的项目、规格、参数等信息,云管平台会根据资源池区域、SLA、费用等因素自动将资源部署到底层合适的资源池。
2、面向需求的端到端自动化交付,配合规范落地,通过蓝图编排技术,将资源创建及后续工作全面自动化
在上海电力的环境中部署应用虚拟机和数据库虚拟机的参数和操作环节是不一样的,以数据库虚拟机为例,创建虚拟机后还要进行存储挂盘、网络开通、系统配置、安全加固、agent部署、堡垒机注册、APM注册等一系列操作。通过云自动化平台(CMP)我们将不同需求的系列操作编排在一起,从而使这些软硬件实现联动,进一步解放运维人员,提高交付效率,更重要的是我们可以将针对数据库服务器的特殊的部署规范封装在服务目录中,使资源交付更加安全规范。
图片
3、资源全生命周期管理
通过骞云云自动化管理平台(CMP)对各类IaaS资源的全生命周期进行管理。所有资源的创建、运维、变更、回收过程都在云管平台内实现自动化,并记录资源整个生命周期的变化,对资源全生命周期进行监管。


云自动化管理平台的顺利投产标志着上海电力云体系架构的又一次进化,双方携手攻克了电力云当前一大难点,为后续建设铺平道路。未来,骞云科技将构建更多符合上海电力自身使用场景和规范的IaaS、PaaS服务,持续探索面向应用的持续发布/持续部署平台,真正将成本中心转型为利润中心,实现企业降本增效,全方位提升应用交付的敏捷性,推进上海电力服务体系、运维体系的进一步完善,为其全面拥抱云原生赋能。



 
 
 联系方式
咨询电话:400-669-7728