新疆电力(营销业务应用系统双活改造)
引言
在过去的一年里,国家电网在全国全力落实“三型两网”的战略,致力于打造枢纽型、平台型和共享型企业。在推进能源转型和信息技术深度融合,科技创新与产业升级相互促进的大趋势下,国网新疆电力在数字化的建设上也做出了巨大改进。云和恩墨充分利用自身在数据领域的深耕积淀,结合国家电网的运维经验和深厚的场景理解,通过应用架构改造和双活架构升级,支持国网新疆电力的数字电网建设工作。
双方通过合作协同,继2019年12月31日,国网新疆电力顺利完成营销业务应用系统架构改造后(了解详情),该系统的双活架构改造项目又历时半年多,并经过最终40多个小时的连续奋战,于2020年11月23日顺利割接上线,标志着该项目的成功完成。改造后的系统高效支撑95598客服、缴费业务的高可用,切实让客户体验到“互联网+营销服务”带来的便利。
01核心业务长足发展,同城灾备迫在眉睫
国网新疆电力的营销业务应用系统于2009年上线运行,用电用户数将近800万。目前,营销业务的数据月增长量约为200GB,年增长达2TB以上。随着该业务的不断深化和拓展,当前的基础环境已不能满足业务和技术发展需求,缺少应用级容灾预案,如果遇到严重故障无法快速完成应用切换。
接下来,如何在保证高并发存储和强计算的同时,又能做到数据的完整性和业务的连续性,是新疆电力面临的重要挑战,同城灾备的建设刻不容缓。
02新冠疫情共克时艰,双活改造排除万难
国网新疆电力同云和恩墨的技术专家一起,结合其自身基础架构布局,确定了营销系统同城双活架构的方案。该方案利用南湖、建设路同城两地数据中心,采用裸光纤和长距InfiniBand技术,构建两中心微秒级双通道网络;同时应用全域负载均衡和“6+15”分布式数据库集群,搭建营销系统同城双活环境。
同城双活建成后,将实现与电网人资、财务、交易等33套系统、4067项业务流程的双活高可用,可有效抵御局部重大灾难发生带来的风险,保障应用快速切换和数据的零丢失,从技术上实现无感知,提升用户体验。
双活架构-拓扑图
云和恩墨结合客户现场实际环境条件,定制了完备的项目实施计划,在正式割接前,做到充分的测试准备,保证双活的顺利上线。
双活项目计划-关键节点步骤
然而,受到年初全国范围的疫情影响,以及7月中旬乌鲁木齐的疫情再次反弹,双活改造项目的推进遇到了巨大的阻挠。云和恩墨的专家和工程师们在无法到达客户现场的时候,在家隔离时依然积极推进项目进展,同客户远程开展项目会议,及时同步项目进度,不放过任何一个潜在的风险点。
03同城双活五九可用,高效双写自动切换
11月23日,在经过了40多个小时的连续奋战后,国网新疆电力的营销系统双活架构改造项目顺利割接上线,项目取得圆满成功。
双活架构改造的项目成效包括:
真正双活:可在两个数据中心,对数据库同时进行事务处理,双中心的6个计算节点数据库对应用系统透明无感知,相比传统两中心的主备建设模式,设备资源利用率提高了30%以上。
五九可用:双活架构支持下的两个数据中心数据库可达到99.999%可用性,出现任意单个存储故障、计算节点故障,甚至单中心机房掉电等事件发生时,营销业务均能自动化切换,连续对外提供服务。整个灾难切换及业务恢复的过程均无需人工干预,自动化的操作能够有效降低企业客户的管理成本。
双活架构-高可用测试通过
高效双写:双活架构存储网络基于RDMA,读写效率是传统SAN存储的10倍以上,真正实现了高带宽、高性能、低延迟。I/O性能在同站点和不同站点的表现都很优秀,在同站点下双端口200Gbps的IB网络环境下,最大读带宽高达20GB/s,单节点8K写的IOPS高达55.5w,在不同站点间延迟低至0.3ms。
自动运维:zData的一体化管理与监控平台,实现了从底层硬件到上层数据的完整管理和监控,可维护性和可管理性更强。双活拓扑可呈现众多节点和网络的运行状态,性能图表则全面直观地展示性能趋势,一目了然。
zData双活版 - 拓扑图管理
zData 双活版– 性能监控图表
04里程碑式意义深远,持续探索再谱新篇
国网新疆电力营销系统双活建设,不仅可以高效支撑95598客服、缴费业务的高可用和业务连续性,切实让客户体验到“互联网+营销服务”带来的便利,良好的可扩展性更能够满足营销类信息系统未来3-5年的发展需要。同时,本次的建设实现了电网核心业务同城双活零的突破,为电力企业业务系统的容灾建设提供了有益的借鉴和参考。
下一步,国网新疆电力将持续探索人工智能、区块链等新技术的应用,以信息化建设为平台,全面提升信息化服务水平,推动电力的数字化、网络化和智能化发展。