完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
摘要: 阿里云致力于提供更好用的运维体验,让您使用ECS的过程更透明、高效,并实现更加标准化、自动化的运维方式。基于主动运维2.0,您使用ECS云服务器的体验更加流畅,而且利用系统事件,不再依赖于工单联系客服,可以通过自助处理的方式响应主动运维实例重启,减少对系统可靠性和业务连续性的影响。
云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。当您基于ECS云服务器搭建了业务系统,借助云计算的诸多优势和特性,可以实现对业务需求的敏捷响应和对业务连续性的有力保障。在此基础上,阿里云致力于提供更好用的运维体验,让您使用ECS的过程更透明、高效,并实现更加标准化、自动化的运维方式。 主动运维 阿里云使用严格的IDC标准、服务器准入标准以及运维标准,保证云计算整个基础框架的高可用性、数据的可靠性以及云服务器的高可用性。对于单台ECS实例, 阿里云承诺一个服务周期内单台ECS实例的服务可用性不低于99.95%;对于单地域多可用区,阿里云承诺一个服务周期内该单地域多可用区的服务可用性不低于99.99%。 我们知道,在基础设施层面,始终存在一些潜在因素如软件bug或硬件故障等会影响ECS实例的运行,因此为了保证上述高级别的服务可用性,除了云计算基础框架的高可用性设计以外,ECS主动运维不可或缺。主动运维作为ECS的隐形卫士,会主动对承载ECS实例运行的物理服务器做日常维护和故障检测,并尽可能通过在线或轮转升级的方式修复潜在的故障隐患,以持续提升系统可靠性、性能和安全防护能力,保障云服务器稳定运行。 但对于某些情况,物理服务器需要重启或停机维护,这时主动运维系统会向该服务器上的ECS用户发送消息通知,提示您的ECS实例需要重启迁移至健康的物理服务器之上。此前,用户接到这样的通知后需要提交工单联系客服人员授权处理,随着主动运维2.0的进化,这方面的体验得到多方面的提升。 体验升级 1. 主动运维热迁移,实例运行不中断 当主动运维检测到物理服务器存在故障风险时,系统会优先尝试将该服务器上的ECS实例在线热迁移至其他物理服务器,热迁移成功的实例不会中断运行,其业务可以保持在线;只有少量热迁移存在风险的实例才会进入主动运维重启迁移流程。此策略升级后,有效减少对用户业务连续性的冲击,在阿里云用户规模快速增长的情况下,主动运维相关工单数量同比下降125倍! 2. 风险提示更清晰,迁移影响提前知 对于有必要进行重启迁移的实例,阿里云会提前向用户发送消息通知和针对性的提示。由于本地存储(本地盘)来自单台物理服务器,不基于多副本分布式技术,在迁移时本地盘所存储数据会被擦除,因此对于本地盘实例,通知中明确提示该风险并提醒您在迁移前及时备份数据。对于云盘实例,通知中提供操作引导,您不再需要提交工单联系客服人员,可以直接在控制台或通过API处理实例重启迁移。 3. 不用工单找客服,系统事件来帮忙 云盘实例重启迁移的自助处理功能在控制台和API上线,当您受到重启迁移的系统计划事件时,可以知晓该事件的执行计划。如下图所示,根据您的业务需要,可以选择立即执行重启、预约在业务低峰期执行重启、或等待系统按计划执行,做有准备的运维操作。这样的过程不再需要依赖工单处理,提高效率的同时减少实例重启对您在行业务的冲击。 事半功倍 正如上面提到的体验改进,“事”半功倍,除了主动运维流程进化,还来源于系统事件的发布。系统事件有利于提升用户对于ECS运行状态变化的感知,并进行有针对性的操作来响应或规避事件对在行业务的影响。通过系统事件的闭环,将更多的运维场景标准化、自动化,让用户获得更好的额云上运维体验。 原文链接 阅读更多干货好文,请关注扫描以下二维码: |
|
|
|
只有小组成员才能发言,加入小组>>
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-12-18 13:33 , Processed in 0.682910 second(s), Total 68, Slave 48 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号