VisionStack私有云平台防误操作功能介绍




误操作的严重性

误操作是每个运维人员的一大心病,翻看业界历次的严重故障,很多都与实施人员的误操作有一定关系。

这里仅列出近期发生的一些故障(google上都可以搜到):

另外一些事故虽然官方给出的解释是各种软硬件或者配置错误原因导致,实际上却极有可能是人为误操作导致,官方解释的原因要考虑很多商业因素,为了保证公司技术声誉,只能给出一个看似合理但却模棱两可的事故总结报告。

运维人员在维护传统服务器时,遇到的误操作问题在私有云平台场景下会更加突出,比如在传统服务器场景下,运维人员的误操作,最多也就是把整个根目录的文件都删除掉(携程事故场景)或者格式化掉某一块磁盘,或者重装系统时不小心把正常服务器重装掉了。相对来说关机或者重启了错误的服务器这种场景影响不大,毕竟数据没有丢失,都还可以恢复。

但在云平台场景下,所有资源都是虚拟的,都可以通过简单的点击鼠标来执行创建、删除、修改操作,并且有些资源还可以批量删除,对于使用云主机、云硬盘、云网络等资源的用户来说,误操作的影响会被放大很多倍,因此在云平台上实现完善的防误操作功能就非常有实际意义。

VisionStack私有云平台防误操作相关功能介绍

VisionStack私有云平台通过以下几个功能来实现防误操作:

  • 显式的防误功能
  • 回收站功能
  • 云主机定时备份功能
  • 云主机自定义镜像功能
  • 云硬盘快照功能

显式的防误功能

用户使用VisionStack平台创建云主机、云硬盘等基础资源时,会在创建对话框里增加“防误”选项,默认是关闭的,需要手工打开,该功能可以在资源创建完毕后对资源进行“一定程度”的保护。

一定程度的防护是指,防误功能开启后,用户在对云主机执行各种会导致云主机中业务中断的操作时,要求用户进行二次确认,确认后还是可以继续执行的。VisionStack定义的业务中断操作包含:删除、关机、重启、重装系统、关机修改配置、封存等。

如果资源已经不再重要,防误操作不需要了,或者需要加上该功能,可以在详情页面进行修改。

云硬盘的防误功能跟云主机类似,也是在影响云硬盘使用的时候进行二次确认,如卸载、删除等操作。也可以在云硬盘详情页面进行防误功能的开启或关闭操作。

回收站功能

回收站功能是为了防止误删除资源而做的一个功能,目前云主机、云硬盘已经具备回收站功能,所有云主机(错误状态除外)、云硬盘删除后,都会被放入回收站,而不是直接删除,回收站中的资源可以随时恢复,并且除非用户手工清理,否则不会被清理。回收站功能是防止资源误删除的最后一道防线,也是非常有用的功能,一般来说一个资源放入回收站后,超过一周都没人找回,基本可以认定是可以彻底删除的。

云主机定时备份和自定义镜像功能

上面提到防误功能只能一定程度上保证资源的安全性,而回收站的资源也可能被清理,要保证云主机数据的可靠性,可以通过对云主机进行定时备份来实现,这样即使云主机被删除,至少可以保证恢复到前一次备份时间点的数据(通过备份的回滚操作实现)。自定义镜像也可以做到类似的备份功能,但通常更多的用来制作镜像模板,比如安装好常用软件的云主机,可以做成自定义镜像,大大节省云主机创建后软件部署的时间,尤其适合批量创建场景。

VisionStack定时备份支持按时间点、按时间间隔、按时重复等备份策略,最多支持保存20个备份,超过预设保存个数后自动删除最老的备份,保证占用较少的备份空间。

云硬盘快照功能

云硬盘快照功能与云主机备份功能类似,但更重要也更实用。一般我们建议用户把软件部署在云主机系统盘(可以通过自定义镜像批量复制),把数据存放到云硬盘(可以保证数据可靠性),但这也不是绝对的,把软件和数据都放在云硬盘也是可以的。批量复制一块云硬盘可以通过云硬盘快照功能实现,做好的快照可以恢复出新的云硬盘。快照的功能更多的在于保护重要数据,用于回滚或者备份,执行关键操作前对云硬盘做一次快照是一个很好的习惯,即使不小心执行了误操作删除了重要数据,也可以通过快照恢复到删除前的状态,另外VisionStack支持云硬盘挂载状态做快照,更加方便用户不停服备份数据。

 

顺便提一下,如果以上防误操作都没防住资源被删除的话,用户还可以使用操作日志功能来揪出是谁干的,至于找到后怎么处理就不在本文讨论范围之内了。