海天动态

首页>海天动态>公司新闻
海天AIOPS之路系列之五:自助服务1
发布时间:2021-09-26 13:10:16| 浏览次数:

摘要: 助人要从日常小事做起,不因善小而不为。——佚名

Ankole数据库运维平台为了帮忙DBA减轻负担,向业务维护人员提供了各种各样的自助服务功能,让业务人员能够自维护,减少对DBA的支持需求,提高工作效率。

1.    问题

数据库运维的小伙伴是否经常碰到这样的困惑,应用维护人员经常找过来,“小张,帮忙杀个会话了”、“小张,帮忙检查一下XX数据库的性能是不是有问题”等等……,运维人员的时间去哪儿了?

那ankole数据库运维平台又是如何解决这些问题呢?

2.    设计思路

Ankole数据库运维平台提出专业的人干专业的事,业务自已能解决的问题自行解决,所以在ankole数据库运维平台向业务维护人员提供了自助服务功能。其中自助服务大的功能模块有:查看数据库实例性能、会话管理、失效索引管理、SQL性能分析。

image.png

这些功能模块具体的使用场景,请听我慢慢道来。

3.    实例性能

以前业务人员经常请数据库运维人员帮忙查看数据库性能,现在通过ankole运维平台就可以自行查看。只要在实例性能页面中选中关心的数据库和实例,就可以一目了然地看到数据库的运行情况。比如:数据库服务器CPU的使用率,数据库的IO响应指标,表空间的使用率,物理备份是否配置,逻辑备份是否配置、备份内容、最近备份时间、备份日志,在上方还有业务人员比较关注的:数据库活跃会话数、会话总数和数据库当前写入的日志量。

通过查看历史,还可以检查数据库的性能历史,了解数据库的运行情况。

image.png

所以有了实例性能模块,我们业务维护的小伙伴对数据库性能有怀疑时就可以自行查看了,再也不用拜托运维,省了好几顿饭钱。而数据库运维人员被少打扰了,可以更加关注地解决更重要的事情。

4.    会话分析

业务维护人员有时侯自已查询到某个业务会话执行异常,需要结束该会话的运行,使用通过数据库杀会话的命令,经常无法彻底杀掉会话,需要长时间的等待,有时侯等了几小时异常会话还没有被杀掉。这时侯业务维护人员又要找到数据库运维人员了,数据库运维人员通过一通命令,啪啦啪啦,然后登录到服务器上执行了“kill -9”命令,就将数据库里异常的业务会话给杀掉了,大家都很开心。

但是这种事情多了,数据库DBA就抱怨了。想想一个大企业,系统成百上千个,业务维护人员也有很多,但数据库DBA就那么几个,因为需要杀会话的事情,被业务人员找多了DBA其它事就啥也干不了,手头堆积的事情干不完,只能晚上加班干。但数据库是企业非常重要的资产,不可能将登录数据库服务器的权限开放给业务维护人员,所以DBA抱怨也得干啊。

因为这个原因,ankole运维平台向业务维护人员提供了会话分析功能,如下:

image.png

当业务维护人员发现了异常的数据库会话需要结束时,通过选中数据库实例,输入SID和SERIAL#值,就可以查看到会话的详细信息。包括:会话类型、状态、用户名、客户端程序、客户端机器名、登录时间,还包括一些重要信息:会话正在执行的SQL_ID、会话使用的UNDO量,还有分析的会话是否被其它会话阻塞等。

如果业务维护人员查看了这些信息,确认无误需要结束掉会话,则点击右边的“杀进程”就可以准确无误、干净利落地杀掉了异常会话。

会话使用的UNDO量需要说明一下,如果会话使用的UNDO量过大,那杀掉该会话可能会造成数据库长时间地回滚,在“杀进程”按纽在点击时会进行相关校验和提醒。

如果需要了解这个会话的执行历史,可以点击左边的“会话历史”按续,就可以将这个会话执行的等待历史情况展现出来,以供专业的DBA检查。

image.png


关于我们
技术服务
海天案例
海天动态
联系我们

800-810-3650
400-810-3650

海天服务热线

Copyright© 2003-2021 北京海天起点技术服务股份有限公司 版权所有 备案号: 京ICP备16032274号-1