Spotlight 监控Linux服务器的性能

2022-12-29,,,,

Spotlight功能:
详细的进程跟踪功能
远程连接
在线的Unix/Linux的调优指南
事件日志跟踪
配置警报

详细的进程跟踪功能:
Spotlight对具体的Unix / Linux的进程长达24小时的历史信息,包括可用性, CPU使用情况,内存和线程数。多面板显示会话(session)详细到所有方面的系统活动,可以看到I/O,物理和虚拟内存,网络和操作系统进程。

事件日志跟踪:
只要在服务器上具体的或一般的事件日志条目已提出,Spotlight就会产生警报提醒您查看。它不断扫描任何新的日志条目,以满足您的特定标准。

配置报警:
警报可以配置,以适应个人的需要,或保留它们的默认值用于提供有用的阈值。

远程连接:
快速,轻松地连接到网络上任何的有问题的机器上。

在线的Unix/Linux的调优指南:
Spotlight在线帮助对有效地排除故障和诊断Unix / Linux的性能问题提供了指导和建议。来自Quest业界专家的建议帮助用户加快了解决进程。

服务器实时监控
点击菜单项中的“Home”,在服务器的监控面板中可以看到诸如System、Network、CPU、Memory、Paging Files、Disks等运行状况。
Spotlight以红、黄、绿三种颜色标识服务器各组件的运行状况:
红色是警报提示,如果哪项参数显示红色,就表示当前服务器的该组件性能告急或者出现了性能瓶颈,需要管理员马上解决相关问题。
如果哪一项显示为黄色,表示该项处于亚健康状态,需要管理防范和注意了。
如果是绿色,则该项运行正常。

进程监控:
点击Spotlight工具栏中的Processes工具按钮可查看服务器当前运行的进程情况。点击某进程会在下面出现一个框架窗口显示该进程的详细信息,Process Details项下显示了该进程的各项属性。
此外, Processes项还包含Zombies和Services, Zombies可以查看僵死的进程, Services可以查看服务器当前的服务运行状况

CPU的利用率:
Total CPU Usage:总的CPU的利用率,该值在75%以上,则CPU 利用率过高。
CPU Usage by Processor:单个CPU的利用率。
Run Queues:可运行队列。
Context Switching:上下文切换,就是Process(Thread)的切换,如果切换过多,会让CPU忙于切换,也会导致影响吞吐量。

CPU性能分析:
通常我们期望我们的系统能到达以下目标:
CPU 利用率:如果 CPU有100%利用率,那么应该到达这样一个平衡:
65%-70%User Time,
30%-35% System Time,
0%-5% Idle Time。
上下文切换:上下文切换应该和 CPU 利用率联系起来看,如果能保持上面的 CPU 利用率平衡,大量的上下文切换是可以接受的。
可运行队列:每个可运行队列不应该有超过1-3个线程(每处理器),比如:双处理器系统的可运行队列里不应该超过6个线程。

内存监控相关的参数有:Physical、Virtual、Paging和Cache
Physical:总物理内存。
Virtual:虚拟物理内存。
Paging:分页。
Cache:缓存。

linux服务器下输入free –g命令,对应的物理内存指标显现在Spotlight。

(应用程序可用内存/系统物理内存)>70%时,表示系统内存资源非常充足,不影响系统性能;
(应用程序可用内存/系统物理内存)<20%时,表示系统内存资源紧缺,需要增加系统内存;
20%<(应用程序可用内存/系统物理内存)<70%时,表示系统内存资源基本能满足应用需求,暂时不影响系统性能。
应用程序可用内存对应-/+ buffers/cache这行中的free值,系统物理内存对应Mem这行的total值。

磁盘监控相关参数:Disk Reads、Service Time、Disk Writes、Queue Length、Wait Time和Busy
Disk Reads:磁盘读取速率。
Disk Writes:磁盘写入速率。
Service Time:服务时间,指磁盘读或写操作执行的时间。如果该值持续超过 20ms,一般可考虑会对上层应用产生影响。
Queue Length: I/O 等待队列长度,指待处理的 I/O 请求的数目,
如果 I/O 请求压力持续超出磁盘处理能力,该值将增加。
如果单块磁盘的队列长度持续超过 2,一般认为该磁盘存在 I/O 性能问题。

Wait Time:等待时间,指磁盘读或写操作等待执行的时间,即在队列中排队的时间。
Busy:磁盘处理事务繁忙百分比

Network监控相关参数: Network Utilization、 Connections、 Network Utilization by Kilobytes、 Packets by Network Card、Error Rates by Network Card和Collisions by Network Card
Network Utilization:网络利用率。(按数据包)
Network Utilization by Kilobytes:网络利用率。(按字节)
Packets by Network Card:数据流量。
Error Rates by Network Card:数据传输的误差率。
Collisions by Network Card:在网卡上检测到的冲突数。
Connections:连接。

小结:
如果Error Rates by Network Card和Collisions by Network Card值过高,则意味着网络带宽可能出现瓶颈。

Connections Established:建立连接的用户数。
Time_Wait:该值过高,网络可能出现瓶颈。
Close_Wait:该值过高,网络可能出现瓶颈。
Pkts/s:数据包传输速率。
Errors/s:数据包丢失率,该值过高,网络带宽可能出现瓶颈。

Spotlight 有时候有误报的现象,要配置一下警报的阀值

Spotlight 监控Linux服务器的性能的相关教程结束。

《Spotlight 监控Linux服务器的性能.doc》

下载本文的Word格式文档,以方便收藏与打印。