linux运维监控常见命令
-
Linux运维监控常见命令包括以下几个方面:
1. 系统监控命令:
– top: 实时查看系统的运行状态,包括正在运行的进程和CPU、内存的使用情况。
– vmstat: 统计系统的虚拟内存、进程、CPU和IO情况。
– iostat: 统计磁盘IO情况,包括读写速度、等待时间等。
– sar: 统计系统各项指标的历史数据,可以用于分析系统的性能问题。2. 网络监控命令:
– ifconfig: 查看和配置网络接口的信息。
– netstat: 显示网络连接、路由、接口和网络统计数据。
– nmap: 扫描网络设备、端口和服务状态。
– tcpdump: 抓取网络数据包用于网络分析和故障排查。3. 进程监控命令:
– ps: 显示当前系统进程的状态信息。
– top: 实时查看系统的运行状态,包括正在运行的进程和CPU、内存的使用情况。
– lsof: 列出系统打开的文件和进程。
– kill: 终止指定进程。
– strace: 跟踪进程的系统调用和信号。4. 日志监控命令:
– tail: 实时查看日志文件的最后几行。
– grep: 在日志文件中查找指定的关键词。
– sed/awk: 对日志文件进行过滤和处理。
– logrotate: 自动轮转日志文件,防止日志文件过大。5. 硬件监控命令:
– df: 显示文件系统的使用情况。
– du: 查看目录或文件的磁盘使用情况。
– free: 查看系统内存使用情况。
– uptime: 显示系统的运行时间和平均负载情况。
– smartctl: 查看硬盘的健康状态和SMART信息。以上是Linux运维监控常见命令的一些示例,可以根据实际需求选择使用。通过这些命令,可以实时监控系统运行状态,及时发现和解决问题,保证系统的稳定性和可靠性。
2年前 -
Linux运维监控是Linux系统管理中非常重要的一部分,可以帮助管理员实时了解系统的运行状态和性能指标。以下是一些常见的Linux运维监控命令:
1. top命令:top命令可以实时显示系统的运行状态和各个进程的资源使用情况。使用top命令可以查看CPU利用率、内存使用情况、进程数量等信息,还可以按各种指标排序进程列表,方便管理员快速找到资源占用过多的进程。
2. free命令:free命令可以显示系统的内存使用情况。使用free命令可以查看系统的总内存、已使用内存、空闲内存以及缓存和缓冲区的使用情况,帮助管理员了解系统的内存利用率和是否存在内存泄漏等问题。
3. iostat命令:iostat命令可以显示系统的磁盘IO情况。使用iostat命令可以查看每个磁盘设备的读写速度、磁盘队列长度、利用率等信息,帮助管理员了解系统的磁盘性能状况。
4. vmstat命令:vmstat命令可以显示系统的虚拟内存使用情况。使用vmstat命令可以查看系统的进程状态、CPU利用率、内存使用情况、交换空间使用情况等信息,帮助管理员了解系统的整体性能状况。
5. netstat命令:netstat命令可以显示系统的网络状态。使用netstat命令可以查看系统的网络连接情况、网络接口的状态、路由表等信息,帮助管理员了解系统的网络性能状况和网络连接情况。
除了以上几个常见的监控命令,还有一些其他的常用监控命令,比如sar命令可以查看系统的CPU、内存、磁盘、网络等多个资源的使用情况,并可以按时间间隔生成监控报告;iotop命令可以显示系统中正在进行的磁盘IO操作,并按IO使用率排序进程列表;pstree命令可以以树状结构显示系统的进程关系等等。
总之,Linux运维监控命令可以帮助管理员实时监控系统的运行状态和性能指标,及时发现和解决问题,确保系统的稳定和高效运行。管理员应该熟练掌握这些命令,并通过脚本等方式自动化监控,提升运维效率。
2年前 -
本文将介绍一些常见的Linux运维监控命令,涵盖了系统状态、进程管理、硬盘和内存使用、网络连接以及日志检查等方面。
# 系统状态监控
## uptime
命令:`uptime`
作用:显示系统的运行时间和平均负载
示例输出:
“`
20:34:26 up 1 day, 4:28, 2 users, load average: 0.00, 0.01, 0.05
“`## top
命令:`top`
作用:实时显示系统性能和进程信息
示例输出:
“`
top – 20:36:52 up 1 day, 4:30, 2 users, load average: 0.01, 0.03, 0.05
Tasks: 217 total, 2 running, 215 sleeping, 0 stopped, 0 zombie
%Cpu(s): 3.6 us, 0.6 sy, 0.0 ni, 95.8 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 2047720 total, 428172 free, 745336 used, 777212 buff/cache
KiB Swap: 2097148 total, 2097148 free, 0 used. 1142692 avail MemPID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
333 root 20 0 235192 40784 22764 S 3.0 2.0 3:23.27 systemd-journal
“`## sysstat
命令:`mpstat`
作用:显示多核CPU的统计信息
示例输出:
“`
Linux 5.4.0-40-generic (hostname) 07/01/2021 _x86_64_ (8 CPU)20:38:52 CPU %usr %nice %sys %iowait %irq %soft %steal %guest %gnice %idle
20:38:52 all 0.03 0.00 0.01 0.00 0.00 0.00 0.00 0.00 0.00 99.96
20:38:52 0 0.02 0.00 0.01 0.00 0.00 0.00 0.00 0.00 0.00 99.97
20:38:52 1 0.02 0.00 0.01 0.00 0.00 0.00 0.00 0.00 0.00 100.00
“`# 进程管理
## ps
命令:`ps aux`
作用:显示系统中所有进程的信息
示例输出:
“`
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.2 225620 6368 ? Ss Jun30 1:12 /sbin/init
root 2 0.0 0.0 0 0 ? S Jun30 0:00 [kthreadd]
root 3 0.0 0.0 0 0 ? I< Jun30 0:00 [rcu_gp]root 4 0.0 0.0 0 0 ? I< Jun30 0:00 [rcu_par_gp]```## top命令:`top`作用:实时显示系统性能和进程信息示例输出:```top - 20:50:53 up 1 day, 4:45, 2 users, load average: 0.14, 0.04, 0.05Tasks: 219 total, 1 running, 218 sleeping, 0 stopped, 0 zombie%Cpu(s): 0.9 us, 1.0 sy, 0.0 ni, 98.0 id, 0.0 wa, 0.0 hi, 0.1 si, 0.0 stKiB Mem : 2047720 total, 377656 free, 820308 used, 793756 buff/cache```## pstree命令:`pstree`作用:以树形结构显示进程示例输出:```init─┬─atd ├─containerd───12*[{containerd}] ├─cron ├─dbus-daemon ├─dockerd───9*[{dockerd}] ├─2*[getty] ├─jbd2/sda1-8 ├─2*[login───bash] ├─lvmetad ├─networkd-dispat───{networkd-dispat} ├─12*[systemd───(sd-pam)] ├─sshd───sshd───sshd───bash───pstree```# 硬盘和内存使用## df命令:`df -h`作用:显示文件系统的使用情况示例输出:```Filesystem Size Used Avail Use% Mounted on/dev/nvme0n1p2 27G 7.9G 18G 31% /tmpfs 1.9G 0 1.9G 0% /dev/shmtmpfs 207M 100K 207M 1% /run/user/1000```## du命令:`du -h`作用:估算目录或文件的磁盘空间使用情况示例输出:```16M ./bin4.0K ./root108K ./boot4.0K ./srv1.9G ./var36K ./etc256K ./tmp12K ./media4.0K ./opt4.0K ./mnt5.0G ./home0 ./.dockerenv8.0K ./lib6494M ./lib16K ./lost+found176M ./usr4.0K ./sys```## free命令:`free -h`作用:显示系统的内存使用情况示例输出:``` total used free shared buff/cache availableMem: 1.9G 1.0G 186M 77M 725M 576MSwap: 2.0G 1.1G 907M```# 网络连接## netstat命令:`netstat -tunlp`作用:显示网络连接、监听端口和进程信息示例输出:```Active Internet connections (only servers)Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program nametcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN 1234/sshdtcp6 0 0 :::22 :::* LISTEN 1234/sshdudp 12560 0 0.0.0.0:68 0.0.0.0:* 567/dhclient```## ss命令:`ss -tunlp`作用:显示网络连接、监听端口和进程信息示例输出:```State Recv-Q Send-Q Local Address:Port Peer Address:Port ProcessLISTEN 0 128 0.0.0.0:22 0.0.0.0:* users:(("sshd",pid=1234,fd=3))LISTEN 0 128 [::]:22 [::]:* users:(("sshd",pid=1234,fd=4))```# 日志检查## tail命令:`tail -f /var/log/syslog`作用:实时查看日志内容示例输出:```Jul 1 20:57:41 hostname kernel: [ 3284.816150] CPU4: Package temperature/speed normalJul 1 20:57:41 hostname kernel: [ 3284.816165] CPU5: Package temperature/speed normalJul 1 20:57:41 hostname kernel: [ 3284.816182] CPU6: Package temperature/speed normalJul 1 20:57:41 hostname kernel: [ 3284.816201] CPU7: Package temperature/speed normal```## grep命令:`grep "error" /var/log/syslog`作用:查找日志中包含关键词的行示例输出:```Jul 1 20:57:58 hostname kernel: [ 3301.305273] nouveau 0000:01:00.0: gr: intr 80000000Jul 1 20:57:58 hostname kernel: [ 3301.330079] nouveau 0000:01:00.0: gr: intr 80000000Jul 1 20:58:00 hostname kernel: [ 3303.101271] nouveau 0000:01:00.0: gr: intr 80000000```以上是一些常见的Linux运维监控命令,可以帮助我们实时了解系统的状态、进程信息、硬盘和内存使用情况、网络连接以及日志等,有助于我们诊断和解决问题。2年前