linux运维监控常见命令 • Worktile社区

fiy

Worktile&PingCode市场小伙伴

Linux运维监控常见命令包括以下几个方面：

1. 系统监控命令：
– top: 实时查看系统的运行状态，包括正在运行的进程和CPU、内存的使用情况。
– vmstat: 统计系统的虚拟内存、进程、CPU和IO情况。
– iostat: 统计磁盘IO情况，包括读写速度、等待时间等。
– sar: 统计系统各项指标的历史数据，可以用于分析系统的性能问题。

2. 网络监控命令：
– ifconfig: 查看和配置网络接口的信息。
– netstat: 显示网络连接、路由、接口和网络统计数据。
– nmap: 扫描网络设备、端口和服务状态。
– tcpdump: 抓取网络数据包用于网络分析和故障排查。

3. 进程监控命令：
– ps: 显示当前系统进程的状态信息。
– top: 实时查看系统的运行状态，包括正在运行的进程和CPU、内存的使用情况。
– lsof: 列出系统打开的文件和进程。
– kill: 终止指定进程。
– strace: 跟踪进程的系统调用和信号。

4. 日志监控命令：
– tail: 实时查看日志文件的最后几行。
– grep: 在日志文件中查找指定的关键词。
– sed/awk: 对日志文件进行过滤和处理。
– logrotate: 自动轮转日志文件，防止日志文件过大。

5. 硬件监控命令：
– df: 显示文件系统的使用情况。
– du: 查看目录或文件的磁盘使用情况。
– free: 查看系统内存使用情况。
– uptime: 显示系统的运行时间和平均负载情况。
– smartctl: 查看硬盘的健康状态和SMART信息。

以上是Linux运维监控常见命令的一些示例，可以根据实际需求选择使用。通过这些命令，可以实时监控系统运行状态，及时发现和解决问题，保证系统的稳定性和可靠性。

2年前 0条评论

不及物动词

这个人很懒，什么都没有留下～

Linux运维监控是Linux系统管理中非常重要的一部分，可以帮助管理员实时了解系统的运行状态和性能指标。以下是一些常见的Linux运维监控命令：

1. top命令：top命令可以实时显示系统的运行状态和各个进程的资源使用情况。使用top命令可以查看CPU利用率、内存使用情况、进程数量等信息，还可以按各种指标排序进程列表，方便管理员快速找到资源占用过多的进程。

2. free命令：free命令可以显示系统的内存使用情况。使用free命令可以查看系统的总内存、已使用内存、空闲内存以及缓存和缓冲区的使用情况，帮助管理员了解系统的内存利用率和是否存在内存泄漏等问题。

3. iostat命令：iostat命令可以显示系统的磁盘IO情况。使用iostat命令可以查看每个磁盘设备的读写速度、磁盘队列长度、利用率等信息，帮助管理员了解系统的磁盘性能状况。

4. vmstat命令：vmstat命令可以显示系统的虚拟内存使用情况。使用vmstat命令可以查看系统的进程状态、CPU利用率、内存使用情况、交换空间使用情况等信息，帮助管理员了解系统的整体性能状况。

5. netstat命令：netstat命令可以显示系统的网络状态。使用netstat命令可以查看系统的网络连接情况、网络接口的状态、路由表等信息，帮助管理员了解系统的网络性能状况和网络连接情况。

除了以上几个常见的监控命令，还有一些其他的常用监控命令，比如sar命令可以查看系统的CPU、内存、磁盘、网络等多个资源的使用情况，并可以按时间间隔生成监控报告；iotop命令可以显示系统中正在进行的磁盘IO操作，并按IO使用率排序进程列表；pstree命令可以以树状结构显示系统的进程关系等等。

总之，Linux运维监控命令可以帮助管理员实时监控系统的运行状态和性能指标，及时发现和解决问题，确保系统的稳定和高效运行。管理员应该熟练掌握这些命令，并通过脚本等方式自动化监控，提升运维效率。

2年前 0条评论

worktile

Worktile官方账号

本文将介绍一些常见的Linux运维监控命令，涵盖了系统状态、进程管理、硬盘和内存使用、网络连接以及日志检查等方面。

# 系统状态监控

## uptime

命令：`uptime`

作用：显示系统的运行时间和平均负载

示例输出：
“`
20:34:26 up 1 day, 4:28, 2 users, load average: 0.00, 0.01, 0.05
“`

## top

命令：`top`

作用：实时显示系统性能和进程信息

示例输出：
“`
top – 20:36:52 up 1 day, 4:30, 2 users, load average: 0.01, 0.03, 0.05
Tasks: 217 total, 2 running, 215 sleeping, 0 stopped, 0 zombie
%Cpu(s): 3.6 us, 0.6 sy, 0.0 ni, 95.8 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 2047720 total, 428172 free, 745336 used, 777212 buff/cache
KiB Swap: 2097148 total, 2097148 free, 0 used. 1142692 avail Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
333 root 20 0 235192 40784 22764 S 3.0 2.0 3:23.27 systemd-journal
“`

## sysstat

命令：`mpstat`

作用：显示多核CPU的统计信息

示例输出：
“`
Linux 5.4.0-40-generic (hostname) 07/01/2021 _x86_64_ (8 CPU)

20:38:52 CPU %usr %nice %sys %iowait %irq %soft %steal %guest %gnice %idle
20:38:52 all 0.03 0.00 0.01 0.00 0.00 0.00 0.00 0.00 0.00 99.96
20:38:52 0 0.02 0.00 0.01 0.00 0.00 0.00 0.00 0.00 0.00 99.97
20:38:52 1 0.02 0.00 0.01 0.00 0.00 0.00 0.00 0.00 0.00 100.00
“`

# 进程管理

## ps

命令：`ps aux`

作用：显示系统中所有进程的信息

示例输出：
“`
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.2 225620 6368 ? Ss Jun30 1:12 /sbin/init
root 2 0.0 0.0 0 0 ? S Jun30 0:00 [kthreadd]
root 3 0.0 0.0 0 0 ? I< Jun30 0:00 [rcu_gp]root 4 0.0 0.0 0 0 ? I< Jun30 0:00 [rcu_par_gp]```## top命令：`top`作用：实时显示系统性能和进程信息示例输出：```top - 20:50:53 up 1 day, 4:45, 2 users, load average: 0.14, 0.04, 0.05Tasks: 219 total, 1 running, 218 sleeping, 0 stopped, 0 zombie%Cpu(s): 0.9 us, 1.0 sy, 0.0 ni, 98.0 id, 0.0 wa, 0.0 hi, 0.1 si, 0.0 stKiB Mem : 2047720 total, 377656 free, 820308 used, 793756 buff/cache```## pstree命令：`pstree`作用：以树形结构显示进程示例输出：```init─┬─atd ├─containerd───12*[{containerd}] ├─cron ├─dbus-daemon ├─dockerd───9*[{dockerd}] ├─2*[getty] ├─jbd2/sda1-8 ├─2*[login───bash] ├─lvmetad ├─networkd-dispat───{networkd-dispat} ├─12*[systemd───(sd-pam)] ├─sshd───sshd───sshd───bash───pstree```# 硬盘和内存使用## df命令：`df -h`作用：显示文件系统的使用情况示例输出：```Filesystem Size Used Avail Use% Mounted on/dev/nvme0n1p2 27G 7.9G 18G 31% /tmpfs 1.9G 0 1.9G 0% /dev/shmtmpfs 207M 100K 207M 1% /run/user/1000```## du命令：`du -h`作用：估算目录或文件的磁盘空间使用情况示例输出：```16M ./bin4.0K ./root108K ./boot4.0K ./srv1.9G ./var36K ./etc256K ./tmp12K ./media4.0K ./opt4.0K ./mnt5.0G ./home0 ./.dockerenv8.0K ./lib6494M ./lib16K ./lost+found176M ./usr4.0K ./sys```## free命令：`free -h`作用：显示系统的内存使用情况示例输出：``` total used free shared buff/cache availableMem: 1.9G 1.0G 186M 77M 725M 576MSwap: 2.0G 1.1G 907M```# 网络连接## netstat命令：`netstat -tunlp`作用：显示网络连接、监听端口和进程信息示例输出：```Active Internet connections (only servers)Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program nametcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN 1234/sshdtcp6 0 0 :::22 :::* LISTEN 1234/sshdudp 12560 0 0.0.0.0:68 0.0.0.0:* 567/dhclient```## ss命令：`ss -tunlp`作用：显示网络连接、监听端口和进程信息示例输出：```State Recv-Q Send-Q Local Address:Port Peer Address:Port ProcessLISTEN 0 128 0.0.0.0:22 0.0.0.0:* users:(("sshd",pid=1234,fd=3))LISTEN 0 128 [::]:22 [::]:* users:(("sshd",pid=1234,fd=4))```# 日志检查## tail命令：`tail -f /var/log/syslog`作用：实时查看日志内容示例输出：```Jul 1 20:57:41 hostname kernel: [ 3284.816150] CPU4: Package temperature/speed normalJul 1 20:57:41 hostname kernel: [ 3284.816165] CPU5: Package temperature/speed normalJul 1 20:57:41 hostname kernel: [ 3284.816182] CPU6: Package temperature/speed normalJul 1 20:57:41 hostname kernel: [ 3284.816201] CPU7: Package temperature/speed normal```## grep命令：`grep "error" /var/log/syslog`作用：查找日志中包含关键词的行示例输出：```Jul 1 20:57:58 hostname kernel: [ 3301.305273] nouveau 0000:01:00.0: gr: intr 80000000Jul 1 20:57:58 hostname kernel: [ 3301.330079] nouveau 0000:01:00.0: gr: intr 80000000Jul 1 20:58:00 hostname kernel: [ 3303.101271] nouveau 0000:01:00.0: gr: intr 80000000```以上是一些常见的Linux运维监控命令，可以帮助我们实时了解系统的状态、进程信息、硬盘和内存使用情况、网络连接以及日志等，有助于我们诊断和解决问题。

2年前 0条评论