Linux 系统监控、诊断工具之 lsof 用法简介

1、lsof 简介

lsof 是 linux 下的一个非常实用的系统级的监控、诊断工具。
它的意思是 List Open Files,很容易你就记住了它是 “ls + of”的组合~
它可以用来列出被各种进程打开的文件信息,记住:linux 下 “一切皆文件”,
包括但不限于 pipes, sockets, directories, devices, 等等。
因此,使用 lsof,你可以获取任何被打开文件的各种信息。

只需输入 lsof 就可以生成大量的信息,因为 lsof 需要访问核心内存和各种文件,所以必须以 root 用户的身份运行它才能够充分地发挥其功能。

lsof 的示例输出:

2、lsof 常用用法

2.1 监控打开的文件、设备

查看文件、设备被哪些进程占用

2.2 监控文件系统

指定目录、挂载点,可以看到有哪些进程打开了其下的文件:

这在 umount 某个文件系统失败时非常有用(通常会报该 FS is busy)。

列出某个目录(挂载点 如 /home 也行)下被打开的文件:

列出被指定进程名打开的文件:

2.3 监控进程

指定进程号,可以查看该进程打开的文件:

当你想要杀掉某个用户所有打开的文件、设备,你可以这样:

此处 -t 的作用是单独的列出 进程 id 这一列。

关于杀死进程的 4 种方式,请参考:

4 Ways to Kill a Process – kill, killall, pkill, xkill

 

2.4 监控网络

查看指定端口有哪些进程在使用(lsof -i 列出所有的打开的网络连接):

列出被某个进程打开所有的网络文件:

或者

列出所有 tcp、udp 连接:

列出所有 NFS 文件:

查看指定网口有哪些进程在使用:

3、更多使用技巧

3.1 监控用戶

查看指定用戶打开的文件(lsof -u ^lakshmanan 可以排除某用户):

3.2 监控应用程序

查看指定程序打开的文件:

4、命令模式技巧

4.1 组合逻辑查询条件

只有多个查询条件都满足, 用 “-a” 参数,默认是 -o 。

4.2 lsof 命令的重复执行模式:

基于给定的参数延时多少秒重复执行 lsof

+r 表示 当没有文件被打开的时候,repeat mode 将自行结束。

-r 表示 不管文件是否存在或者被打开,它都将执行,直到你中断它。

每个循环的输出使用 ‘=======’ 做分隔符,你也可以用 ‘-r’ | ‘+r’ 指定延时时间。

 

以上输出是前 5 秒没有输出,然后 “inita.sh” 启动后,开始有了输出。

 

5、最后的技巧

关于磁盘空间告警 df -h –max=1 与 du -hx –max=1 显示不一致的问题,

最常见的的还是下面这种情况:

看看被删除的文件:有些删了文件,但是进程没 reload,那些空间还是占用的,你可以理解为类似 windows 下的进程句柄没释放的概念吧~ 只是 windows 下如果有文件被进程使用,你一般是删不掉的,而 linux 虽然不做删除限制,但却要等到进程使用完文件才能完全释放,以防止进程奔溃,这是操作系统对资源的管理差异吧~
例如 nginx 会有很多临时文件占用了 /tmp 目录,删掉后,依然占用着空间,

此时你可以:

好吧,本文到此结束了,关于 lsof 还有很多很多,不过哥常用、知道的就这些了,哥也只能帮你到这儿了,

如果你还需要其它的内容,请自行 google 吧,骚年。。。

 

6、refer: 

使用 lsof 查找打开的文件

http://www.ibm.com/developerworks/cn/aix/library/au-lsof.html

15 Linux lsof Command Examples (Identify Open Files)

15 Linux lsof Command Examples (Identify Open Files)

实用的系统工具之 lsof

http://www.ylinux.org/forum/t/276

Leave a Reply

Your email address will not be published.