5

如何在 Linux 上杀死一个僵尸进程 | Linux 中国

 2 years ago
source link: https://zhuanlan.zhihu.com/p/427980564
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

如何在 Linux 上杀死一个僵尸进程 | Linux 中国

要杀死一个僵尸进程,你必须从进程列表中删除其名称。

(本文字数:2787,阅读时长大约:3 分钟)

这里有一个和 Unix 纪元一样古老的故事。自从有了 C 和 Unix,以及(后来的)Linux,我们就有了“ 僵尸(zombie)”。具体来说,有一些进程被标记为“ 僵尸进程(zombie process)”。一些人误解它,另一些人忽视它,而它对我们许多人试图 “杀死” 这些进程的努力免疫,没有什么成效。这是为什么呢?

Linux 中的进程是什么?

这一切始于执行 Linux 中的一个程序时,当它被执行时,它的运行实例被称为进程。你可以用 ps 命令 查看你的 Linux 环境中的所有进程:

$ ps -ax
        PID TTY         STAT   TIME COMMAND
        1 ?     Ss      0:01 /usr/lib/systemd/systemd rhgb --switched-root --sys
        2 ?     S       0:00 [kthreadd]
        3 ?     I<      0:00 [rcu_gp]
        4 ?     I<      0:00 [rcu_par_gp]

有时一个进程启动另一个进程,使第一个进程成为第二个进程的父进程。pstree 命令是一个很好的工具,可以让你看到系统中进程的“家谱”:

$ pstree -psn
systemd(1)─┬─systemd-journal(952)
        ├─systemd-udevd(963)
        ├─systemd-oomd(1137)
        ├─systemd-resolve(1138)
        ├─systemd-userdbd(1139)─┬─systemd-userwor(12707)
        │                     ├─systemd-userwor(12714)
        │                     └─systemd-userwor(12715)
        ├─auditd(1140)───{auditd}(1141)
        ├─dbus-broker-lau(1164)───dbus-broker(1165)
        ├─avahi-daemon(1166)───avahi-daemon(1196)
        ├─bluetoothd(1167)

每个进程在系统中都会被分配一个编号。进程编号(PID)1 被分配给启动过程中执行的第一个进程,PID 1 之后的每一个进程都是它的子孙。PID 1 进程是初始化进程,在大多数新版本的 Linux 中,它只是一个指向 systemd 程序的符号链接。

用 kill 命令结束一个进程

你可以用 kill 命令来终止 Linux 系统中的进程。尽管名字叫 “杀死”,但 kill 命令和其他一些命令,如 pkillkillall,都是为向一个或多个进程发送信号而编写/设计的。当没有指定信号时,它发送的默认信号是 SIGTERM 信号,以终止进程。

当一个父进程死亡或被杀死,而其子进程没有跟随其父进程的死亡,我们称该进程为“ 孤儿进程(orphan process)”。

如何杀死一个僵尸进程

另一方面,僵尸进程是不能被“杀死”的!你可能会问为什么?因为它们已经死了!

每一个子进程,当被终止时,都会成为一个僵尸进程,然后被父进程删除。当进程退出并释放它所使用的资源时,它的名字仍然在操作系统的进程表中。这时,父进程的工作就是把它的名字从进程表中删除。如果没有删除,我们就有了僵尸进程,它不再是一个真正的进程,而只是操作系统进程表上的一个条目。

这就是为什么试图对一个 失效的(defunct)(僵尸)进程执行 “杀死” 命令,即使使用 -9SIGKILL)选项也不起作用,因为没有什么可以杀死的。

因此,要杀死一个僵尸进程,比如从进程列表(进程表)中删除其名称,你必须杀死其父进程。例如,如果 PID 5878 是一个僵尸进程,而它的父进程是 PID 4809,那么要杀死僵尸进程(5878),就必须结束父进程(4809):

$ sudo kill -9 4809  # 4809 是父进程,而非僵尸

我对僵尸的最后一句警告:在杀死父进程时要非常小心。如果一个进程的父进程是 PID 1,而你杀了它,你就会重新启动自己!

而这将是一个更可怕的故事!


via: https://opensource.com/article/21/10/linux-zombie-process

作者:Anderson Silva 选题:lujun9972 译者:wxy 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK