有两个这样的进程:僵尸进程&孤儿进程,蓝瘦香菇

良许Linux

共 3208字,需浏览 7分钟

 ·

2020-07-31 16:12



点击「阅读原文」查看良许原创精品视频。

链接:https://juejin.im/post/5f20fbeae51d45348675fa78

那时刚写公众号,当时记录的学习笔记,现在看来,之前记录的有一个错误的地方,当时也没察觉到。

写错了就要改嘛,程序员也不能怕错~

不知道大家看自己几年前的做事情,有的时候有没有一种感觉,这是我做的吗???

好吧,有点嫌弃当时的自己~

直接进入正题吧,父子进程之间到底有啥关系?

进程

先来说下什么是进程:

来看下百度是怎么说的:

光看说的不够形象,在windows系统中,它长这样:

在Mac系统中,它长这样:

Linux中是这样的:(有点长截图一部分好了)

[root@iz2ze76ybn73dvwmdij06zz ~]# ps -ef
UID        PID  PPID  C STIME TTY          TIME CMD
root         1     0  0 5月20 ?       00:00:33 /usr/lib/systemd/systemd --system --deserialize 21
root         2     0  0 5月20 ?       00:00:00 [kthreadd]
root         3     2  0 5月20 ?       00:00:06 [ksoftirqd/0]
root         5     2  0 5月20 ?       00:00:00 [kworker/0:0H]
root         7     2  0 5月20 ?       00:00:02 [migration/0]
root         8     2  0 5月20 ?       00:00:00 [rcu_bh]
root         9     2  0 5月20 ?       00:30:40 [rcu_sched]
root        10     2  0 5月20 ?       00:00:17 [watchdog/0]
root        11     2  0 5月20 ?       00:00:16 [watchdog/1]
root        12     2  0 5月20 ?       00:00:02 [migration/1]
root        13     2  0 5月20 ?       00:00:03 [ksoftirqd/1]
root        15     2  0 5月20 ?       00:00:00 [kworker/1:0H]
root        17     2  0 5月20 ?       00:00:00 [kdevtmpfs]
root        18     2  0 5月20 ?       00:00:00 [netns]
root        19     2  0 5月20 ?       00:00:01 [khungtaskd]
root        20     2  0 5月20 ?       00:00:00 [writeback]
root        21     2  0 5月20 ?       00:00:00 [kintegrityd]
root        22     2  0 5月20 ?       00:00:00 [bioset]
root        23     2  0 5月20 ?       00:00:00 [kblockd]

OK,以上每一行都是对一个进程的描述,来具体看一下每个参数的含义:

标示描述
UID用户ID
PID进程ID
PPID父进程ID
C进程占cpu百分比
STIME进程启动的时间
TTY终端机位置
TIME实际使用cpu的时间
CMD命令以及参数

我们现在知道了每个参数的含义,既然讲到进程嘛,首先,进程ID是唯一的并且是非负数的,但是进程ID是可以复用的,毕竟进程也会终止。

可以看到没有进程PID是0的,这是为什么呢?黑人问号脸?

0一般来说是系统进程,属于内核的一部分,不执行任何磁盘上的程序。

fork

一个进程可以通过调用fork函数创建新的进程,被创建出来的这个进程就叫子进程。

这里需要注意一下,fork函数的返回值父子进程区别。

  • 子进程 :返回值是0,返回0的理由是子进程的父进程是可以唯一确定的,通过getppid方法可以获取到父进程id。
  • 父进程 : 返回的是新创建的子进程的id,因为父进程可以有多个子进程,也没有这样的函数可以获取该线程的子线程的所有id。

下边的话我们来验证一下上说的这一段话。准备好脚本。

#include 
#include 
#include 

int main(int argc, char const *argv[])
{

    pid_t p1 = fork();

    printf("%d\n",p1);

    if(p1 > 0)
    {
        printf("父进程 pid = %d, p1 = %d\n", getpid(), p1);
    }
    else
    {
        printf("子进程 pid = %d , ppid = %d, p1 = %d\n", getpid(), getppid(), p1);
    }

    return 0;
}

运行看结果:

[root@iz2ze76ybn73dvwmdij06zz ~]# ./fork2
10213
父进程 pid = 10212, p1 = 10213
0
子进程 pid = 10213 , ppid = 10212, p1 = 0

通过上面的小例子我们可以看到父进程的返回值是子进程的ID,子进程的返回是0。

孤儿进程

孤儿我们都懂就是。。。

是的,没错孤儿进程也是这样的,就是没有父进程的进程。当然创建的时候肯定是要先创建父进程了,当父进程退出时,它的子进程们(一个或者多个)就成了孤儿进程了。

接下来在继续做一个小测试,让父进程现退出。准备好脚本。

[root@iz2ze76ybn73dvwmdij06zz ~]# cat guer.c
#include 
#include 
#include 
#include 


int main()
{
    pid_t pid = fork();

    if (pid < 0) {
 perror("fork error;");
        exit(1);
    } else if (pid == 0) {
 sleep(5);
        printf ("子进程 : [ pid] = %d , 父进程 [ppid] = %d\n",getpid(),getppid());
        exit(0);

    } else if (pid > 0) {
 printf("我是父线程,我先退出一步~\n");
 exit(0);

    }
  return 0;
}

执行并看结果:

到这里估计很多童鞋估计已经看懂了,父进程退出后,子进程被一个进程ID为1的进程领养的。还挺好这个结果,至少还是有人管的,被暖到了~ 进程id为1的进程是init进程,每当有孤儿进程出现时,init进程就会收养它并成为它的父进程 ,来照顾它以孤儿进程以后的生活。

危害

因为孤儿进程会被init进程接管,所以孤儿进程是没有危害的。

僵尸进程

和孤儿进程相反的是,这次是子进程先退出,而父进程又没有去处理回收释放子进程的资源,这个时候子进程就成了僵尸进程。

先准备好代码:

[root@iz2ze76ybn73dvwmdij06zz ~]# cat zombie.c
  #include 
  #include 
  #include 
  #include 

  int main()
  {
      pid_t pid;
      pid = fork();
     if (pid < 0)
     {
         perror("fork error:");
         exit(1);
     }
     else if (pid == 0)
     {
         printf("我是子进程,我要先退出一步了.\n");
  printf("子进程 id : %d\n" ,getpid());
         exit(0);
     } else {
         printf("我是父进程,我先睡2秒\n");
         printf("父进程 id : %d\n" ,getpid());

         sleep(2);

         while(2); //来个死循环,不退出的那种
    }


   return 0;
 }

运行看下结果:

再来开一个终端看下进程结果:

大家可以看到,子进程并没有完全退出,释放资源,而是变成了僵尸进程。

危害

资源上是占用不了什么资源。但是通常系统的进程数量都是有限制的,如果有大量的僵尸进程占用进程号,导致新的进程无法创建,这个危害类似于占个坑,不办事。

处理

1.干掉父进程

干掉父进程后,让剩下的子进程成为孤儿进程,成为孤儿进程后就和我们上面说的一样了,由init进程来领养这些进程,并且来处理这些进程的资源释放等工作。

2.父进程调用wait或waitpid

等函数等待子进程结束,这会导致父进程挂起。执行wait()或 waitpid()系统调用,则子进程在终止后会立即把它在进程表中的数据返回给父进程,此时系统会立即删除该进入点。在这种情形下就不会产生defunct进程。

3.fork两次

第一次 fork : 父进程fork一个子进程

第二次 fork : 子进程fork一个孙进程后退出

那么孙进程被init接管,当孙进程结束后,init会回收。

但子进程的回收还要自己做。

4.signal函数

父进程来处理:用signal函数为SIGCHLD安装handler,在子进程结束后,父进程会收到该信号,可以在handler中调用wait回收。

内核来处理: 如果父进程不关心子进程什么时候结束,可以通过以下两个函数通知内核自己不感兴趣子进程的结束,此时,子进程结束后,内核会回收并不再给你父进程发信号。

  • signal(SIGCLD, SIG_IGN)
  • signal(SIGCHLD, SIG_IGN)

总结

本来以为简单的一个问题,没想到这个篇幅其实也不算短,所以感觉程序员真的不能说一个什么知识点就简单,很容易理解啊,一旦你想要深入也是需要一定的时间花费和精力的~

参考:

  • 《UNIX环境高级编程(中文第三版)》

  • http://suo.im/6tOqJz

  • http://suo.im/67gdou

良许个人微信


添加良许个人微信即送3套程序员必读资料


→ 精选技术资料共享

→ 高手如云交流社群





本公众号全部博文已整理成一个目录,请在公众号里回复「m」获取!

推荐阅读:

这个只有1.5M的软件,能让你的网速快3倍

在Linux系统中使用Vim读写远程文件

漫画:什么是 “设计模式” ?


5T技术资源大放送!包括但不限于:C/C++,Linux,Python,Java,PHP,人工智能,单片机,树莓派,等等。在公众号内回复「1024」,即可免费获取!!


浏览 8
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报