有两个这样的进程:僵尸进程&孤儿进程,蓝瘦香菇
点击上方“全栈IT技术前线”,选择“星标”
每天实用技术分享 在看|留言|真爱
先来说下什么是进程:
来看下百度是怎么说的:
光看说的不够形象,在windows系统中,它长这样:
在Mac系统中,它长这样:
Linux中是这样的:(有点长截图一部分好了)
[root@iz2ze76ybn73dvwmdij06zz ~]# ps -ef
UID PID PPID C STIME TTY TIME CMD
root 1 0 0 5月20 ? 00:00:33 /usr/lib/systemd/systemd --system --deserialize 21
root 2 0 0 5月20 ? 00:00:00 [kthreadd]
root 3 2 0 5月20 ? 00:00:06 [ksoftirqd/0]
root 5 2 0 5月20 ? 00:00:00 [kworker/0:0H]
root 7 2 0 5月20 ? 00:00:02 [migration/0]
root 8 2 0 5月20 ? 00:00:00 [rcu_bh]
root 9 2 0 5月20 ? 00:30:40 [rcu_sched]
root 10 2 0 5月20 ? 00:00:17 [watchdog/0]
root 11 2 0 5月20 ? 00:00:16 [watchdog/1]
root 12 2 0 5月20 ? 00:00:02 [migration/1]
root 13 2 0 5月20 ? 00:00:03 [ksoftirqd/1]
root 15 2 0 5月20 ? 00:00:00 [kworker/1:0H]
root 17 2 0 5月20 ? 00:00:00 [kdevtmpfs]
root 18 2 0 5月20 ? 00:00:00 [netns]
root 19 2 0 5月20 ? 00:00:01 [khungtaskd]
root 20 2 0 5月20 ? 00:00:00 [writeback]
root 21 2 0 5月20 ? 00:00:00 [kintegrityd]
root 22 2 0 5月20 ? 00:00:00 [bioset]
root 23 2 0 5月20 ? 00:00:00 [kblockd]
OK,以上每一行都是对一个进程的描述,来具体看一下每个参数的含义:
标示 | 描述 |
---|---|
UID | 用户ID |
PID | 进程ID |
PPID | 父进程ID |
C | 进程占cpu百分比 |
STIME | 进程启动的时间 |
TTY | 终端机位置 |
TIME | 实际使用cpu的时间 |
CMD | 命令以及参数 |
我们现在知道了每个参数的含义,既然讲到进程嘛,首先,进程ID是唯一的并且是非负数的,但是进程ID是可以复用的,毕竟进程也会终止。
可以看到没有进程PID是0的,这是为什么呢?黑人问号脸?
0一般来说是系统进程,属于内核的一部分,不执行任何磁盘上的程序。
fork
一个进程可以通过调用fork函数创建新的进程,被创建出来的这个进程就叫子进程。
这里需要注意一下,fork函数的返回值父子进程区别。
子进程 :返回值是0,返回0的理由是子进程的父进程是可以唯一确定的,通过getppid方法可以获取到父进程id。 父进程 : 返回的是新创建的子进程的id,因为父进程可以有多个子进程,也没有这样的函数可以获取该线程的子线程的所有id。
下边的话我们来验证一下上说的这一段话。准备好脚本。
#include
#include
#include
int main(int argc, char const *argv[])
{
pid_t p1 = fork();
printf("%d\n",p1);
if(p1 > 0)
{
printf("父进程 pid = %d, p1 = %d\n", getpid(), p1);
}
else
{
printf("子进程 pid = %d , ppid = %d, p1 = %d\n", getpid(), getppid(), p1);
}
return 0;
}
运行看结果:
[root@iz2ze76ybn73dvwmdij06zz ~]# ./fork2
10213
父进程 pid = 10212, p1 = 10213
0
子进程 pid = 10213 , ppid = 10212, p1 = 0
通过上面的小例子我们可以看到父进程的返回值是子进程的ID,子进程的返回是0。
孤儿进程
孤儿我们都懂就是。。。
是的,没错孤儿进程也是这样的,就是没有父进程的进程。当然创建的时候肯定是要先创建父进程了,当父进程退出时,它的子进程们(一个或者多个)就成了孤儿进程了。
接下来在继续做一个小测试,让父进程现退出。准备好脚本。
[root@iz2ze76ybn73dvwmdij06zz ~]# cat guer.c
#include
#include
#include
#include
int main()
{
pid_t pid = fork();
if (pid < 0) {
perror("fork error;");
exit(1);
} else if (pid == 0) {
sleep(5);
printf ("子进程 : [ pid] = %d , 父进程 [ppid] = %d\n",getpid(),getppid());
exit(0);
} else if (pid > 0) {
printf("我是父线程,我先退出一步~\n");
exit(0);
}
return 0;
}
执行并看结果:
到这里估计很多童鞋估计已经看懂了,父进程退出后,子进程被一个进程ID为1的进程领养的。还挺好这个结果,至少还是有人管的,被暖到了~ 进程id为1的进程是init进程,每当有孤儿进程出现时,init进程就会收养它并成为它的父进程 ,来照顾它以孤儿进程以后的生活。
危害
因为孤儿进程会被init进程接管,所以孤儿进程是没有危害的。
僵尸进程
和孤儿进程相反的是,这次是子进程先退出,而父进程又没有去处理回收释放子进程的资源,这个时候子进程就成了僵尸进程。
先准备好代码:
[root@iz2ze76ybn73dvwmdij06zz ~]# cat zombie.c
#include
#include
#include
#include
int main()
{
pid_t pid;
pid = fork();
if (pid < 0)
{
perror("fork error:");
exit(1);
}
else if (pid == 0)
{
printf("我是子进程,我要先退出一步了.\n");
printf("子进程 id : %d\n" ,getpid());
exit(0);
} else {
printf("我是父进程,我先睡2秒\n");
printf("父进程 id : %d\n" ,getpid());
sleep(2);
while(2); //来个死循环,不退出的那种
}
return 0;
}
运行看下结果:
再来开一个终端看下进程结果:
大家可以看到,子进程并没有完全退出,释放资源,而是变成了僵尸进程。
危害
资源上是占用不了什么资源。但是通常系统的进程数量都是有限制的,如果有大量的僵尸进程占用进程号,导致新的进程无法创建,这个危害类似于占个坑,不办事。
处理
1.干掉父进程
干掉父进程后,让剩下的子进程成为孤儿进程,成为孤儿进程后就和我们上面说的一样了,由init进程来领养这些进程,并且来处理这些进程的资源释放等工作。
2.父进程调用wait或waitpid
等函数等待子进程结束,这会导致父进程挂起。执行wait()或 waitpid()系统调用,则子进程在终止后会立即把它在进程表中的数据返回给父进程,此时系统会立即删除该进入点。在这种情形下就不会产生defunct进程。
3.fork两次
第一次 fork : 父进程fork一个子进程
第二次 fork : 子进程fork一个孙进程后退出
那么孙进程被init接管,当孙进程结束后,init会回收。
但子进程的回收还要自己做。
4.signal函数
父进程来处理:用signal函数为SIGCHLD安装handler,在子进程结束后,父进程会收到该信号,可以在handler中调用wait回收。
内核来处理: 如果父进程不关心子进程什么时候结束,可以通过以下两个函数通知内核自己不感兴趣子进程的结束,此时,子进程结束后,内核会回收并不再给你父进程发信号。
signal(SIGCLD, SIG_IGN) signal(SIGCHLD, SIG_IGN)
总结
本来以为简单的一个问题,没想到这个篇幅其实也不算短,所以感觉程序员真的不能说一个什么知识点就简单,很容易理解啊,一旦你想要深入也是需要一定的时间花费和精力的~
参考:
《UNIX环境高级编程(中文第三版)》
http://suo.im/6tOqJz
http://suo.im/67gdou
---END---
好用的IT工具、精彩的IT培训视频、前言的技术分享,定期技术资源大放送!涵盖云计算、大数据、人工智能、虚拟化、存储、服务器、Linux、Docker&Kubernetes等。在公众号内回复「1」,即可免费获取!!