爆款云主机2核4G限时秒杀,88元/年起!
查看详情

活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 618智算钜惠季 爆款云主机2核4G限时秒杀,88元/年起!
  • 免费体验DeepSeek,上天翼云息壤 NEW 新老用户均可免费体验2500万Tokens,限时两周
  • 云上钜惠 HOT 爆款云主机全场特惠,更有万元锦鲤券等你来领!
  • 算力套餐 HOT 让算力触手可及
  • 天翼云脑AOne NEW 连接、保护、办公,All-in-One!
  • 中小企业应用上云专场 产品组合下单即享折上9折起,助力企业快速上云
  • 息壤高校钜惠活动 NEW 天翼云息壤杯高校AI大赛,数款产品享受线上订购超值特惠
  • 天翼云电脑专场 HOT 移动办公新选择,爆款4核8G畅享1年3.5折起,快来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

智算服务

打造统一的产品能力,实现算网调度、训练推理、技术架构、资源管理一体化智算服务
智算云(DeepSeek专区)
科研助手
  • 算力商城
  • 应用商城
  • 开发机
  • 并行计算
算力互联调度平台
  • 应用市场
  • 算力市场
  • 算力调度推荐
一站式智算服务平台
  • 模型广场
  • 体验中心
  • 服务接入
智算一体机
  • 智算一体机
大模型
  • DeepSeek-R1-昇腾版(671B)
  • DeepSeek-R1-英伟达版(671B)
  • DeepSeek-V3-昇腾版(671B)
  • DeepSeek-R1-Distill-Llama-70B
  • DeepSeek-R1-Distill-Qwen-32B
  • Qwen2-72B-Instruct
  • StableDiffusion-V2.1
  • TeleChat-12B

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场创新解决方案
办公协同
  • WPS云文档
  • 安全邮箱
  • EMM手机管家
  • 智能商业平台
财务管理
  • 工资条
  • 税务风控云
企业应用
  • 翼信息化运维服务
  • 翼视频云归档解决方案
工业能源
  • 智慧工厂_生产流程管理解决方案
  • 智慧工地
建站工具
  • SSL证书
  • 新域名服务
网络工具
  • 翼云加速
灾备迁移
  • 云管家2.0
  • 翼备份
资源管理
  • 全栈混合云敏捷版(软件)
  • 全栈混合云敏捷版(一体机)
行业应用
  • 翼电子教室
  • 翼智慧显示一体化解决方案

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
  • 天翼云EasyCoding平台
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼云东升计划
  • 适配中心
  • 东升计划
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
开放能力
  • EasyCoding敏捷开发平台
培训与认证
  • 天翼云学堂
  • 天翼云认证
魔乐社区
  • 魔乐社区

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 建议与反馈
  • 用户体验官
  • 服务保障
  • 客户公告
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 智算服务
  • 产品
  • 解决方案
  • 应用商城
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心

      Linux进程信号

      首页 知识中心 其他 文章详情页

      Linux进程信号

      2023-06-27 10:02:02 阅读次数:93

      linux,信号,进程

      信号入门

      生活角度的信号

      • 你在网上买了很多件商品,在等待不同商品快递的到来。但即便快递还没有到来,你也知道快递到了的时候应该怎么处理快递,也就是你能“识别快递”。
      • 当快递到达目的地了,你收到了快递到来的通知,但是你不一定要马上下楼取快递,也就是说取快递的行为并不是一定要立即执行,可以理解成在“在合适的时候去取”。
      • 在你收到快递到达的通知,再到你拿到快递期间,是有一个时间窗口的,在这段时间内你并没有拿到快递,但是你知道快递已经到了,本质上是你“记住了有一个快递要去取”。
      • 当你时间合适,顺利拿到快递之后,就要开始处理快递了,而处理快递的方式有三种:1、执行默认动作(打开快递,使用商品)2、执行自定义动作(快递是帮别人买的,你要将快递交给他)3、忽略(拿到快递后,放在一边继续做自己的事)。
      • 快递到来的整个过程,对你来讲是异步的,你不能确定你的快递什么时候到。

      技术应用角度的信号

      编写以下程序并运行:

      #include <stdio.h>
      #include <unistd.h>
      
      int main()
      {
      	while (1){
      		printf("hello signal!\n");
      		sleep(1);
      	}
      	return 0;
      }
      

      我们知道该程序的运行结果就是死循环地进行打印,而对于死循环来说,最好的方式就是使用Ctrl+C对其进行终止。
      Linux进程信号

      为什么使用Ctrl+C后,该进程就终止了?

      实际上当用户按Ctrl+C时,这个键盘输入会产生一个硬中断,被操作系统获取并解释成信号(Ctrl+C被解释成2号信号),然后操作系统将2号信号发送给目标前台进程,当前台进程收到2号信号后就会退出。

      我们可以使用signal函数对2号信号进行捕捉,证明当我们按Ctrl+C时进程确实是收到了2号信号。使用signal函数时,我们需要传入两个参数,第一个是需要捕捉的信号编号,第二个是对捕捉信号的处理方法,该处理方法的参数是int,返回值是void。

      例如,下面的代码中将2号信号进行了捕捉,当该进程运行起来后,若该进程收到了2号信号就会打印出收到信号的信号编号。

      #include <stdio.h>
      #include <signal.h>
      #include <unistd.h>
      
      void handler(int sig)
      {
      	printf("get a signal:%d\n", sig);
      }
      
      int main()
      {
      	signal(2, handler); //注册2号信号
      	while (1){
      		printf("hello signal!\n");
      		sleep(1);
      	}
      	return 0;
      }
      

      此时当该进程收到2号信号后,就会执行我们给出的handler方法,而不会像之前一样直接退出了,因为此时我们已经将2号信号的处理方式由默认改为了自定义了。
      Linux进程信号
      由此也证明了,当我们按Ctrl+C时进程确实是收到了2号信号。

      注意:

      1. Ctrl+C产生的信号只能发送给前台进程。在一个命令后面加个&就可以将其放到后台运行,这样Shell就不必等待进程结束就可以接收新的命令,启动新的进程。
      2. Shell可以同时运行一个前台进程和任意多个后台进程,但是只有前台进程才能接到像Ctrl+C这种控制键产生的信号。
      3. 前台进程在运行过程中,用户随时可能按下Ctrl+C而产生一个信号,也就是说该进程的用户空间代码执行到任何地方都可能收到SIGINT信号而终止,所以信号相对于进程的控制流程来说是异步的。
      4. 信号是进程之间事件异步通知的一种方式,属于软中断。

      信号的发送与记录

      我们使用kill -l命令可以查看Linux当中的信号列表。
      Linux进程信号
      其中1~31号信号是普通信号,34~64号信号是实时信号,普通信号和实时信号各自都有31个,每个信号都有一个编号和一个宏定义名称:
      Linux进程信号

      信号是如何记录的?

      实际上,当一个进程接收到某种信号后,该信号是被记录在该进程的进程控制块当中的。我们都知道进程控制块本质上就是一个结构体变量,而对于信号来说我们主要就是记录某种信号是否产生,因此,我们可以用一个32位的位图来记录信号是否产生。
      Linux进程信号
      其中比特位的位置代表信号的编号,而比特位的内容就代表是否收到对应信号,比如第6个比特位是1就表明收到了6号信号。

      信号是如何产生的?

      一个进程收到信号,本质就是该进程内的信号位图被修改了,也就是该进程的数据被修改了,而只有操作系统才有资格修改进程的数据,因为操作系统是进程的管理者。也就是说,信号的产生本质上就是操作系统直接去修改目标进程的task_struct中的信号位图。

      注意: 信号只能由操作系统发送,但信号发送的方式有多种。

      信号处理常见方式概述

      1. 执行该信号的默认处理动作。
      2. 提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕捉(Catch)一个信号。
      3. 忽略该信号。

      在Linux当中,我们可以通过man手册查看各个信号默认的处理动作。

      [cl@VM-0-15-centos SIG]$ man 7 signal
      

      Linux进程信号

      产生信号

      通过终端按键产生信号

      当面对下面的死循环程序时,我们都知道可以按Ctrl+C可以终止该进程。

      #include <stdio.h>
      #include <unistd.h>
      
      int main()
      {
      	while (1){
      		printf("hello signal!\n");
      		sleep(1);
      	}
      	return 0;
      }
      

      但实际上除了按Ctrl+C之外,按Ctrl+\也可以终止该进程。
      Linux进程信号

      按Ctrl+C终止进程和按Ctrl+\终止进程,有什么区别?

      按Ctrl+C实际上是向进程发送2号信号SIGINT,而按Ctrl+\实际上是向进程发送3号信号SIGQUIT。查看这两个信号的默认处理动作,可以看到这两个信号的Action是不一样的,2号信号是Term,而3号信号是Core。
      Linux进程信号
      Term和Core都代表着终止进程,但是Core在终止进程的时候会进行一个动作,那就是核心转储。
      Linux进程信号

      什么是核心转储?

      在云服务器中,核心转储是默认被关掉的,我们可以通过使用ulimit -a命令查看当前资源限制的设定。
      Linux进程信号
      其中,第一行显示core文件的大小为0,即表示核心转储是被关闭的。

      我们可以通过ulimit -c size命令来设置core文件的大小。
      Linux进程信号
      core文件的大小设置完毕后,就相当于将核心转储功能打开了。此时如果我们再使用Ctrl+\对进程进行终止,就会发现终止进程后会显示core dumped。
      Linux进程信号
      并且会在当前路径下生成一个core文件,该文件以一串数字为后缀,而这一串数字实际上就是发生这一次核心转储的进程的PID。
      Linux进程信号
      说明一下: ulimit命令改变的是Shell进程的Resource Limit,但myproc进程的PCB是由Shell进程复制而来的,所以也具有和Shell进程相同的Resource Limit值。

      核心转储功能有什么用?

      当我们的代码出错了,我们最关心的是我们的代码是什么原因出错的。如果我们的代码运行结束了,那么我们可以通过退出码来判断代码出错的原因,而如果一个代码是在运行过程中出错的,那么我们也要有办法判断代码是什么原因出错的。

      当我们的程序在运行过程中崩溃了,我们一般会通过调试来进行逐步查找程序崩溃的原因。而在某些特殊情况下,我们会用到核心转储,核心转储指的是操作系统在进程收到某些信号而终止运行时,将该进程地址空间的内容以及有关进程状态的其他信息转而存储到一个磁盘文件当中,这个磁盘文件也叫做核心转储文件,一般命名为core.pid。

      而核心转储的目的就是为了在调试时,方便问题的定位。

      如何运用核心转储进行调试?

      我们用下面这段代码进行演示:
      Linux进程信号
      很明显,该代码当中出现了除0错误,该程序运行3秒后便会崩溃。
      Linux进程信号
      此时我们便可以在当前目录下看到核心转储时生成的core文件。
      Linux进程信号
      使用gdb对当前可执行程序进行调试,然后直接使用core-file core文件命令加载core文件,即可判断出该程序在终止时收到了8号信号,并且定位到了产生该错误的具体代码。
      Linux进程信号
      说明一下: 事后用调试器检查core文件以查清错误原因,这种调试方式叫做事后调试。

      core dump标志

      还记得进程等待函数waitpid函数的第二个参数吗:

      pid_t waitpid(pid_t pid, int *status, int options);
      

      waitpid函数的第二个参数status是一个输出型参数,用于获取子进程的退出状态。status是一个整型变量,但status不能简单的当作整型来看待,status的不同比特位所代表的信息不同,具体细节如下(只关注status低16位比特位):
      Linux进程信号
      若进程是正常终止的,那么status的次低8位就表示进程的退出状态,即退出码。若进程是被信号所杀,那么status的低7位表示终止信号,而第8位比特位是core dump标志,即进程终止时是否进行了核心转储。
      Linux进程信号
      打开Linux的核心转储功能,并编写下列代码。代码中父进程使用fork函数创建了一个子进程,子进程所执行的代码当中存在野指针问题,当子进程执行到*p = 100时,必然会被操作系统所终止并在终止时进行核心转储。此时父进程使用waitpid函数便可获取到子进程退出时的状态,根据status的第7个比特位便可得知子进程在被终止时是否进行了核心转储。

      #include <stdio.h>
      #include <stdlib.h>
      #include <unistd.h>
      #include <sys/wait.h>
      #include <sys/types.h>
      
      int main()
      {
      	if (fork() == 0){
      		//child
      		printf("I am running...\n");
      		int *p = NULL;
      		*p = 100;
      		exit(0);
      	}
      	//father
      	int status = 0;
      	waitpid(-1, &status, 0);
      	printf("exitCode:%d, coreDump:%d, signal:%d\n",
      		(status >> 8) & 0xff, (status >> 7) & 1, status & 0x7f);
      	return 0;
      }
      

      可以看到,所获取的status的第7个比特位为1,即可说明子进程在被终止时进行了核心转储。
      Linux进程信号
      因此,core dump标志实际上就是用于表示程序崩溃的时候是否进行了核心转储。

      其他组合按键?

      我们可以通过以下代码,将1~31号信号全部进行捕捉,将收到信号后的默认处理动作改为打印收到信号的编号。

      #include <stdio.h>
      #include <unistd.h>
      #include <signal.h>
      
      void handler(int signal)
      {
      	printf("get a signal:%d\n", signal);
      }
      int main()
      {
      	int signo;
      	for (signo = 1; signo <= 31; signo++){
      		signal(signo, handler);
      	}
      	while (1){
      		sleep(1);
      	}
      	return 0;
      }
      

      此时,当我们按下组合按键Ctrl+C、Ctrl+\、Ctrl+Z后,便可以得知这些组合按键分别是向前台进程发送几号信号了。
      Linux进程信号
      但如果我们此时向该进程发送9号信号,该进程并不会打印收到了9号信号,而是执行收到9号信号后的默认处理动作,即被终止。
      Linux进程信号
      说明: 有些信号是不能被捕捉的,比如9号信号。因为如果所有信号都能被捕捉的话,那么进程就可以将所有信号全部进行捕捉并将动作设置为忽略,此时该进程将无法被杀死,即便是操作系统。

      通过系统函数向进程发信号

      当我们要使用kill命令向一个进程发送信号时,我们可以以kill -信号名 进程ID的形式进行发送。
      Linux进程信号
      也可以以kill -信号编号 进程ID的形式进行发送。
      Linux进程信号

      kill函数

      实际上kill命令是通过调用kill函数实现的,kill函数可以给指定的进程发送指定的信号,kill函数的函数原型如下:

      int kill(pid_t pid, int sig);
      

      kill函数用于向进程ID为pid的进程发送sig号信号,如果信号发送成功,则返回0,否则返回-1。

      我们可以用kill函数模拟实现一个kill命令,实现逻辑如下:

      #include <stdio.h>
      #include <stdlib.h>
      #include <sys/types.h>
      #include <signal.h>
      
      void Usage(char* proc)
      {
      	printf("Usage: %s pid signo\n", proc);
      }
      int main(int argc, char* argv[])
      {
      	if (argc != 3){
      		Usage(argv[0]);
      		return 1;
      	}
      	pid_t pid = atoi(argv[1]);
      	int signo = atoi(argv[2]);
      	kill(pid, signo);
      	return 0;
      }
      

      为了让生成的可执行程序在执行时不用带上路径,我们可以将当前路径导入环境变量PATH当中。
      Linux进程信号
      此时我们便模拟实现了一个kill命令,该命令的使用方式为mykill 进程ID 信号编号。
      Linux进程信号

      raise函数

      raise函数可以给当前进程发送指定信号,即自己给自己发送信号,raise函数的函数原型如下:

      int raise(int sig);
      

      raise函数用于给当前进程发送sig号信号,如果信号发送成功,则返回0,否则返回一个非零值。

      例如,下列代码当中用raise函数每隔一秒向自己发送一个2号信号。

      #include <stdio.h>
      #include <unistd.h>
      #include <signal.h>
      
      void handler(int signo)
      {
      	printf("get a signal:%d\n", signo);
      }
      int main()
      {
      	signal(2, handler);
      	while (1){
      		sleep(1);
      		raise(2);
      	}
      	return 0;
      }
      

      运行结果就是该进程每隔一秒收到一个2号信号。
      Linux进程信号

      abort函数

      raise函数可以给当前进程发送SIGABRT信号,使得当前进程异常终止,abort函数的函数原型如下:

      void abort(void);
      

      abort函数是一个无参数无返回值的函数。

      例如,下列代码当中每隔一秒向当前进程发送一个SIGABRT信号。

      #include <stdio.h>
      #include <stdlib.h>
      #include <unistd.h>
      #include <signal.h>
      
      void handler(int signo)
      {
      	printf("get a signal:%d\n", signo);
      }
      int main()
      {
      	signal(6, handler);
      	while (1){
      		sleep(1);
      		abort();
      	}
      	return 0;
      }
      

      与之前不同的是,虽然我们对SIGABRT信号进行了捕捉,并且在收到SIGABRT信号后执行了我们给出的自定义方法,但是当前进程依然是异常终止了。
      Linux进程信号
      说明一下: abort函数的作用是异常终止进程,exit函数的作用是正常终止进程,而abort本质是通过向当前进程发送SIGABRT信号而终止进程的,因此使用exit函数终止进程可能会失败,但使用abort函数终止进程总是成功的。

      由软件条件产生信号

      SIGPIPE信号

      SIGPIPE信号实际上就是一种由软件条件产生的信号,当进程在使用管道进行通信时,读端进程将读端关闭,而写端进程还在一直向管道写入数据,那么此时写端进程就会收到SIGPIPE信号进而被操作系统终止。

      例如,下面代码当中,创建匿名管道进行父子进程之间的通信,其中父进程是读端进程,子进程是写端进程,但是一开始通信父进程就将读端关闭了,那么此时子进程在向管道写入数据时就会收到SIGPIPE信号,进而被终止。

      #include <stdio.h>
      #include <unistd.h>
      #include <string.h>
      #include <stdlib.h>
      #include <sys/types.h>
      #include <sys/wait.h>
      int main()
      {
      	int fd[2] = { 0 };
      	if (pipe(fd) < 0){ //使用pipe创建匿名管道
      		perror("pipe");
      		return 1;
      	}
      	pid_t id = fork(); //使用fork创建子进程
      	if (id == 0){
      		//child
      		close(fd[0]); //子进程关闭读端
      		//子进程向管道写入数据
      		const char* msg = "hello father, I am child...";
      		int count = 10;
      		while (count--){
      			write(fd[1], msg, strlen(msg));
      			sleep(1);
      		}
      		close(fd[1]); //子进程写入完毕,关闭文件
      		exit(0);
      	}
      	//father
      	close(fd[1]); //父进程关闭写端
      	close(fd[0]); //父进程直接关闭读端(导致子进程被操作系统杀掉)
      	int status = 0;
      	waitpid(id, &status, 0);
      	printf("child get signal:%d\n", status & 0x7F); //打印子进程收到的信号
      	return 0;
      }
      

      运行代码后,即可发现子进程在退出时收到的是13号信号,即SIGPIPE信号。
      Linux进程信号

      SIGALRM信号

      调用alarm函数可以设定一个闹钟,也就是告诉操作系统在若干时间后发送SIGALRM信号给当前进程,alarm函数的函数原型如下:

      unsigned int alarm(unsigned int seconds);
      

      alarm函数的作用就是,让操作系统在seconds秒之后给当前进程发送SIGALRM信号,SIGALRM信号的默认处理动作是终止进程。

      alarm函数的返回值:

      • 若调用alarm函数前,进程已经设置了闹钟,则返回上一个闹钟时间的剩余时间,并且本次闹钟的设置会覆盖上一次闹钟的设置。
      • 如果调用alarm函数前,进程没有设置闹钟,则返回值为0。

      例如,我们可以用下面的代码,测试自己的云服务器一秒时间内可以将一个变量累加到多大。

      #include <stdio.h>
      #include <signal.h>
      #include <unistd.h>
      
      int main()
      {
      	int count = 0;
      	alarm(1);
      	while (1){
      		count++;
      		printf("count: %d\n", count);
      	}
      	return 0;
      }
      

      运行代码后,可以发现我当前的云服务器在一秒内可以将一个变量累加到两万左右。
      Linux进程信号
      但实际上我当前的云服务器在一秒内可以执行的累加次数远大于两万,那为什么上述代码运行结果比实际结果要小呢?

      主要原因有两个,首先,由于我们每进行一次累加就进行了一次打印操作,而与外设之间的IO操作所需的时间要比累加操作的时间更长,其次,由于我当前使用的是云服务器,因此在累加操作后还需要将累加结果通过网络传输将服务器上的数据发送过来,因此最终显示的结果要比实际一秒内可累加的次数小得多。

      为了尽可能避免上述问题,我们可以先让count变量一直执行累加操作,直到一秒后进程收到SIGALRM信号后再打印累加后的数据。

      #include <stdio.h>
      #include <stdlib.h>
      #include <signal.h>
      #include <unistd.h>
      
      int count = 0;
      void handler(int signo)
      {
      	printf("get a signal: %d\n", signo);
      	printf("count: %d\n", count);
      	exit(1);
      }
      int main()
      {
      	signal(SIGALRM, handler);
      	alarm(1);
      	while (1){
      		count++;
      	}
      	return 0;
      }
      

      此时可以看到,count变量在一秒内被累加的次数变成了五亿多,由此也证明了,与计算机单纯的计算相比较,计算机与外设进行IO时的速度是非常慢的。
      Linux进程信号

      由硬件异常产生信号

      为什么C/C++程序会崩溃?

      当我们程序当中出现类似于除0、野指针、越界之类的错误时,为什么程序会崩溃?本质上是因为进程在运行过程中收到了操作系统发来的信号进而被终止,那操作系统是如何识别到一个进程触发了某种问题的呢?

      我们知道,CPU当中有一堆的寄存器,当我们需要对两个数进行算术运算时,我们是先将这两个操作数分别放到两个寄存器当中,然后进行算术运算并把结果写回寄存器当中。此外,CPU当中还有一组寄存器叫做状态寄存器,它可以用来标记当前指令执行结果的各种状态信息,如有无进位、有无溢出等等。而操作系统是软硬件资源的管理者,在程序运行过程中,若操作系统发现CPU内的某个状态标志位被置位,而这次置位就是因为出现了某种除0错误而导致的,那么此时操作系统就会马上识别到当前是哪个进程导致的该错误,并将所识别到的硬件错误包装成信号发送给目标进程,本质就是操作系统去直接找到这个进程的task_struct,并向该进程的位图中写入8信号,写入8号信号后这个进程就会在合适的时候被终止。

      那对于下面的野指针问题,或者越界访问的问题时,操作系统又是如何识别到的呢?
      Linux进程信号
      运行结果:
      Linux进程信号
      首先我们必须知道的是,当我们要访问一个变量时,一定要先经过页表的映射,将虚拟地址转换成物理地址,然后才能进行相应的访问操作。
      Linux进程信号
      其中页表属于一种软件映射关系,而实际上在从虚拟地址到物理地址映射的时候还有一个硬件叫做MMU,它是一种负责处理CPU的内存访问请求的计算机硬件,因此映射工作不是由CPU做的,而是由MMU做的,但现在MMU已经集成到CPU当中了。

      当需要进行虚拟地址到物理地址的映射时,我们先将页表的左侧的虚拟地址导给MMU,然后MMU会计算出对应的物理地址,我们再通过这个物理地址进行相应的访问。

      而MMU既然是硬件单元,那么它当然也有相应的状态信息,当我们要访问不属于我们的虚拟地址时,MMU在进行虚拟地址到物理地址的转换时就会出现错误,然后将对应的错误写入到自己的状态信息当中,这时硬件上面的信息也会立马被操作系统识别到,进而将对应进程发送SIGSEGV信号。

      总结一下:
      C/C++程序会崩溃,是因为程序当中出现的各种错误最终一定会在硬件层面上有所表现,进而会被操作系统识别到,然后操作系统就会发送相应的信号将当前的进程终止。

      阻塞信号

      信号其他相关常见概念

      • 实际执行信号的处理动作,称为信号递达(Delivery)。
      • 信号从产生到递达之间的状态,称为信号未决(pending)。
      • 进程可以选择阻塞(Block)某个信号。
      • 被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作。
      • 需要注意的是,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后的一种处理动作。

      在内核中的表示

      信号在内核中的表示示意图如下:
      Linux进程信号

      • 每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。在上图中,SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。
      • SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会在改变处理动作之后再接触阻塞。
      • SIGQUIT信号未产生过,但一旦产生SIGQUIT信号,该信号将被阻塞,它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前,这种信号产生过多次,POSIX.1允许系统递达该信号一次或多次。Linux是这样实现的:普通信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里,这里只讨论普通信号。

      总结一下:

      1. 在block位图中,比特位的位置代表某一个信号,比特位的内容代表该信号是否被阻塞。
      2. 在pending位图中,比特位的位置代表某一个信号,比特位的内容代表是否收到该信号。
      3. handler表本质上是一个函数指针数组,数组的下标代表某一个信号,数组的内容代表该信号递达时的处理动作,处理动作包括默认、忽略以及自定义。
      4. block、pending和handler这三张表的每一个位置是一一对应的。

      sigset_t

      根据信号在内核中的表示方法,每个信号的未决标志只有一个比特位,非0即1,如果不记录该信号产生了多少次,那么阻塞标志也只有一个比特位。

      因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储。在我当前的云服务中,sigset_t类型的定义如下:(不同操作系统实现sigset_t的方案可能不同)

      #define _SIGSET_NWORDS (1024 / (8 * sizeof (unsigned long int)))
      typedef struct
      {
      	unsigned long int __val[_SIGSET_NWORDS];
      } __sigset_t;
      
      typedef __sigset_t sigset_t;
      

      sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态。

      • 在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞。
      • 在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。

      阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。

      信号集操作函数

      sigset_t类型对于每种信号用一个bit表示“有效”或“无效”,至于这个类型内部如何存储这些bit则依赖于系统的实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的。

      #include <signal.h>
      
      int sigemptyset(sigset_t *set);
      
      int sigfillset(sigset_t *set);
      
      int sigaddset(sigset_t *set, int signum);
      
      int sigdelset(sigset_t *set, int signum);
      
      int sigismember(const sigset_t *set, int signum);  
      

      函数解释:

      • sigemptyset函数:初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号。
      • sigfillset函数:初始化set所指向的信号集,使其中所有信号的对应bit置位,表示该信号集的有效信号包括系统支持的所有信号。
      • sigaddset函数:在set所指向的信号集中添加某种有效信号。
      • sigdelset函数:在set所指向的信号集中删除某种有效信号。
      • sigemptyset、sigfillset、sigaddset和sigdelset函数都是成功返回0,出错返回-1。
      • sigismember函数:判断在set所指向的信号集中是否包含某种信号,若包含则返回1,不包含则返回0,调用失败返回-1。

      注意: 在使用sigset_t类型的变量之前,一定要调用sigemptyset或sigfillset做初始化,使信号处于确定的状态。

      例如,我们可以按照如下方式使用这些函数。

      #include <stdio.h>
      #include <signal.h>
      
      int main()
      {
      	sigset_t s; //用户空间定义的变量
      
      	sigemptyset(&s);
      
      	sigfillset(&s);
      
      	sigaddset(&s, SIGINT);
      
      	sigdelset(&s, SIGINT);
      
      	sigismember(&s, SIGINT);
      	return 0;
      }
      

      注意: 代码中定义的sigset_t类型的变量s,与我们平常定义的变量一样都是在用户空间定义的变量,所以后面我们用信号集操作函数对变量s的操作实际上只是对用户空间的变量s做了修改,并不会影响进程的任何行为。因此,我们还需要通过系统调用,才能将变量s的数据设置进操作系统。

      sigprocmask

      sigprocmask函数可以用于读取或更改进程的信号屏蔽字(阻塞信号集),该函数的函数原型如下:

      int sigprocmask(int how, const sigset_t *set, sigset_t *oldset);
      

      参数说明:

      • 如果oset是非空指针,则读取进程当前的信号屏蔽字通过oset参数传出。
      • 如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。
      • 如果oset和set都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。

      假设当前的信号屏蔽字为mask,下表说明了how参数的可选值及其含义:

      选项 含义
      SIG_BLOCK set包含了我们希望添加到当前信号屏蔽字的信号,相当于mask=mask|set
      SIG_UNBLOCK set包含了我们希望从当前信号屏蔽字中解除阻塞的信号,相当于mask=mask|~set
      SIG_SETMASK 设置当前信号屏蔽字为set所指向的值,相当于mask=set

      返回值说明:

      • sigprocmask函数调用成功返回0,出错返回-1。

      注意: 如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask函数返回前,至少将其中一个信号递达。

      sigpending

      sigpending函数可以用于读取进程的未决信号集,该函数的函数原型如下:

      int sigpending(sigset_t *set);
      

      sigpending函数读取当前进程的未决信号集,并通过set参数传出。该函数调用成功返回0,出错返回-1。

      下面我们来做一个简单的实验

      实验步骤如下:

      1. 先用上述的函数将2号信号进行屏蔽(阻塞)。
      2. 使用kill命令或组合按键向进程发送2号信号。
      3. 此时2号信号会一直被阻塞,并一直处于pending(未决)状态。
      4. 使用sigpending函数获取当前进程的pending信号集进行验证。

      代码如下:

      #include <stdio.h>
      #include <unistd.h>
      #include <signal.h>
      
      void printPending(sigset_t *pending)
      {
      	int i = 1;
      	for (i = 1; i <= 31; i++){
      		if (sigismember(pending, i)){
      			printf("1 ");
      		}
      		else{
      			printf("0 ");
      		}
      	}
      	printf("\n");
      }
      int main()
      {
      	sigset_t set, oset;
      	sigemptyset(&set);
      	sigemptyset(&oset);
      
      	sigaddset(&set, 2); //SIGINT
      	sigprocmask(SIG_SETMASK, &set, &oset); //阻塞2号信号
      
      	sigset_t pending;
      	sigemptyset(&pending);
      
      	while (1){
      		sigpending(&pending); //获取pending
      		printPending(&pending); //打印pending位图(1表示未决)
      		sleep(1);
      	}
      	return 0;
      }
      

      可以看到,程序刚刚运行时,因为没有收到任何信号,所以此时该进程的pending表一直是全0,而当我们使用kill命令向该进程发送2号信号后,由于2号信号是阻塞的,因此2号信号一直处于未决状态,所以我们看到pending表中的第二个数字一直是1。
      Linux进程信号
      为了看到2号信号递达后pending表的变化,我们可以设置一段时间后,自动解除2号信号的阻塞状态,解除2号信号的阻塞状态后2号信号就会立即被递达。因为2号信号的默认处理动作是终止进程,所以为了看到2号信号递达后的pending表,我们可以将2号信号进行捕捉,让2号信号递达时执行我们所给的自定义动作。

      #include <stdio.h>
      #include <unistd.h>
      #include <signal.h>
      
      void printPending(sigset_t *pending)
      {
      	int i = 1;
      	for (i = 1; i <= 31; i++){
      		if (sigismember(pending, i)){
      			printf("1 ");
      		}
      		else{
      			printf("0 ");
      		}
      	}
      	printf("\n");
      }
      void handler(int signo)
      {
      	printf("handler signo:%d\n", signo);
      }
      int main()
      {
      	signal(2, handler);
      	sigset_t set, oset;
      	sigemptyset(&set);
      	sigemptyset(&oset);
      
      	sigaddset(&set, 2); //SIGINT
      	sigprocmask(SIG_SETMASK, &set, &oset); //阻塞2号信号
      
      	sigset_t pending;
      	sigemptyset(&pending);
      
      	int count = 0;
      	while (1){
      		sigpending(&pending); //获取pending
      		printPending(&pending); //打印pending位图(1表示未决)
      		sleep(1);
      		count++;
      		if (count == 20){
      			sigprocmask(SIG_SETMASK, &oset, NULL); //恢复曾经的信号屏蔽字
      			printf("恢复信号屏蔽字\n");
      		}
      	}
      	return 0;
      }
      

      此时就可以看到,进程收到2号信号后,该信号在一段时间内处于未决状态,当解除2号信号的屏蔽后,2号信号就会立即递达,执行我们所给的自定义动作,而此时的pending表也变回了全0。
      Linux进程信号
      细节: 在解除2号信号后,2号信号的自定义动作是在打印“恢复信号屏蔽字”之前执行的。因为如果调用sigprocmask解除对当前若干个未决信号的阻塞,则在sigprocmask函数返回前,至少将其中一个信号递达。

      捕捉信号

      内核空间与用户空间

      每一个进程都有自己的进程地址空间,该进程地址空间由内核空间和用户空间组成:

      • 用户所写的代码和数据位于用户空间,通过用户级页表与物理内存之间建立映射关系。
      • 内核空间存储的实际上是操作系统代码和数据,通过内核级页表与物理内存之间建立映射关系。

      内核级页表是一个全局的页表,它用来维护操作系统的代码与进程之间的关系。因此,在每个进程的进程地址空间中,用户空间是属于当前进程的,每个进程看到的代码和数据是完全不同的,但内核空间所存放的都是操作系统的代码和数据,所有进程看到的都是一样的内容。
      Linux进程信号
      需要注意的是,虽然每个进程都能够看到操作系统,但并不意味着每个进程都能够随时对其进行访问。

      如何理解进程切换?

      1. 在当前进程的进程地址空间中的内核空间,找到操作系统的代码和数据。
      2. 执行操作系统的代码,将当前进程的代码和数据剥离下来,并换上另一个进程的代码和数据。

      注意: 当你访问用户空间时你必须处于用户态,当你访问内核空间时你必须处于内核态。

      内核态与用户态

      内核态与用户态:

      • 内核态通常用来执行操作系统的代码,是一种权限非常高的状态。
      • 用户态是一种用来执行普通用户代码的状态,是一种受监管的普通状态。

      进程收到信号之后,并不是立即处理信号,而是在合适的时候,这里所说的合适的时候实际上就是指,从内核态切换回用户态的时候。

      内核态和用户态之间是进行如何切换的?

      从用户态切换为内核态通常有如下几种情况:

      1. 需要进行系统调用时。
      2. 当前进程的时间片到了,导致进程切换。
      3. 产生异常、中断、陷阱等。

      与之相对应,从内核态切换为用户态有如下几种情况:

      1. 系统调用返回时。
      2. 进程切换完毕。
      3. 异常、中断、陷阱等处理完毕。

      其中,由用户态切换为内核态我们称之为陷入内核。每当我们需要陷入内核的时,本质上是因为我们需要执行操作系统的代码,比如系统调用函数是由操作系统实现的,我们要进行系统调用就必须先由用户态切换为内核态。

      内核如何实现信号的捕捉

      当我们在执行主控制流程的时候,可能因为某些情况而陷入内核,当内核处理完毕准备返回用户态时,就需要进行信号pending的检查。(此时仍处于内核态,有权力查看当前进程的pending位图)

      在查看pending位图时,如果发现有未决信号,并且该信号没有被阻塞,那么此时就需要该信号进行处理。

      如果待处理信号的处理动作是默认或者忽略,则执行该信号的处理动作后清除对应的pending标志位,如果没有新的信号要递达,就直接返回用户态,从主控制流程中上次被中断的地方继续向下执行即可。
      Linux进程信号
      但如果待处理信号是自定义捕捉的,即该信号的处理动作是由用户提供的,那么处理该信号时就需要先返回用户态执行对应的自定义处理动作,执行完后再通过特殊的系统调用sigreturn再次陷入内核并清除对应的pending标志位,如果没有新的信号要递达,就直接返回用户态,继续执行主控制流程的代码。
      Linux进程信号
      注意: sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。

      巧计

      当待处理信号是自定义捕捉时的情况比较复杂,可以借助下图进行记忆:
      Linux进程信号
      其中,该图形与直线有几个交点就代表在这期间有几次状态切换,而箭头的方向就代表着此次状态切换的方向,图形中间的圆点就代表着检查pending表。

      当识别到信号的处理动作是自定义时,能直接在内核态执行用户空间的代码吗?

      理论上来说是可以的,因为内核态是一种权限非常高的状态,但是绝对不能这样设计。

      如果允许在内核态直接执行用户空间的代码,那么用户就可以在代码中设计一些非法操作,比如清空数据库等,虽然在用户态时没有足够的权限做到清空数据库,但是如果是在内核态时执行了这种非法代码,那么数据库就真的被清空了,因为内核态是有足够权限清空数据库的。

      也就是说,不能让操作系统直接去执行用户的代码,因为操作系统无法保证用户的代码是合法代码,即操作系统不信任任何用户。

      sigaction

      捕捉信号除了用前面用过的signal函数之外,我们还可以使用sigaction函数对信号进行捕捉,sigaction函数的函数原型如下:

      int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);
      

      sigaction函数可以读取和修改与指定信号相关联的处理动作,该函数调用成功返回0,出错返回-1。

      参数说明:

      • signum代表指定信号的编号。
      • 若act指针非空,则根据act修改该信号的处理动作。
      • 若oldact指针非空,则通过oldact传出该信号原来的处理动作。

      其中,参数act和oldact都是结构体指针变量,该结构体的定义如下:

      struct sigaction {
      	void(*sa_handler)(int);
      	void(*sa_sigaction)(int, siginfo_t *, void *);
      	sigset_t   sa_mask;
      	int        sa_flags;
      	void(*sa_restorer)(void);
      };
      

      结构体的第一个成员sa_handler:

      • 将sa_handler赋值为常数SIG_IGN传给sigaction函数,表示忽略信号。
      • 将sa_handler赋值为常数SIG_DFL传给sigaction函数,表示执行系统默认动作。
      • 将sa_handler赋值为一个函数指针,表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数。

      注意: 所注册的信号处理函数的返回值为void,参数为int,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然这是一个回调函数,不是被main函数调用,而是被系统所调用。

      结构体的第二个成员sa_sigaction:

      • sa_sigaction是实时信号的处理函数。

      结构体的第三个成员sa_mask:

      首先需要说明的是,当某个信号的处理函数被调用,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。

      如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时,自动恢复原来的信号屏蔽字。

      结构体的第四个成员sa_flags:

      sa_flags字段包含一些选项,这里直接将sa_flags设置为0即可。

      结构体的第五个成员sa_restorer:

      该参数没有使用。

      例如,下面我们用sigaction函数对2号信号进行了捕捉,将2号信号的处理动作改为了自定义的打印动作,并在执行一次自定义动作后将2号信号的处理动作恢复为原来默认的处理动作。

      #include <stdio.h>
      #include <string.h>
      #include <unistd.h>
      #include <signal.h>
      
      struct sigaction act, oact;
      void handler(int signo)
      {
      	printf("get a signal:%d\n", signo);
      	sigaction(2, &oact, NULL);
      }
      int main()
      {
      	memset(&act, 0, sizeof(act));
      	memset(&oact, 0, sizeof(oact));
      
      	act.sa_handler = handler;
      	act.sa_flags = 0;
      	sigemptyset(&act.sa_mask);
      
      	sigaction(2, &act, &oact);
      	while (1){
      		printf("I am a process...\n");
      		sleep(1);
      	}
      	return 0;
      }
      

      运行代码后,第一次向进程发送2号信号,执行我们自定义的打印动作,当我们再次向进程发送2号信号,就执行该信号的默认处理动作了,即终止进程。
      Linux进程信号

      可重入函数

      下面主函数中调用insert函数向链表中插入结点node1,某信号处理函数中也调用了insert函数向链表中插入结点node2,乍眼一看好像没什么问题。
      Linux进程信号
      下面我们来分析一下,对于下面这个链表。
      Linux进程信号
      1、首先,main函数中调用了insert函数,想将结点node1插入链表,但插入操作分为两步,刚做完第一步的时候,因为硬件中断使进程切换到内核,再次回到用户态之前检查到有信号待处理,于是切换到sighandler函数。
      Linux进程信号
      2、而sighandler函数中也调用了insert函数,将结点node2插入到了链表中,插入操作完成第一步后的情况如下:
      Linux进程信号
      3、当结点node2插入的两步操作都做完之后从sighandler返回内核态,此时链表的布局如下:
      Linux进程信号
      4、再次回到用户态就从main函数调用的insert函数中继续往下执行,即继续进行结点node1的插入操作。
      Linux进程信号
      最终结果是,main函数和sighandler函数先后向链表中插入了两个结点,但最后只有node1结点真正插入到了链表中,而node2结点就再也找不到了,造成了内存泄漏。

      上述例子中,各函数执行的先后顺序如下:
      Linux进程信号
      像上例这样,insert函数被不同的控制流调用(main函数和sighandler函数使用不同的堆栈空间,它们之间不存在调用与被调用的关系,是两个独立的控制流程),有可能在第一次调用还没返回时就再次进入该函数,我们将这种现象称之为重入。

      而insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数我们称之为不可重入函数,反之,如果一个函数只访问自己的局部变量或参数,则称之为可重入(Reentrant)函数。

      如果一个函数符合以下条件之一则是不可重入的:

      1. 调用了malloc或free,因为malloc也是用全局链表来管理堆的。
      2. 调用了标志I/O库函数,因为标准I/O库的很多实现都以不可重入的方式使用全局数据结构。

      volatile

      volatile是C语言的一个关键字,该关键字的作用是保持内存的可见性。

      在下面的代码中,我们对2号信号进行了捕捉,当该进程收到2号信号时会将全局变量flag由0置1。也就是说,在进程收到2号信号之前,该进程会一直处于死循环状态,直到收到2号信号时将flag置1才能够正常退出。

      #include <stdio.h>
      #include <signal.h>
      
      int flag = 0;
      
      void handler(int signo)
      {
      	printf("get a signal:%d\n", signo);
      	flag = 1;
      }
      int main()
      {
      	signal(2, handler);
      	while (!flag);
      	printf("Proc Normal Quit!\n");
      	return 0;
      }
      

      运行结果如下:
      Linux进程信号
      该程序的运行过程好像都在我们的意料之中,但实际并非如此。代码中的main函数和handler函数是两个独立的执行流,而while循环是在main函数当中的,在编译器编译时只能检测到在main函数中对flag变量的使用。

      此时编译器检测到在main函数中并没有对flag变量做修改操作,在编译器优化级别较高的时候,就有可能将flag设置进寄存器里面。
      Linux进程信号
      此时main函数在检测flag时只检测寄存器里面的值,而handler执行流只是将内存中flag的值置为1了,那么此时就算进程收到2号信号也不会跳出死循环。

      在编译代码时携带-O3选项使得编译器的优化级别最高,此时再运行该代码,就算向进程发生2号信号,该进程也不会终止。Linux进程信号
      面对这种情况,我们就可以使用volatile关键字对flag变量进行修饰,告知编译器,对flag变量的任何操作都必须真实的在内存中进行,即保持了内存的可见性。

      #include <stdio.h>
      #include <signal.h>
      
      volatile int flag = 0;
      
      void handler(int signo)
      {
      	printf("get a signal:%d\n", signo);
      	flag = 1;
      }
      int main()
      {
      	signal(2, handler);
      	while (!flag);
      	printf("Proc Normal Quit!\n");
      	return 0;
      }
      

      此时就算我们编译代码时携带-O3选项,当进程收到2号信号将内存中的flag变量置1时,main函数执行流也能够检测到内存中flag变量的变化,进而跳出死循环正常退出。
      Linux进程信号

      SIGCHLD信号

      为了避免出现僵尸进程,父进程需要使用wait或waitpid函数等待子进程结束,父进程可以阻塞等待子进程结束,也可以非阻塞地查询的是否有子进程结束等待清理,即轮询的方式。采用第一种方式,父进程阻塞就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一下,程序实现复杂。

      其实,子进程在终止时会给父进程发生SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD信号的处理动作,这样父进程就只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait或waitpid函数清理子进程即可。

      例如,下面代码中对SIGCHLD信号进行了捕捉,并将在该信号的处理函数中调用了waitpid函数对子进程进行了清理。

      #include <stdio.h>
      #include <unistd.h>
      #include <signal.h>
      #include <stdlib.h>
      #include <sys/wait.h>
      
      void handler(int signo)
      {
      	printf("get a signal: %d\n", signo);
      	int ret = 0;
      	while ((ret = waitpid(-1, NULL, WNOHANG)) > 0){
      		printf("wait child %d success\n", ret);
      	}
      }
      int main()
      {
      	signal(SIGCHLD, handler);
      	if (fork() == 0){
      		//child
      		printf("child is running, begin dead: %d\n", getpid());
      		sleep(3);
      		exit(1);
      	}
      	//father
      	while (1);
      	return 0;
      }
      

      注意:

      1. SIGCHLD属于普通信号,记录该信号的pending位只有一个,如果在同一时刻有多个子进程同时退出,那么在handler函数当中实际上只清理了一个子进程,因此在使用waitpid函数清理子进程时需要使用while不断进行清理。
      2. 使用waitpid函数时,需要设置WNOHANG选项,即非阻塞式等待,否则当所有子进程都已经清理完毕时,由于while循环,会再次调用waitpid函数,此时就会在这里阻塞住。

      此时父进程就只需专心处理自己的工作,不必关心子进程了,子进程终止时父进程收到SIGCHLD信号,会自动进行该信号的自定义处理动作,进而对子进程进行清理。
      Linux进程信号
      事实上,由于UNIX的历史原因,要想不产生僵尸进程还有另外一种办法:父进程调用signal或sigaction函数将SIGCHLD信号的处理动作设置为SIG_IGN,这样fork出来的子进程在终止时会自动清理掉,不会产生僵尸进程,也不会通知父进程。系统默认的忽略动作和用户用signal或sigaction函数自定义的忽略通常是没有区别的,但这是一个特列。此方法对于Linux可用,但不保证在其他UNIX系统上都可用。

      例如,下面代码中调用signal函数将SIGCHLD信号的处理动作自定义为忽略。

      #include <stdio.h>
      #include <unistd.h>
      #include <signal.h>
      #include <stdlib.h>
      
      int main()
      {
      	signal(SIGCHLD, SIG_IGN);
      	if (fork() == 0){
      		//child
      		printf("child is running, child dead: %d\n", getpid());
      		sleep(3);
      		exit(1);
      	}
      	//father
      	while (1);
      	return 0;
      }
      

      此时子进程在终止时会自动被清理掉,不会产生僵尸进程,也不会通知父进程。
      Linux进程信号

      版权声明:本文内容来自第三方投稿或授权转载,原文地址:https://blog.csdn.net/chenlong_cxy/article/details/121315266,作者:2021dragon,版权归原作者所有。本网站转在其作品的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如因作品内容、版权等问题需要同本网站联系,请发邮件至ctyunbbs@chinatelecom.cn沟通。

      上一篇:Linux常见指令汇总(入门必备)

      下一篇:Linux学习(6)——挂载命令

      相关文章

      2025-05-19 09:04:53

      查看RISC-V版本的gcc中默认定义的宏

      查看RISC-V版本的gcc中默认定义的宏

      2025-05-19 09:04:53
      c++ , linux
      2025-05-16 09:15:10

      Linux系统基础-进程信号超详细讲解

      Linux系统基础-进程信号超详细讲解

      2025-05-16 09:15:10
      kill , 信号 , 命令 , 进程
      2025-05-14 10:02:58

      Linux top 命令使用教程

      Linux top 是一个在Linux和其他类Unix 系统上常用的实时系统监控工具。它提供了一个动态的、交互式的实时视图,显示系统的整体性能信息以及正在运行的进程的相关信息。

      2025-05-14 10:02:58
      CPU , 信息 , 内存 , 占用 , 备注 , 进程
      2025-05-13 09:51:29

      ogg在启动应用进程时报错OGG-00412

      ogg在启动应用进程时报错OGG-00412

      2025-05-13 09:51:29
      ogg , OGG , 时报 , 进程
      2025-05-13 09:51:17

      无法启动ogg配置好的抓取以及投递进程

      无法启动ogg配置好的抓取以及投递进程

      2025-05-13 09:51:17
      ogg , 启动 , 抓取 , 进程
      2025-05-13 09:49:19

      内置变量_其他相关

      内置变量_其他相关

      2025-05-13 09:49:19
      参数 , 基础知识 , 实践 , 小结 , 脚本 , 进程
      2025-05-09 08:51:09

      【Linux 从基础到进阶】进程管理与性能调优

      在 Linux 系统中,进程是执行中的程序实例。有效的进程管理和性能调优可以提升系统的响应速度和资源利用率。本文将介绍进程管理的基本概念、常用命令,以及性能调优的最佳实践,适用于 CentOS 和 Ubuntu 系统。

      2025-05-09 08:51:09
      CPU , 性能 , 管理 , 调优 , 进程
      2025-05-07 09:08:16

      MFC如何打开和关闭进程、动态获取进程号、关闭自身进程

      进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,每一个进程都是一个实体有属于自己的地址控件,进程也是一个执行的程序

      2025-05-07 09:08:16
      函数 , 句柄 , 返回值 , 进程
      2025-04-22 09:40:08

      【Linux】Java进程CPU 使用率过高问题排查

      【Linux】Java进程CPU 使用率过高问题排查

      2025-04-22 09:40:08
      CPU , 打印 , 进程
      2025-04-22 09:27:28

      Linux进程调度与等待:背后的机制与实现

      Linux进程调度与等待:背后的机制与实现

      2025-04-22 09:27:28
      wait , 状态 , 进程
      查看更多
      推荐标签

      作者介绍

      天翼云小翼
      天翼云用户

      文章

      33561

      阅读量

      5250294

      查看更多

      最新文章

      查看RISC-V版本的gcc中默认定义的宏

      2025-05-19 09:04:53

      ogg在启动应用进程时报错OGG-00412

      2025-05-13 09:51:29

      【Linux 从基础到进阶】进程管理与性能调优

      2025-05-09 08:51:09

      MFC如何打开和关闭进程、动态获取进程号、关闭自身进程

      2025-05-07 09:08:16

      Linux进程调度与等待:背后的机制与实现

      2025-04-22 09:27:28

      Linux中ps命令使用指南

      2025-04-16 09:26:45

      查看更多

      热门文章

      Linux crontab 任务误删恢复及备份步骤

      2023-03-20 08:19:07

      Linux 趣味小知识--软硬连接以及应用

      2023-04-23 09:32:49

      Linux常用命令总结

      2023-05-12 07:20:42

      linux-压缩与解压缩

      2023-05-15 10:03:24

      linux基本命令(47)——iostat命令

      2023-05-12 07:21:43

      Linux中文本搜索命令grep用法详解

      2023-06-07 07:36:41

      查看更多

      热门标签

      linux java python javascript 数组 前端 docker Linux vue 函数 shell git 节点 容器 示例
      查看更多

      相关产品

      弹性云主机

      随时自助获取、弹性伸缩的云服务器资源

      天翼云电脑(公众版)

      便捷、安全、高效的云电脑服务

      对象存储

      高品质、低成本的云上存储服务

      云硬盘

      为云上计算资源提供持久性块存储

      查看更多

      随机文章

      linux-修改所有者与所属组

      linux-文件管理-不完整版

      分享一个shell脚本:通过Jumper机器来创建Jumper和target机器账号

      HTTP协议基础及报文抓包分析

      第5集(GItlab+Jenkins+SonarQube+Docker+Harbor+Selenium实现CI/CD之build image)

      Linux命令之修改文件权限chmod

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2025 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号