信号中断导致sem_timedwait返回EINTR
EINTR是 “Interrupted function call” 的缩写。它的含义是:一个阻塞的系统调用(比如正在等待信号的)在执行过程中,进程(或线程)收到了一个信号并且该信号被处理了。处理完信号后,系统调用不会自动恢复,而是会立即返回,并通过设置errno为EINTR来告诉你:“我本来在等着,但是被一个信号打断了,所以先返回了”。你可以把的等待过程类比为:你正在电话客服,进入了等待队列(阻
你好!这个问题问得非常好,这是处理系统调用和信号时一个非常经典且重要的场景。
简单直接的回答是:当 sem_timedwait
调用被一个信号(Signal)中断时,errno
会被设置为 EINTR
。
下面我为你详细解释一下为什么会发生这种情况以及代码为何要这样写。
1. 什么是 EINTR?
EINTR
是 “Interrupted function call” 的缩写。它的含义是:一个阻塞的系统调用(比如正在等待信号的 sem_timedwait
)在执行过程中,进程(或线程)收到了一个信号并且该信号被处理了。处理完信号后,系统调用不会自动恢复,而是会立即返回,并通过设置 errno
为 EINTR
来告诉你:“我本来在等着,但是被一个信号打断了,所以先返回了”。
2. 什么场景下会触发?
任何可以发送给进程的信号都可能导致此情况。常见的场景包括:
- 调试器(GDB):当你在调试程序时,调试器会向你的进程发送信号(如
SIGSTOP
,SIGINT
)来中断它的执行,以便查看状态、设置断点等。 - 程序日志管理:很多程序会监听
SIGHUP
信号,当收到这个信号时,重新打开日志文件(log rotation
)。 - 优雅退出:程序通常会捕获
SIGTERM
或SIGINT
(Ctrl+C)信号,在这些信号的处理函数中设置退出标志,让主循环优雅地退出。 - 定时器信号:例如使用
setitimer
或alarm
设置的定时器超时后,会发送SIGALRM
信号。 - 用户自定义信号:程序可能使用
SIGUSR1
或SIGUSR2
来做一些自定义操作,比如重新加载配置文件。 - 操作系统调度:虽然不常见,但在某些系统负载极高的极端情况下,也可能发生。
在你的代码场景中:线程正阻塞在 sem_timedwait(&lpa_http_sem, &abstime)
上,等待一个HTTP操作的完成信号(信号量变为可用)。在等待期间,如果上述任何一种信号到达并被处理,sem_timedwait
就会被打断并返回 -1
,同时设置 errno = EINTR
。
3. 为什么代码要用 do…while 循环?
这正是这段代码正确性和健壮性的体现!它的逻辑是:
- 尝试等待信号量,最多等到
abstime
这个绝对时间。 - 如果等待成功了(
ret == 0
),跳出循环,继续执行。 - 如果等待失败了(
ret < 0
),检查错误原因:- 如果是因为被信号中断(
errno == EINTR
):这不是真正的失败,而只是一次“打扰”。此时循环条件满足,程序会立刻再次调用sem_timedwait
继续等待,直到要么等到信号量,要么真正超时(errno == ETIMEDOUT
)或其他致命错误发生(如EINVAL
参数无效)。 - 如果是其他错误(如
ETIMEDOUT
):循环条件不满足,跳出循环,程序可以处理超时或其他错误。
- 如果是因为被信号中断(
如果没有这个循环,一次偶然的信号中断(比如程序员在终端按了下 Ctrl+C 又取消了,或者系统日志滚动)就会导致你的代码错误地认为信号量等待失败了,从而可能错误地进入超时处理逻辑,而实际上信号量可能很快就能用了。
总结与类比
你可以把 sem_timedwait
的等待过程类比为:
你正在电话客服,进入了等待队列(阻塞状态)。这时你的门铃响了(信号到达),你只好把电话放到一边去开门(处理信号)。处理完门口的事情后,你回来发现客服电话已经断了(系统调用返回 EINTR)。正确的做法是立刻重新拨打客服电话(循环中的再次调用),而不是就此放弃并认为客服不理你。
所以,在你的日志中看到 “pend http response sem timed wait -1 4”
(假设 4 是 EINTR
的值)的打印,是完全正常的行为。这表示等待过程被信号打断了,但程序已经按照设计成功地处理了这次中断,并继续忠实地等待HTTP响应。这恰恰证明了代码的健壮性。
更多推荐
所有评论(0)