xref: /linux-6.15/io_uring/timeout.c (revision 4248fd6f)
159915143SJens Axboe // SPDX-License-Identifier: GPL-2.0
259915143SJens Axboe #include <linux/kernel.h>
359915143SJens Axboe #include <linux/errno.h>
459915143SJens Axboe #include <linux/file.h>
559915143SJens Axboe #include <linux/io_uring.h>
659915143SJens Axboe 
759915143SJens Axboe #include <trace/events/io_uring.h>
859915143SJens Axboe 
959915143SJens Axboe #include <uapi/linux/io_uring.h>
1059915143SJens Axboe 
1159915143SJens Axboe #include "io_uring.h"
1259915143SJens Axboe #include "refs.h"
137aaff708SJens Axboe #include "cancel.h"
1459915143SJens Axboe #include "timeout.h"
1559915143SJens Axboe 
1659915143SJens Axboe struct io_timeout {
1759915143SJens Axboe 	struct file			*file;
1859915143SJens Axboe 	u32				off;
1959915143SJens Axboe 	u32				target_seq;
20ea97f6c8SDavid Wei 	u32				repeats;
2159915143SJens Axboe 	struct list_head		list;
2259915143SJens Axboe 	/* head of the link, used by linked timeouts only */
2359915143SJens Axboe 	struct io_kiocb			*head;
2459915143SJens Axboe 	/* for linked completions */
2559915143SJens Axboe 	struct io_kiocb			*prev;
2659915143SJens Axboe };
2759915143SJens Axboe 
2859915143SJens Axboe struct io_timeout_rem {
2959915143SJens Axboe 	struct file			*file;
3059915143SJens Axboe 	u64				addr;
3159915143SJens Axboe 
3259915143SJens Axboe 	/* timeout update */
3359915143SJens Axboe 	struct timespec64		ts;
3459915143SJens Axboe 	u32				flags;
3559915143SJens Axboe 	bool				ltimeout;
3659915143SJens Axboe };
3759915143SJens Axboe 
io_is_timeout_noseq(struct io_kiocb * req)3859915143SJens Axboe static inline bool io_is_timeout_noseq(struct io_kiocb *req)
3959915143SJens Axboe {
40f2ccb5aeSStefan Metzmacher 	struct io_timeout *timeout = io_kiocb_to_cmd(req, struct io_timeout);
41ea97f6c8SDavid Wei 	struct io_timeout_data *data = req->async_data;
4259915143SJens Axboe 
43ea97f6c8SDavid Wei 	return !timeout->off || data->flags & IORING_TIMEOUT_MULTISHOT;
4459915143SJens Axboe }
4559915143SJens Axboe 
io_put_req(struct io_kiocb * req)4659915143SJens Axboe static inline void io_put_req(struct io_kiocb *req)
4759915143SJens Axboe {
4859915143SJens Axboe 	if (req_ref_put_and_test(req)) {
4959915143SJens Axboe 		io_queue_next(req);
5059915143SJens Axboe 		io_free_req(req);
5159915143SJens Axboe 	}
5259915143SJens Axboe }
5359915143SJens Axboe 
io_timeout_finish(struct io_timeout * timeout,struct io_timeout_data * data)54ea97f6c8SDavid Wei static inline bool io_timeout_finish(struct io_timeout *timeout,
55ea97f6c8SDavid Wei 				     struct io_timeout_data *data)
56ea97f6c8SDavid Wei {
57ea97f6c8SDavid Wei 	if (!(data->flags & IORING_TIMEOUT_MULTISHOT))
58ea97f6c8SDavid Wei 		return true;
59ea97f6c8SDavid Wei 
60ea97f6c8SDavid Wei 	if (!timeout->off || (timeout->repeats && --timeout->repeats))
61ea97f6c8SDavid Wei 		return false;
62ea97f6c8SDavid Wei 
63ea97f6c8SDavid Wei 	return true;
64ea97f6c8SDavid Wei }
65ea97f6c8SDavid Wei 
66ea97f6c8SDavid Wei static enum hrtimer_restart io_timeout_fn(struct hrtimer *timer);
67ea97f6c8SDavid Wei 
io_timeout_complete(struct io_kiocb * req,io_tw_token_t tw)68ea97f6c8SDavid Wei static void io_timeout_complete(struct io_kiocb *req, io_tw_token_t tw)
69ea97f6c8SDavid Wei {
70ea97f6c8SDavid Wei 	struct io_timeout *timeout = io_kiocb_to_cmd(req, struct io_timeout);
71ea97f6c8SDavid Wei 	struct io_timeout_data *data = req->async_data;
72ea97f6c8SDavid Wei 	struct io_ring_ctx *ctx = req->ctx;
73ea97f6c8SDavid Wei 
74ea97f6c8SDavid Wei 	if (!io_timeout_finish(timeout, data)) {
75e5c12945SPavel Begunkov 		if (io_req_post_cqe(req, -ETIME, IORING_CQE_F_MORE)) {
76ea97f6c8SDavid Wei 			/* re-arm timer */
77020b40f3SJens Axboe 			raw_spin_lock_irq(&ctx->timeout_lock);
78ea97f6c8SDavid Wei 			list_add(&timeout->list, ctx->timeout_list.prev);
79ea97f6c8SDavid Wei 			hrtimer_start(&data->timer, timespec64_to_ktime(data->ts), data->mode);
80020b40f3SJens Axboe 			raw_spin_unlock_irq(&ctx->timeout_lock);
81ea97f6c8SDavid Wei 			return;
82ea97f6c8SDavid Wei 		}
83ea97f6c8SDavid Wei 	}
84ea97f6c8SDavid Wei 
85ea97f6c8SDavid Wei 	io_req_task_complete(req, tw);
86ea97f6c8SDavid Wei }
87ea97f6c8SDavid Wei 
io_flush_killed_timeouts(struct list_head * list,int err)88a9c83a0aSJens Axboe static __cold bool io_flush_killed_timeouts(struct list_head *list, int err)
89a9c83a0aSJens Axboe {
90a9c83a0aSJens Axboe 	if (list_empty(list))
91a9c83a0aSJens Axboe 		return false;
92a9c83a0aSJens Axboe 
93a9c83a0aSJens Axboe 	while (!list_empty(list)) {
94a9c83a0aSJens Axboe 		struct io_timeout *timeout;
95a9c83a0aSJens Axboe 		struct io_kiocb *req;
96a9c83a0aSJens Axboe 
97a9c83a0aSJens Axboe 		timeout = list_first_entry(list, struct io_timeout, list);
98a9c83a0aSJens Axboe 		list_del_init(&timeout->list);
99a9c83a0aSJens Axboe 		req = cmd_to_io_kiocb(timeout);
100a9c83a0aSJens Axboe 		if (err)
101a9c83a0aSJens Axboe 			req_set_fail(req);
102a9c83a0aSJens Axboe 		io_req_queue_tw_complete(req, err);
103a9c83a0aSJens Axboe 	}
104a9c83a0aSJens Axboe 
105a9c83a0aSJens Axboe 	return true;
106a9c83a0aSJens Axboe }
107a9c83a0aSJens Axboe 
io_kill_timeout(struct io_kiocb * req,struct list_head * list)108a9c83a0aSJens Axboe static void io_kill_timeout(struct io_kiocb *req, struct list_head *list)
10959915143SJens Axboe 	__must_hold(&req->ctx->timeout_lock)
11059915143SJens Axboe {
11159915143SJens Axboe 	struct io_timeout_data *io = req->async_data;
11259915143SJens Axboe 
11359915143SJens Axboe 	if (hrtimer_try_to_cancel(&io->timer) != -1) {
114f2ccb5aeSStefan Metzmacher 		struct io_timeout *timeout = io_kiocb_to_cmd(req, struct io_timeout);
11559915143SJens Axboe 
11659915143SJens Axboe 		atomic_set(&req->ctx->cq_timeouts,
11759915143SJens Axboe 			atomic_read(&req->ctx->cq_timeouts) + 1);
118a9c83a0aSJens Axboe 		list_move_tail(&timeout->list, list);
11959915143SJens Axboe 	}
12059915143SJens Axboe }
12159915143SJens Axboe 
io_flush_timeouts(struct io_ring_ctx * ctx)12259915143SJens Axboe __cold void io_flush_timeouts(struct io_ring_ctx *ctx)
12359915143SJens Axboe {
12459915143SJens Axboe 	struct io_timeout *timeout, *tmp;
125a9c83a0aSJens Axboe 	LIST_HEAD(list);
126a9c83a0aSJens Axboe 	u32 seq;
12759915143SJens Axboe 
128020b40f3SJens Axboe 	raw_spin_lock_irq(&ctx->timeout_lock);
129ea011ee1SPavel Begunkov 	seq = ctx->cached_cq_tail - atomic_read(&ctx->cq_timeouts);
130ea011ee1SPavel Begunkov 
13159915143SJens Axboe 	list_for_each_entry_safe(timeout, tmp, &ctx->timeout_list, list) {
13259915143SJens Axboe 		struct io_kiocb *req = cmd_to_io_kiocb(timeout);
13359915143SJens Axboe 		u32 events_needed, events_got;
13459915143SJens Axboe 
13559915143SJens Axboe 		if (io_is_timeout_noseq(req))
13659915143SJens Axboe 			break;
13759915143SJens Axboe 
13859915143SJens Axboe 		/*
13959915143SJens Axboe 		 * Since seq can easily wrap around over time, subtract
14059915143SJens Axboe 		 * the last seq at which timeouts were flushed before comparing.
14159915143SJens Axboe 		 * Assuming not more than 2^31-1 events have happened since,
14259915143SJens Axboe 		 * these subtractions won't have wrapped, so we can check if
14359915143SJens Axboe 		 * target is in [last_seq, current_seq] by comparing the two.
14459915143SJens Axboe 		 */
14559915143SJens Axboe 		events_needed = timeout->target_seq - ctx->cq_last_tm_flush;
14659915143SJens Axboe 		events_got = seq - ctx->cq_last_tm_flush;
14759915143SJens Axboe 		if (events_got < events_needed)
14859915143SJens Axboe 			break;
14959915143SJens Axboe 
150a9c83a0aSJens Axboe 		io_kill_timeout(req, &list);
15159915143SJens Axboe 	}
15259915143SJens Axboe 	ctx->cq_last_tm_flush = seq;
153020b40f3SJens Axboe 	raw_spin_unlock_irq(&ctx->timeout_lock);
154a9c83a0aSJens Axboe 	io_flush_killed_timeouts(&list, 0);
15559915143SJens Axboe }
15659915143SJens Axboe 
io_req_tw_fail_links(struct io_kiocb * link,io_tw_token_t tw)157a282967cSPavel Begunkov static void io_req_tw_fail_links(struct io_kiocb *link, io_tw_token_t tw)
15859915143SJens Axboe {
159a282967cSPavel Begunkov 	io_tw_lock(link->ctx, tw);
16059915143SJens Axboe 	while (link) {
16137c7bd31SPavel Begunkov 		struct io_kiocb *nxt = link->link;
16259915143SJens Axboe 		long res = -ECANCELED;
16359915143SJens Axboe 
16459915143SJens Axboe 		if (link->flags & REQ_F_FAIL)
16559915143SJens Axboe 			res = link->cqe.res;
16659915143SJens Axboe 		link->link = NULL;
16737c7bd31SPavel Begunkov 		io_req_set_res(link, res, 0);
168a282967cSPavel Begunkov 		io_req_task_complete(link, tw);
16937c7bd31SPavel Begunkov 		link = nxt;
17037c7bd31SPavel Begunkov 	}
17137c7bd31SPavel Begunkov }
17259915143SJens Axboe 
io_fail_links(struct io_kiocb * req)17337c7bd31SPavel Begunkov static void io_fail_links(struct io_kiocb *req)
17437c7bd31SPavel Begunkov 	__must_hold(&req->ctx->completion_lock)
17537c7bd31SPavel Begunkov {
17637c7bd31SPavel Begunkov 	struct io_kiocb *link = req->link;
17737c7bd31SPavel Begunkov 	bool ignore_cqes = req->flags & REQ_F_SKIP_LINK_CQES;
17859915143SJens Axboe 
17937c7bd31SPavel Begunkov 	if (!link)
18037c7bd31SPavel Begunkov 		return;
18137c7bd31SPavel Begunkov 
18237c7bd31SPavel Begunkov 	while (link) {
18359915143SJens Axboe 		if (ignore_cqes)
18459915143SJens Axboe 			link->flags |= REQ_F_CQE_SKIP;
18559915143SJens Axboe 		else
18659915143SJens Axboe 			link->flags &= ~REQ_F_CQE_SKIP;
18737c7bd31SPavel Begunkov 		trace_io_uring_fail_link(req, link);
18837c7bd31SPavel Begunkov 		link = link->link;
18959915143SJens Axboe 	}
19037c7bd31SPavel Begunkov 
19137c7bd31SPavel Begunkov 	link = req->link;
19237c7bd31SPavel Begunkov 	link->io_task_work.func = io_req_tw_fail_links;
19337c7bd31SPavel Begunkov 	io_req_task_work_add(link);
19437c7bd31SPavel Begunkov 	req->link = NULL;
19559915143SJens Axboe }
19659915143SJens Axboe 
io_remove_next_linked(struct io_kiocb * req)19759915143SJens Axboe static inline void io_remove_next_linked(struct io_kiocb *req)
19859915143SJens Axboe {
19959915143SJens Axboe 	struct io_kiocb *nxt = req->link;
20059915143SJens Axboe 
20159915143SJens Axboe 	req->link = nxt->link;
20259915143SJens Axboe 	nxt->link = NULL;
20359915143SJens Axboe }
20459915143SJens Axboe 
io_disarm_next(struct io_kiocb * req)205c0dc995eSPavel Begunkov void io_disarm_next(struct io_kiocb *req)
20659915143SJens Axboe 	__must_hold(&req->ctx->completion_lock)
20759915143SJens Axboe {
20859915143SJens Axboe 	struct io_kiocb *link = NULL;
20959915143SJens Axboe 
21059915143SJens Axboe 	if (req->flags & REQ_F_ARM_LTIMEOUT) {
21159915143SJens Axboe 		link = req->link;
21259915143SJens Axboe 		req->flags &= ~REQ_F_ARM_LTIMEOUT;
21359915143SJens Axboe 		if (link && link->opcode == IORING_OP_LINK_TIMEOUT) {
21459915143SJens Axboe 			io_remove_next_linked(req);
215833b5dffSPavel Begunkov 			io_req_queue_tw_complete(link, -ECANCELED);
21659915143SJens Axboe 		}
21759915143SJens Axboe 	} else if (req->flags & REQ_F_LINK_TIMEOUT) {
21859915143SJens Axboe 		struct io_ring_ctx *ctx = req->ctx;
21959915143SJens Axboe 
220020b40f3SJens Axboe 		raw_spin_lock_irq(&ctx->timeout_lock);
22159915143SJens Axboe 		link = io_disarm_linked_timeout(req);
222020b40f3SJens Axboe 		raw_spin_unlock_irq(&ctx->timeout_lock);
223c0dc995eSPavel Begunkov 		if (link)
224833b5dffSPavel Begunkov 			io_req_queue_tw_complete(link, -ECANCELED);
22559915143SJens Axboe 	}
22659915143SJens Axboe 	if (unlikely((req->flags & REQ_F_FAIL) &&
227c0dc995eSPavel Begunkov 		     !(req->flags & REQ_F_HARDLINK)))
22859915143SJens Axboe 		io_fail_links(req);
22959915143SJens Axboe }
23059915143SJens Axboe 
__io_disarm_linked_timeout(struct io_kiocb * req,struct io_kiocb * link)23159915143SJens Axboe struct io_kiocb *__io_disarm_linked_timeout(struct io_kiocb *req,
23259915143SJens Axboe 					    struct io_kiocb *link)
23359915143SJens Axboe 	__must_hold(&req->ctx->completion_lock)
23459915143SJens Axboe 	__must_hold(&req->ctx->timeout_lock)
23559915143SJens Axboe {
23659915143SJens Axboe 	struct io_timeout_data *io = link->async_data;
237f2ccb5aeSStefan Metzmacher 	struct io_timeout *timeout = io_kiocb_to_cmd(link, struct io_timeout);
23859915143SJens Axboe 
23959915143SJens Axboe 	io_remove_next_linked(req);
24059915143SJens Axboe 	timeout->head = NULL;
24159915143SJens Axboe 	if (hrtimer_try_to_cancel(&io->timer) != -1) {
24259915143SJens Axboe 		list_del(&timeout->list);
24359915143SJens Axboe 		return link;
24459915143SJens Axboe 	}
24559915143SJens Axboe 
24659915143SJens Axboe 	return NULL;
24759915143SJens Axboe }
24859915143SJens Axboe 
io_timeout_fn(struct hrtimer * timer)24959915143SJens Axboe static enum hrtimer_restart io_timeout_fn(struct hrtimer *timer)
25059915143SJens Axboe {
25159915143SJens Axboe 	struct io_timeout_data *data = container_of(timer,
25259915143SJens Axboe 						struct io_timeout_data, timer);
25359915143SJens Axboe 	struct io_kiocb *req = data->req;
254f2ccb5aeSStefan Metzmacher 	struct io_timeout *timeout = io_kiocb_to_cmd(req, struct io_timeout);
25559915143SJens Axboe 	struct io_ring_ctx *ctx = req->ctx;
25659915143SJens Axboe 	unsigned long flags;
25759915143SJens Axboe 
258020b40f3SJens Axboe 	raw_spin_lock_irqsave(&ctx->timeout_lock, flags);
25959915143SJens Axboe 	list_del_init(&timeout->list);
26059915143SJens Axboe 	atomic_set(&req->ctx->cq_timeouts,
26159915143SJens Axboe 		atomic_read(&req->ctx->cq_timeouts) + 1);
262020b40f3SJens Axboe 	raw_spin_unlock_irqrestore(&ctx->timeout_lock, flags);
26359915143SJens Axboe 
26459915143SJens Axboe 	if (!(data->flags & IORING_TIMEOUT_ETIME_SUCCESS))
26559915143SJens Axboe 		req_set_fail(req);
26659915143SJens Axboe 
26759915143SJens Axboe 	io_req_set_res(req, -ETIME, 0);
268ea97f6c8SDavid Wei 	req->io_task_work.func = io_timeout_complete;
26959915143SJens Axboe 	io_req_task_work_add(req);
27059915143SJens Axboe 	return HRTIMER_NORESTART;
27159915143SJens Axboe }
27259915143SJens Axboe 
io_timeout_extract(struct io_ring_ctx * ctx,struct io_cancel_data * cd)27359915143SJens Axboe static struct io_kiocb *io_timeout_extract(struct io_ring_ctx *ctx,
27459915143SJens Axboe 					   struct io_cancel_data *cd)
27559915143SJens Axboe 	__must_hold(&ctx->timeout_lock)
27659915143SJens Axboe {
27759915143SJens Axboe 	struct io_timeout *timeout;
27859915143SJens Axboe 	struct io_timeout_data *io;
27959915143SJens Axboe 	struct io_kiocb *req = NULL;
28059915143SJens Axboe 
28159915143SJens Axboe 	list_for_each_entry(timeout, &ctx->timeout_list, list) {
28259915143SJens Axboe 		struct io_kiocb *tmp = cmd_to_io_kiocb(timeout);
28359915143SJens Axboe 
284a30badf6SJens Axboe 		if (io_cancel_req_match(tmp, cd)) {
28559915143SJens Axboe 			req = tmp;
28659915143SJens Axboe 			break;
28759915143SJens Axboe 		}
288a30badf6SJens Axboe 	}
28959915143SJens Axboe 	if (!req)
29059915143SJens Axboe 		return ERR_PTR(-ENOENT);
29159915143SJens Axboe 
29259915143SJens Axboe 	io = req->async_data;
29359915143SJens Axboe 	if (hrtimer_try_to_cancel(&io->timer) == -1)
29459915143SJens Axboe 		return ERR_PTR(-EALREADY);
295f2ccb5aeSStefan Metzmacher 	timeout = io_kiocb_to_cmd(req, struct io_timeout);
29659915143SJens Axboe 	list_del_init(&timeout->list);
29759915143SJens Axboe 	return req;
29859915143SJens Axboe }
29959915143SJens Axboe 
io_timeout_cancel(struct io_ring_ctx * ctx,struct io_cancel_data * cd)30059915143SJens Axboe int io_timeout_cancel(struct io_ring_ctx *ctx, struct io_cancel_data *cd)
30159915143SJens Axboe 	__must_hold(&ctx->completion_lock)
30259915143SJens Axboe {
30359915143SJens Axboe 	struct io_kiocb *req;
30459915143SJens Axboe 
305020b40f3SJens Axboe 	raw_spin_lock_irq(&ctx->timeout_lock);
30659915143SJens Axboe 	req = io_timeout_extract(ctx, cd);
307020b40f3SJens Axboe 	raw_spin_unlock_irq(&ctx->timeout_lock);
30859915143SJens Axboe 
30959915143SJens Axboe 	if (IS_ERR(req))
31059915143SJens Axboe 		return PTR_ERR(req);
31159915143SJens Axboe 	io_req_task_queue_fail(req, -ECANCELED);
31259915143SJens Axboe 	return 0;
31359915143SJens Axboe }
31459915143SJens Axboe 
io_req_task_link_timeout(struct io_kiocb * req,io_tw_token_t tw)315a282967cSPavel Begunkov static void io_req_task_link_timeout(struct io_kiocb *req, io_tw_token_t tw)
31659915143SJens Axboe {
317f2ccb5aeSStefan Metzmacher 	struct io_timeout *timeout = io_kiocb_to_cmd(req, struct io_timeout);
31859915143SJens Axboe 	struct io_kiocb *prev = timeout->prev;
319b6f58a3fSJens Axboe 	int ret;
32059915143SJens Axboe 
32159915143SJens Axboe 	if (prev) {
322b6f58a3fSJens Axboe 		if (!io_should_terminate_tw()) {
32359915143SJens Axboe 			struct io_cancel_data cd = {
32459915143SJens Axboe 				.ctx		= req->ctx,
32559915143SJens Axboe 				.data		= prev->cqe.user_data,
32659915143SJens Axboe 			};
32759915143SJens Axboe 
328b6f58a3fSJens Axboe 			ret = io_try_cancel(req->tctx, &cd, 0);
329b6f58a3fSJens Axboe 		} else {
330b6f58a3fSJens Axboe 			ret = -ECANCELED;
33159915143SJens Axboe 		}
33259915143SJens Axboe 		io_req_set_res(req, ret ?: -ETIME, 0);
333a282967cSPavel Begunkov 		io_req_task_complete(req, tw);
33459915143SJens Axboe 		io_put_req(prev);
33559915143SJens Axboe 	} else {
33659915143SJens Axboe 		io_req_set_res(req, -ETIME, 0);
337a282967cSPavel Begunkov 		io_req_task_complete(req, tw);
33859915143SJens Axboe 	}
33959915143SJens Axboe }
34059915143SJens Axboe 
io_link_timeout_fn(struct hrtimer * timer)34159915143SJens Axboe static enum hrtimer_restart io_link_timeout_fn(struct hrtimer *timer)
34259915143SJens Axboe {
34359915143SJens Axboe 	struct io_timeout_data *data = container_of(timer,
34459915143SJens Axboe 						struct io_timeout_data, timer);
34559915143SJens Axboe 	struct io_kiocb *prev, *req = data->req;
346f2ccb5aeSStefan Metzmacher 	struct io_timeout *timeout = io_kiocb_to_cmd(req, struct io_timeout);
34759915143SJens Axboe 	struct io_ring_ctx *ctx = req->ctx;
34859915143SJens Axboe 	unsigned long flags;
34959915143SJens Axboe 
350020b40f3SJens Axboe 	raw_spin_lock_irqsave(&ctx->timeout_lock, flags);
35159915143SJens Axboe 	prev = timeout->head;
35259915143SJens Axboe 	timeout->head = NULL;
35359915143SJens Axboe 
35459915143SJens Axboe 	/*
35559915143SJens Axboe 	 * We don't expect the list to be empty, that will only happen if we
35659915143SJens Axboe 	 * race with the completion of the linked work.
35759915143SJens Axboe 	 */
35859915143SJens Axboe 	if (prev) {
35959915143SJens Axboe 		io_remove_next_linked(prev);
36059915143SJens Axboe 		if (!req_ref_inc_not_zero(prev))
36159915143SJens Axboe 			prev = NULL;
36259915143SJens Axboe 	}
36359915143SJens Axboe 	list_del(&timeout->list);
36459915143SJens Axboe 	timeout->prev = prev;
365020b40f3SJens Axboe 	raw_spin_unlock_irqrestore(&ctx->timeout_lock, flags);
36659915143SJens Axboe 
36759915143SJens Axboe 	req->io_task_work.func = io_req_task_link_timeout;
36859915143SJens Axboe 	io_req_task_work_add(req);
36959915143SJens Axboe 	return HRTIMER_NORESTART;
37059915143SJens Axboe }
37159915143SJens Axboe 
io_timeout_get_clock(struct io_timeout_data * data)37259915143SJens Axboe static clockid_t io_timeout_get_clock(struct io_timeout_data *data)
37359915143SJens Axboe {
37459915143SJens Axboe 	switch (data->flags & IORING_TIMEOUT_CLOCK_MASK) {
37559915143SJens Axboe 	case IORING_TIMEOUT_BOOTTIME:
37659915143SJens Axboe 		return CLOCK_BOOTTIME;
37759915143SJens Axboe 	case IORING_TIMEOUT_REALTIME:
37859915143SJens Axboe 		return CLOCK_REALTIME;
37959915143SJens Axboe 	default:
38059915143SJens Axboe 		/* can't happen, vetted at prep time */
38159915143SJens Axboe 		WARN_ON_ONCE(1);
38259915143SJens Axboe 		fallthrough;
38359915143SJens Axboe 	case 0:
38459915143SJens Axboe 		return CLOCK_MONOTONIC;
38559915143SJens Axboe 	}
38659915143SJens Axboe }
38759915143SJens Axboe 
io_linked_timeout_update(struct io_ring_ctx * ctx,__u64 user_data,struct timespec64 * ts,enum hrtimer_mode mode)38859915143SJens Axboe static int io_linked_timeout_update(struct io_ring_ctx *ctx, __u64 user_data,
38959915143SJens Axboe 				    struct timespec64 *ts, enum hrtimer_mode mode)
39059915143SJens Axboe 	__must_hold(&ctx->timeout_lock)
39159915143SJens Axboe {
39259915143SJens Axboe 	struct io_timeout_data *io;
39359915143SJens Axboe 	struct io_timeout *timeout;
39459915143SJens Axboe 	struct io_kiocb *req = NULL;
39559915143SJens Axboe 
39659915143SJens Axboe 	list_for_each_entry(timeout, &ctx->ltimeout_list, list) {
39759915143SJens Axboe 		struct io_kiocb *tmp = cmd_to_io_kiocb(timeout);
39859915143SJens Axboe 
39959915143SJens Axboe 		if (user_data == tmp->cqe.user_data) {
40059915143SJens Axboe 			req = tmp;
40159915143SJens Axboe 			break;
40259915143SJens Axboe 		}
40359915143SJens Axboe 	}
40459915143SJens Axboe 	if (!req)
40559915143SJens Axboe 		return -ENOENT;
40659915143SJens Axboe 
40759915143SJens Axboe 	io = req->async_data;
40859915143SJens Axboe 	if (hrtimer_try_to_cancel(&io->timer) == -1)
40959915143SJens Axboe 		return -EALREADY;
410*4248fd6fSNam Cao 	hrtimer_setup(&io->timer, io_link_timeout_fn, io_timeout_get_clock(io), mode);
41159915143SJens Axboe 	hrtimer_start(&io->timer, timespec64_to_ktime(*ts), mode);
41259915143SJens Axboe 	return 0;
41359915143SJens Axboe }
41459915143SJens Axboe 
io_timeout_update(struct io_ring_ctx * ctx,__u64 user_data,struct timespec64 * ts,enum hrtimer_mode mode)41559915143SJens Axboe static int io_timeout_update(struct io_ring_ctx *ctx, __u64 user_data,
41659915143SJens Axboe 			     struct timespec64 *ts, enum hrtimer_mode mode)
41759915143SJens Axboe 	__must_hold(&ctx->timeout_lock)
41859915143SJens Axboe {
419faa9c0eeSJens Axboe 	struct io_cancel_data cd = { .ctx = ctx, .data = user_data, };
42059915143SJens Axboe 	struct io_kiocb *req = io_timeout_extract(ctx, &cd);
421f2ccb5aeSStefan Metzmacher 	struct io_timeout *timeout = io_kiocb_to_cmd(req, struct io_timeout);
42259915143SJens Axboe 	struct io_timeout_data *data;
42359915143SJens Axboe 
42459915143SJens Axboe 	if (IS_ERR(req))
42559915143SJens Axboe 		return PTR_ERR(req);
42659915143SJens Axboe 
42759915143SJens Axboe 	timeout->off = 0; /* noseq */
42859915143SJens Axboe 	data = req->async_data;
429c83c8462SPavel Begunkov 	data->ts = *ts;
430c83c8462SPavel Begunkov 
43159915143SJens Axboe 	list_add_tail(&timeout->list, &ctx->timeout_list);
432*4248fd6fSNam Cao 	hrtimer_setup(&data->timer, io_timeout_fn, io_timeout_get_clock(data), mode);
433c83c8462SPavel Begunkov 	hrtimer_start(&data->timer, timespec64_to_ktime(data->ts), mode);
43459915143SJens Axboe 	return 0;
43559915143SJens Axboe }
43659915143SJens Axboe 
io_timeout_remove_prep(struct io_kiocb * req,const struct io_uring_sqe * sqe)43759915143SJens Axboe int io_timeout_remove_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)
43859915143SJens Axboe {
439f2ccb5aeSStefan Metzmacher 	struct io_timeout_rem *tr = io_kiocb_to_cmd(req, struct io_timeout_rem);
44059915143SJens Axboe 
44159915143SJens Axboe 	if (unlikely(req->flags & (REQ_F_FIXED_FILE | REQ_F_BUFFER_SELECT)))
44259915143SJens Axboe 		return -EINVAL;
44359915143SJens Axboe 	if (sqe->buf_index || sqe->len || sqe->splice_fd_in)
44459915143SJens Axboe 		return -EINVAL;
44559915143SJens Axboe 
44659915143SJens Axboe 	tr->ltimeout = false;
44759915143SJens Axboe 	tr->addr = READ_ONCE(sqe->addr);
44859915143SJens Axboe 	tr->flags = READ_ONCE(sqe->timeout_flags);
44959915143SJens Axboe 	if (tr->flags & IORING_TIMEOUT_UPDATE_MASK) {
45059915143SJens Axboe 		if (hweight32(tr->flags & IORING_TIMEOUT_CLOCK_MASK) > 1)
45159915143SJens Axboe 			return -EINVAL;
45259915143SJens Axboe 		if (tr->flags & IORING_LINK_TIMEOUT_UPDATE)
45359915143SJens Axboe 			tr->ltimeout = true;
45459915143SJens Axboe 		if (tr->flags & ~(IORING_TIMEOUT_UPDATE_MASK|IORING_TIMEOUT_ABS))
45559915143SJens Axboe 			return -EINVAL;
45659915143SJens Axboe 		if (get_timespec64(&tr->ts, u64_to_user_ptr(sqe->addr2)))
45759915143SJens Axboe 			return -EFAULT;
45859915143SJens Axboe 		if (tr->ts.tv_sec < 0 || tr->ts.tv_nsec < 0)
45959915143SJens Axboe 			return -EINVAL;
46059915143SJens Axboe 	} else if (tr->flags) {
46159915143SJens Axboe 		/* timeout removal doesn't support flags */
46259915143SJens Axboe 		return -EINVAL;
46359915143SJens Axboe 	}
46459915143SJens Axboe 
46559915143SJens Axboe 	return 0;
46659915143SJens Axboe }
46759915143SJens Axboe 
io_translate_timeout_mode(unsigned int flags)46859915143SJens Axboe static inline enum hrtimer_mode io_translate_timeout_mode(unsigned int flags)
46959915143SJens Axboe {
47059915143SJens Axboe 	return (flags & IORING_TIMEOUT_ABS) ? HRTIMER_MODE_ABS
47159915143SJens Axboe 					    : HRTIMER_MODE_REL;
47259915143SJens Axboe }
47359915143SJens Axboe 
47459915143SJens Axboe /*
47559915143SJens Axboe  * Remove or update an existing timeout command
47659915143SJens Axboe  */
io_timeout_remove(struct io_kiocb * req,unsigned int issue_flags)47759915143SJens Axboe int io_timeout_remove(struct io_kiocb *req, unsigned int issue_flags)
47859915143SJens Axboe {
479f2ccb5aeSStefan Metzmacher 	struct io_timeout_rem *tr = io_kiocb_to_cmd(req, struct io_timeout_rem);
48059915143SJens Axboe 	struct io_ring_ctx *ctx = req->ctx;
48159915143SJens Axboe 	int ret;
48259915143SJens Axboe 
48359915143SJens Axboe 	if (!(tr->flags & IORING_TIMEOUT_UPDATE)) {
484faa9c0eeSJens Axboe 		struct io_cancel_data cd = { .ctx = ctx, .data = tr->addr, };
48559915143SJens Axboe 
48659915143SJens Axboe 		spin_lock(&ctx->completion_lock);
48759915143SJens Axboe 		ret = io_timeout_cancel(ctx, &cd);
48859915143SJens Axboe 		spin_unlock(&ctx->completion_lock);
48959915143SJens Axboe 	} else {
49059915143SJens Axboe 		enum hrtimer_mode mode = io_translate_timeout_mode(tr->flags);
49159915143SJens Axboe 
492020b40f3SJens Axboe 		raw_spin_lock_irq(&ctx->timeout_lock);
49359915143SJens Axboe 		if (tr->ltimeout)
49459915143SJens Axboe 			ret = io_linked_timeout_update(ctx, tr->addr, &tr->ts, mode);
49559915143SJens Axboe 		else
49659915143SJens Axboe 			ret = io_timeout_update(ctx, tr->addr, &tr->ts, mode);
497020b40f3SJens Axboe 		raw_spin_unlock_irq(&ctx->timeout_lock);
49859915143SJens Axboe 	}
49959915143SJens Axboe 
50059915143SJens Axboe 	if (ret < 0)
50159915143SJens Axboe 		req_set_fail(req);
50259915143SJens Axboe 	io_req_set_res(req, ret, 0);
50359915143SJens Axboe 	return IOU_OK;
50459915143SJens Axboe }
50559915143SJens Axboe 
__io_timeout_prep(struct io_kiocb * req,const struct io_uring_sqe * sqe,bool is_timeout_link)50659915143SJens Axboe static int __io_timeout_prep(struct io_kiocb *req,
50759915143SJens Axboe 			     const struct io_uring_sqe *sqe,
50859915143SJens Axboe 			     bool is_timeout_link)
50959915143SJens Axboe {
510f2ccb5aeSStefan Metzmacher 	struct io_timeout *timeout = io_kiocb_to_cmd(req, struct io_timeout);
51159915143SJens Axboe 	struct io_timeout_data *data;
51259915143SJens Axboe 	unsigned flags;
51359915143SJens Axboe 	u32 off = READ_ONCE(sqe->off);
51459915143SJens Axboe 
51559915143SJens Axboe 	if (sqe->buf_index || sqe->len != 1 || sqe->splice_fd_in)
51659915143SJens Axboe 		return -EINVAL;
51759915143SJens Axboe 	if (off && is_timeout_link)
51859915143SJens Axboe 		return -EINVAL;
51959915143SJens Axboe 	flags = READ_ONCE(sqe->timeout_flags);
52059915143SJens Axboe 	if (flags & ~(IORING_TIMEOUT_ABS | IORING_TIMEOUT_CLOCK_MASK |
521ea97f6c8SDavid Wei 		      IORING_TIMEOUT_ETIME_SUCCESS |
522ea97f6c8SDavid Wei 		      IORING_TIMEOUT_MULTISHOT))
52359915143SJens Axboe 		return -EINVAL;
52459915143SJens Axboe 	/* more than one clock specified is invalid, obviously */
52559915143SJens Axboe 	if (hweight32(flags & IORING_TIMEOUT_CLOCK_MASK) > 1)
52659915143SJens Axboe 		return -EINVAL;
527ea97f6c8SDavid Wei 	/* multishot requests only make sense with rel values */
528ea97f6c8SDavid Wei 	if (!(~flags & (IORING_TIMEOUT_MULTISHOT | IORING_TIMEOUT_ABS)))
529ea97f6c8SDavid Wei 		return -EINVAL;
53059915143SJens Axboe 
53159915143SJens Axboe 	INIT_LIST_HEAD(&timeout->list);
53259915143SJens Axboe 	timeout->off = off;
53359915143SJens Axboe 	if (unlikely(off && !req->ctx->off_timeout_used))
53459915143SJens Axboe 		req->ctx->off_timeout_used = true;
535ea97f6c8SDavid Wei 	/*
536ea97f6c8SDavid Wei 	 * for multishot reqs w/ fixed nr of repeats, repeats tracks the
537ea97f6c8SDavid Wei 	 * remaining nr
538ea97f6c8SDavid Wei 	 */
539ea97f6c8SDavid Wei 	timeout->repeats = 0;
540ea97f6c8SDavid Wei 	if ((flags & IORING_TIMEOUT_MULTISHOT) && off > 0)
541ea97f6c8SDavid Wei 		timeout->repeats = off;
54259915143SJens Axboe 
54359915143SJens Axboe 	if (WARN_ON_ONCE(req_has_async_data(req)))
54459915143SJens Axboe 		return -EFAULT;
545ff74954eSJens Axboe 	data = io_uring_alloc_async_data(NULL, req);
546ef623a64SGabriel Krisman Bertazi 	if (!data)
54759915143SJens Axboe 		return -ENOMEM;
54859915143SJens Axboe 	data->req = req;
54959915143SJens Axboe 	data->flags = flags;
55059915143SJens Axboe 
55159915143SJens Axboe 	if (get_timespec64(&data->ts, u64_to_user_ptr(sqe->addr)))
55259915143SJens Axboe 		return -EFAULT;
55359915143SJens Axboe 
55459915143SJens Axboe 	if (data->ts.tv_sec < 0 || data->ts.tv_nsec < 0)
55559915143SJens Axboe 		return -EINVAL;
55659915143SJens Axboe 
55759915143SJens Axboe 	data->mode = io_translate_timeout_mode(flags);
55859915143SJens Axboe 
55959915143SJens Axboe 	if (is_timeout_link) {
56059915143SJens Axboe 		struct io_submit_link *link = &req->ctx->submit_state.link;
56159915143SJens Axboe 
56259915143SJens Axboe 		if (!link->head)
56359915143SJens Axboe 			return -EINVAL;
56459915143SJens Axboe 		if (link->last->opcode == IORING_OP_LINK_TIMEOUT)
56559915143SJens Axboe 			return -EINVAL;
56659915143SJens Axboe 		timeout->head = link->last;
56759915143SJens Axboe 		link->last->flags |= REQ_F_ARM_LTIMEOUT;
568*4248fd6fSNam Cao 		hrtimer_setup(&data->timer, io_link_timeout_fn, io_timeout_get_clock(data),
569*4248fd6fSNam Cao 			      data->mode);
570*4248fd6fSNam Cao 	} else {
571*4248fd6fSNam Cao 		hrtimer_setup(&data->timer, io_timeout_fn, io_timeout_get_clock(data), data->mode);
57259915143SJens Axboe 	}
57359915143SJens Axboe 	return 0;
57459915143SJens Axboe }
57559915143SJens Axboe 
io_timeout_prep(struct io_kiocb * req,const struct io_uring_sqe * sqe)57659915143SJens Axboe int io_timeout_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)
57759915143SJens Axboe {
57859915143SJens Axboe 	return __io_timeout_prep(req, sqe, false);
57959915143SJens Axboe }
58059915143SJens Axboe 
io_link_timeout_prep(struct io_kiocb * req,const struct io_uring_sqe * sqe)58159915143SJens Axboe int io_link_timeout_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)
58259915143SJens Axboe {
58359915143SJens Axboe 	return __io_timeout_prep(req, sqe, true);
58459915143SJens Axboe }
58559915143SJens Axboe 
io_timeout(struct io_kiocb * req,unsigned int issue_flags)58659915143SJens Axboe int io_timeout(struct io_kiocb *req, unsigned int issue_flags)
58759915143SJens Axboe {
588f2ccb5aeSStefan Metzmacher 	struct io_timeout *timeout = io_kiocb_to_cmd(req, struct io_timeout);
58959915143SJens Axboe 	struct io_ring_ctx *ctx = req->ctx;
59059915143SJens Axboe 	struct io_timeout_data *data = req->async_data;
59159915143SJens Axboe 	struct list_head *entry;
59259915143SJens Axboe 	u32 tail, off = timeout->off;
59359915143SJens Axboe 
594020b40f3SJens Axboe 	raw_spin_lock_irq(&ctx->timeout_lock);
59559915143SJens Axboe 
59659915143SJens Axboe 	/*
59759915143SJens Axboe 	 * sqe->off holds how many events that need to occur for this
59859915143SJens Axboe 	 * timeout event to be satisfied. If it isn't set, then this is
59959915143SJens Axboe 	 * a pure timeout request, sequence isn't used.
60059915143SJens Axboe 	 */
60159915143SJens Axboe 	if (io_is_timeout_noseq(req)) {
60259915143SJens Axboe 		entry = ctx->timeout_list.prev;
60359915143SJens Axboe 		goto add;
60459915143SJens Axboe 	}
60559915143SJens Axboe 
6065498bf28SPavel Begunkov 	tail = data_race(ctx->cached_cq_tail) - atomic_read(&ctx->cq_timeouts);
60759915143SJens Axboe 	timeout->target_seq = tail + off;
60859915143SJens Axboe 
60959915143SJens Axboe 	/* Update the last seq here in case io_flush_timeouts() hasn't.
61059915143SJens Axboe 	 * This is safe because ->completion_lock is held, and submissions
61159915143SJens Axboe 	 * and completions are never mixed in the same ->completion_lock section.
61259915143SJens Axboe 	 */
61359915143SJens Axboe 	ctx->cq_last_tm_flush = tail;
61459915143SJens Axboe 
61559915143SJens Axboe 	/*
61659915143SJens Axboe 	 * Insertion sort, ensuring the first entry in the list is always
61759915143SJens Axboe 	 * the one we need first.
61859915143SJens Axboe 	 */
61959915143SJens Axboe 	list_for_each_prev(entry, &ctx->timeout_list) {
62059915143SJens Axboe 		struct io_timeout *nextt = list_entry(entry, struct io_timeout, list);
62159915143SJens Axboe 		struct io_kiocb *nxt = cmd_to_io_kiocb(nextt);
62259915143SJens Axboe 
62359915143SJens Axboe 		if (io_is_timeout_noseq(nxt))
62459915143SJens Axboe 			continue;
62559915143SJens Axboe 		/* nxt.seq is behind @tail, otherwise would've been completed */
62659915143SJens Axboe 		if (off >= nextt->target_seq - tail)
62759915143SJens Axboe 			break;
62859915143SJens Axboe 	}
62959915143SJens Axboe add:
63059915143SJens Axboe 	list_add(&timeout->list, entry);
63159915143SJens Axboe 	hrtimer_start(&data->timer, timespec64_to_ktime(data->ts), data->mode);
632020b40f3SJens Axboe 	raw_spin_unlock_irq(&ctx->timeout_lock);
63359915143SJens Axboe 	return IOU_ISSUE_SKIP_COMPLETE;
63459915143SJens Axboe }
63559915143SJens Axboe 
io_queue_linked_timeout(struct io_kiocb * req)63659915143SJens Axboe void io_queue_linked_timeout(struct io_kiocb *req)
63759915143SJens Axboe {
638f2ccb5aeSStefan Metzmacher 	struct io_timeout *timeout = io_kiocb_to_cmd(req, struct io_timeout);
63959915143SJens Axboe 	struct io_ring_ctx *ctx = req->ctx;
64059915143SJens Axboe 
641020b40f3SJens Axboe 	raw_spin_lock_irq(&ctx->timeout_lock);
64259915143SJens Axboe 	/*
64359915143SJens Axboe 	 * If the back reference is NULL, then our linked request finished
64459915143SJens Axboe 	 * before we got a chance to setup the timer
64559915143SJens Axboe 	 */
64659915143SJens Axboe 	if (timeout->head) {
64759915143SJens Axboe 		struct io_timeout_data *data = req->async_data;
64859915143SJens Axboe 
64959915143SJens Axboe 		hrtimer_start(&data->timer, timespec64_to_ktime(data->ts),
65059915143SJens Axboe 				data->mode);
65159915143SJens Axboe 		list_add_tail(&timeout->list, &ctx->ltimeout_list);
65259915143SJens Axboe 	}
653020b40f3SJens Axboe 	raw_spin_unlock_irq(&ctx->timeout_lock);
65459915143SJens Axboe 	/* drop submission reference */
65559915143SJens Axboe 	io_put_req(req);
65659915143SJens Axboe }
65759915143SJens Axboe 
io_match_task(struct io_kiocb * head,struct io_uring_task * tctx,bool cancel_all)658f03baeceSJens Axboe static bool io_match_task(struct io_kiocb *head, struct io_uring_task *tctx,
65959915143SJens Axboe 			  bool cancel_all)
660e142e9cdSPavel Begunkov 	__must_hold(&head->ctx->timeout_lock)
66159915143SJens Axboe {
66259915143SJens Axboe 	struct io_kiocb *req;
66359915143SJens Axboe 
664b6f58a3fSJens Axboe 	if (tctx && head->tctx != tctx)
66559915143SJens Axboe 		return false;
66659915143SJens Axboe 	if (cancel_all)
66759915143SJens Axboe 		return true;
66859915143SJens Axboe 
66959915143SJens Axboe 	io_for_each_link(req, head) {
67059915143SJens Axboe 		if (req->flags & REQ_F_INFLIGHT)
67159915143SJens Axboe 			return true;
67259915143SJens Axboe 	}
67359915143SJens Axboe 	return false;
67459915143SJens Axboe }
67559915143SJens Axboe 
67659915143SJens Axboe /* Returns true if we found and killed one or more timeouts */
io_kill_timeouts(struct io_ring_ctx * ctx,struct io_uring_task * tctx,bool cancel_all)677f03baeceSJens Axboe __cold bool io_kill_timeouts(struct io_ring_ctx *ctx, struct io_uring_task *tctx,
67859915143SJens Axboe 			     bool cancel_all)
67959915143SJens Axboe {
68059915143SJens Axboe 	struct io_timeout *timeout, *tmp;
681a9c83a0aSJens Axboe 	LIST_HEAD(list);
68259915143SJens Axboe 
6836971253fSPavel Begunkov 	/*
6846971253fSPavel Begunkov 	 * completion_lock is needed for io_match_task(). Take it before
6856971253fSPavel Begunkov 	 * timeout_lockfirst to keep locking ordering.
6866971253fSPavel Begunkov 	 */
6876971253fSPavel Begunkov 	spin_lock(&ctx->completion_lock);
688020b40f3SJens Axboe 	raw_spin_lock_irq(&ctx->timeout_lock);
68959915143SJens Axboe 	list_for_each_entry_safe(timeout, tmp, &ctx->timeout_list, list) {
69059915143SJens Axboe 		struct io_kiocb *req = cmd_to_io_kiocb(timeout);
69159915143SJens Axboe 
692a9c83a0aSJens Axboe 		if (io_match_task(req, tctx, cancel_all))
693a9c83a0aSJens Axboe 			io_kill_timeout(req, &list);
69459915143SJens Axboe 	}
695020b40f3SJens Axboe 	raw_spin_unlock_irq(&ctx->timeout_lock);
6966971253fSPavel Begunkov 	spin_unlock(&ctx->completion_lock);
697a9c83a0aSJens Axboe 
698a9c83a0aSJens Axboe 	return io_flush_killed_timeouts(&list, -ECANCELED);
69959915143SJens Axboe }
700