xref: /freebsd-12.1/sys/dev/netmap/netmap_kloop.c (revision 639c36f0)
1b321acabSVincenzo Maffione /*
2b321acabSVincenzo Maffione  * Copyright (C) 2016-2018 Vincenzo Maffione
3b321acabSVincenzo Maffione  * Copyright (C) 2015 Stefano Garzarella
4b321acabSVincenzo Maffione  * All rights reserved.
5b321acabSVincenzo Maffione  *
6b321acabSVincenzo Maffione  * Redistribution and use in source and binary forms, with or without
7b321acabSVincenzo Maffione  * modification, are permitted provided that the following conditions
8b321acabSVincenzo Maffione  * are met:
9b321acabSVincenzo Maffione  *   1. Redistributions of source code must retain the above copyright
10b321acabSVincenzo Maffione  *      notice, this list of conditions and the following disclaimer.
11b321acabSVincenzo Maffione  *   2. Redistributions in binary form must reproduce the above copyright
12b321acabSVincenzo Maffione  *      notice, this list of conditions and the following disclaimer in the
13b321acabSVincenzo Maffione  *      documentation and/or other materials provided with the distribution.
14b321acabSVincenzo Maffione  *
15b321acabSVincenzo Maffione  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
16b321acabSVincenzo Maffione  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
17b321acabSVincenzo Maffione  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
18b321acabSVincenzo Maffione  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
19b321acabSVincenzo Maffione  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
20b321acabSVincenzo Maffione  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
21b321acabSVincenzo Maffione  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
22b321acabSVincenzo Maffione  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
23b321acabSVincenzo Maffione  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
24b321acabSVincenzo Maffione  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
25b321acabSVincenzo Maffione  * SUCH DAMAGE.
26b321acabSVincenzo Maffione  *
27b321acabSVincenzo Maffione  * $FreeBSD$
28b321acabSVincenzo Maffione  */
29b321acabSVincenzo Maffione 
30b321acabSVincenzo Maffione /*
31b321acabSVincenzo Maffione  * common headers
32b321acabSVincenzo Maffione  */
33b321acabSVincenzo Maffione #if defined(__FreeBSD__)
34b321acabSVincenzo Maffione #include <sys/cdefs.h>
35b321acabSVincenzo Maffione #include <sys/param.h>
36b321acabSVincenzo Maffione #include <sys/kernel.h>
37b321acabSVincenzo Maffione #include <sys/types.h>
38b321acabSVincenzo Maffione #include <sys/selinfo.h>
39b321acabSVincenzo Maffione #include <sys/socket.h>
40b321acabSVincenzo Maffione #include <net/if.h>
41b321acabSVincenzo Maffione #include <net/if_var.h>
42b321acabSVincenzo Maffione #include <machine/bus.h>
43b321acabSVincenzo Maffione 
44b321acabSVincenzo Maffione #define usleep_range(_1, _2) \
45b321acabSVincenzo Maffione         pause_sbt("sync-kloop-sleep", SBT_1US * _1, SBT_1US * 1, C_ABSOLUTE)
46b321acabSVincenzo Maffione 
47b321acabSVincenzo Maffione #elif defined(linux)
48b321acabSVincenzo Maffione #include <bsd_glue.h>
49b321acabSVincenzo Maffione #include <linux/file.h>
50b321acabSVincenzo Maffione #include <linux/eventfd.h>
51b321acabSVincenzo Maffione #endif
52b321acabSVincenzo Maffione 
53b321acabSVincenzo Maffione #include <net/netmap.h>
54b321acabSVincenzo Maffione #include <dev/netmap/netmap_kern.h>
55b321acabSVincenzo Maffione #include <net/netmap_virt.h>
56b321acabSVincenzo Maffione #include <dev/netmap/netmap_mem2.h>
57b321acabSVincenzo Maffione 
58b321acabSVincenzo Maffione /* Support for eventfd-based notifications. */
59b321acabSVincenzo Maffione #if defined(linux)
60b321acabSVincenzo Maffione #define SYNC_KLOOP_POLL
61b321acabSVincenzo Maffione #endif
62b321acabSVincenzo Maffione 
63b321acabSVincenzo Maffione /* Write kring pointers (hwcur, hwtail) to the CSB.
64b321acabSVincenzo Maffione  * This routine is coupled with ptnetmap_guest_read_kring_csb(). */
65b321acabSVincenzo Maffione static inline void
66b321acabSVincenzo Maffione sync_kloop_kernel_write(struct nm_csb_ktoa __user *ptr, uint32_t hwcur,
67b321acabSVincenzo Maffione 			   uint32_t hwtail)
68b321acabSVincenzo Maffione {
69b321acabSVincenzo Maffione 	/*
70b321acabSVincenzo Maffione 	 * The same scheme used in ptnetmap_guest_write_kring_csb() applies here.
71b321acabSVincenzo Maffione 	 * We allow the application to read a value of hwcur more recent than the value
72b321acabSVincenzo Maffione 	 * of hwtail, since this would anyway result in a consistent view of the
73b321acabSVincenzo Maffione 	 * ring state (and hwcur can never wraparound hwtail, since hwcur must be
74b321acabSVincenzo Maffione 	 * behind head).
75b321acabSVincenzo Maffione 	 *
76b321acabSVincenzo Maffione 	 * The following memory barrier scheme is used to make this happen:
77b321acabSVincenzo Maffione 	 *
78b321acabSVincenzo Maffione 	 *          Application          Kernel
79b321acabSVincenzo Maffione 	 *
80b321acabSVincenzo Maffione 	 *          STORE(hwcur)         LOAD(hwtail)
81b321acabSVincenzo Maffione 	 *          mb() <-------------> mb()
82b321acabSVincenzo Maffione 	 *          STORE(hwtail)        LOAD(hwcur)
83b321acabSVincenzo Maffione 	 */
84b321acabSVincenzo Maffione 	CSB_WRITE(ptr, hwcur, hwcur);
85b321acabSVincenzo Maffione 	nm_stst_barrier();
86b321acabSVincenzo Maffione 	CSB_WRITE(ptr, hwtail, hwtail);
87b321acabSVincenzo Maffione }
88b321acabSVincenzo Maffione 
89b321acabSVincenzo Maffione /* Read kring pointers (head, cur, sync_flags) from the CSB.
90b321acabSVincenzo Maffione  * This routine is coupled with ptnetmap_guest_write_kring_csb(). */
91b321acabSVincenzo Maffione static inline void
92b321acabSVincenzo Maffione sync_kloop_kernel_read(struct nm_csb_atok __user *ptr,
93b321acabSVincenzo Maffione 			  struct netmap_ring *shadow_ring,
94b321acabSVincenzo Maffione 			  uint32_t num_slots)
95b321acabSVincenzo Maffione {
96b321acabSVincenzo Maffione 	/*
97b321acabSVincenzo Maffione 	 * We place a memory barrier to make sure that the update of head never
98b321acabSVincenzo Maffione 	 * overtakes the update of cur.
99b321acabSVincenzo Maffione 	 * (see explanation in ptnetmap_guest_write_kring_csb).
100b321acabSVincenzo Maffione 	 */
101b321acabSVincenzo Maffione 	CSB_READ(ptr, head, shadow_ring->head);
102b321acabSVincenzo Maffione 	nm_stst_barrier();
103b321acabSVincenzo Maffione 	CSB_READ(ptr, cur, shadow_ring->cur);
104b321acabSVincenzo Maffione 	CSB_READ(ptr, sync_flags, shadow_ring->flags);
105b321acabSVincenzo Maffione }
106b321acabSVincenzo Maffione 
107b321acabSVincenzo Maffione /* Enable or disable application --> kernel kicks. */
108b321acabSVincenzo Maffione static inline void
109b321acabSVincenzo Maffione csb_ktoa_kick_enable(struct nm_csb_ktoa __user *csb_ktoa, uint32_t val)
110b321acabSVincenzo Maffione {
111b321acabSVincenzo Maffione 	CSB_WRITE(csb_ktoa, kern_need_kick, val);
112b321acabSVincenzo Maffione }
113b321acabSVincenzo Maffione 
114*639c36f0SVincenzo Maffione #ifdef SYNC_KLOOP_POLL
115b321acabSVincenzo Maffione /* Are application interrupt enabled or disabled? */
116b321acabSVincenzo Maffione static inline uint32_t
117b321acabSVincenzo Maffione csb_atok_intr_enabled(struct nm_csb_atok __user *csb_atok)
118b321acabSVincenzo Maffione {
119b321acabSVincenzo Maffione 	uint32_t v;
120b321acabSVincenzo Maffione 
121b321acabSVincenzo Maffione 	CSB_READ(csb_atok, appl_need_kick, v);
122b321acabSVincenzo Maffione 
123b321acabSVincenzo Maffione 	return v;
124b321acabSVincenzo Maffione }
125*639c36f0SVincenzo Maffione #endif  /* SYNC_KLOOP_POLL */
126b321acabSVincenzo Maffione 
127b321acabSVincenzo Maffione static inline void
128b321acabSVincenzo Maffione sync_kloop_kring_dump(const char *title, const struct netmap_kring *kring)
129b321acabSVincenzo Maffione {
130b321acabSVincenzo Maffione 	nm_prinf("%s - name: %s hwcur: %d hwtail: %d "
131b321acabSVincenzo Maffione 		"rhead: %d rcur: %d rtail: %d",
132b321acabSVincenzo Maffione 		title, kring->name, kring->nr_hwcur, kring->nr_hwtail,
133b321acabSVincenzo Maffione 		kring->rhead, kring->rcur, kring->rtail);
134b321acabSVincenzo Maffione }
135b321acabSVincenzo Maffione 
136b321acabSVincenzo Maffione struct sync_kloop_ring_args {
137b321acabSVincenzo Maffione 	struct netmap_kring *kring;
138b321acabSVincenzo Maffione 	struct nm_csb_atok *csb_atok;
139b321acabSVincenzo Maffione 	struct nm_csb_ktoa *csb_ktoa;
140b321acabSVincenzo Maffione #ifdef SYNC_KLOOP_POLL
141b321acabSVincenzo Maffione 	struct eventfd_ctx *irq_ctx;
142b321acabSVincenzo Maffione #endif /* SYNC_KLOOP_POLL */
143b321acabSVincenzo Maffione };
144b321acabSVincenzo Maffione 
145b321acabSVincenzo Maffione static void
146b321acabSVincenzo Maffione netmap_sync_kloop_tx_ring(const struct sync_kloop_ring_args *a)
147b321acabSVincenzo Maffione {
148b321acabSVincenzo Maffione 	struct netmap_kring *kring = a->kring;
149b321acabSVincenzo Maffione 	struct nm_csb_atok *csb_atok = a->csb_atok;
150b321acabSVincenzo Maffione 	struct nm_csb_ktoa *csb_ktoa = a->csb_ktoa;
151b321acabSVincenzo Maffione 	struct netmap_ring shadow_ring; /* shadow copy of the netmap_ring */
152b321acabSVincenzo Maffione 	bool more_txspace = false;
153b321acabSVincenzo Maffione 	uint32_t num_slots;
154b321acabSVincenzo Maffione 	int batch;
155b321acabSVincenzo Maffione 
156b321acabSVincenzo Maffione 	num_slots = kring->nkr_num_slots;
157b321acabSVincenzo Maffione 
158b321acabSVincenzo Maffione 	/* Disable application --> kernel notifications. */
159b321acabSVincenzo Maffione 	csb_ktoa_kick_enable(csb_ktoa, 0);
160b321acabSVincenzo Maffione 	/* Copy the application kring pointers from the CSB */
161b321acabSVincenzo Maffione 	sync_kloop_kernel_read(csb_atok, &shadow_ring, num_slots);
162b321acabSVincenzo Maffione 
163b321acabSVincenzo Maffione 	for (;;) {
164b321acabSVincenzo Maffione 		batch = shadow_ring.head - kring->nr_hwcur;
165b321acabSVincenzo Maffione 		if (batch < 0)
166b321acabSVincenzo Maffione 			batch += num_slots;
167b321acabSVincenzo Maffione 
168b321acabSVincenzo Maffione #ifdef PTN_TX_BATCH_LIM
169b321acabSVincenzo Maffione 		if (batch > PTN_TX_BATCH_LIM(num_slots)) {
170b321acabSVincenzo Maffione 			/* If application moves ahead too fast, let's cut the move so
171b321acabSVincenzo Maffione 			 * that we don't exceed our batch limit. */
172b321acabSVincenzo Maffione 			uint32_t head_lim = kring->nr_hwcur + PTN_TX_BATCH_LIM(num_slots);
173b321acabSVincenzo Maffione 
174b321acabSVincenzo Maffione 			if (head_lim >= num_slots)
175b321acabSVincenzo Maffione 				head_lim -= num_slots;
176b321acabSVincenzo Maffione 			nm_prdis(1, "batch: %d head: %d head_lim: %d", batch, shadow_ring.head,
177b321acabSVincenzo Maffione 					head_lim);
178b321acabSVincenzo Maffione 			shadow_ring.head = head_lim;
179b321acabSVincenzo Maffione 			batch = PTN_TX_BATCH_LIM(num_slots);
180b321acabSVincenzo Maffione 		}
181b321acabSVincenzo Maffione #endif /* PTN_TX_BATCH_LIM */
182b321acabSVincenzo Maffione 
183b321acabSVincenzo Maffione 		if (nm_kr_txspace(kring) <= (num_slots >> 1)) {
184b321acabSVincenzo Maffione 			shadow_ring.flags |= NAF_FORCE_RECLAIM;
185b321acabSVincenzo Maffione 		}
186b321acabSVincenzo Maffione 
187b321acabSVincenzo Maffione 		/* Netmap prologue */
188b321acabSVincenzo Maffione 		shadow_ring.tail = kring->rtail;
189b321acabSVincenzo Maffione 		if (unlikely(nm_txsync_prologue(kring, &shadow_ring) >= num_slots)) {
190b321acabSVincenzo Maffione 			/* Reinit ring and enable notifications. */
191b321acabSVincenzo Maffione 			netmap_ring_reinit(kring);
192b321acabSVincenzo Maffione 			csb_ktoa_kick_enable(csb_ktoa, 1);
193b321acabSVincenzo Maffione 			break;
194b321acabSVincenzo Maffione 		}
195b321acabSVincenzo Maffione 
196b321acabSVincenzo Maffione 		if (unlikely(netmap_debug & NM_DEBUG_TXSYNC)) {
197b321acabSVincenzo Maffione 			sync_kloop_kring_dump("pre txsync", kring);
198b321acabSVincenzo Maffione 		}
199b321acabSVincenzo Maffione 
200b321acabSVincenzo Maffione 		if (unlikely(kring->nm_sync(kring, shadow_ring.flags))) {
201b321acabSVincenzo Maffione 			/* Reenable notifications. */
202b321acabSVincenzo Maffione 			csb_ktoa_kick_enable(csb_ktoa, 1);
203b321acabSVincenzo Maffione 			nm_prerr("txsync() failed");
204b321acabSVincenzo Maffione 			break;
205b321acabSVincenzo Maffione 		}
206b321acabSVincenzo Maffione 
207b321acabSVincenzo Maffione 		/*
208b321acabSVincenzo Maffione 		 * Finalize
209b321acabSVincenzo Maffione 		 * Copy kernel hwcur and hwtail into the CSB for the application sync(), and
210b321acabSVincenzo Maffione 		 * do the nm_sync_finalize.
211b321acabSVincenzo Maffione 		 */
212b321acabSVincenzo Maffione 		sync_kloop_kernel_write(csb_ktoa, kring->nr_hwcur,
213b321acabSVincenzo Maffione 				kring->nr_hwtail);
214b321acabSVincenzo Maffione 		if (kring->rtail != kring->nr_hwtail) {
215b321acabSVincenzo Maffione 			/* Some more room available in the parent adapter. */
216b321acabSVincenzo Maffione 			kring->rtail = kring->nr_hwtail;
217b321acabSVincenzo Maffione 			more_txspace = true;
218b321acabSVincenzo Maffione 		}
219b321acabSVincenzo Maffione 
220b321acabSVincenzo Maffione 		if (unlikely(netmap_debug & NM_DEBUG_TXSYNC)) {
221b321acabSVincenzo Maffione 			sync_kloop_kring_dump("post txsync", kring);
222b321acabSVincenzo Maffione 		}
223b321acabSVincenzo Maffione 
224b321acabSVincenzo Maffione 		/* Interrupt the application if needed. */
225b321acabSVincenzo Maffione #ifdef SYNC_KLOOP_POLL
226b321acabSVincenzo Maffione 		if (a->irq_ctx && more_txspace && csb_atok_intr_enabled(csb_atok)) {
227b321acabSVincenzo Maffione 			/* Disable application kick to avoid sending unnecessary kicks */
228b321acabSVincenzo Maffione 			eventfd_signal(a->irq_ctx, 1);
229b321acabSVincenzo Maffione 			more_txspace = false;
230b321acabSVincenzo Maffione 		}
231b321acabSVincenzo Maffione #endif /* SYNC_KLOOP_POLL */
232b321acabSVincenzo Maffione 
233b321acabSVincenzo Maffione 		/* Read CSB to see if there is more work to do. */
234b321acabSVincenzo Maffione 		sync_kloop_kernel_read(csb_atok, &shadow_ring, num_slots);
235b321acabSVincenzo Maffione 		if (shadow_ring.head == kring->rhead) {
236b321acabSVincenzo Maffione 			/*
237b321acabSVincenzo Maffione 			 * No more packets to transmit. We enable notifications and
238b321acabSVincenzo Maffione 			 * go to sleep, waiting for a kick from the application when new
239b321acabSVincenzo Maffione 			 * new slots are ready for transmission.
240b321acabSVincenzo Maffione 			 */
241b321acabSVincenzo Maffione 			/* Reenable notifications. */
242b321acabSVincenzo Maffione 			csb_ktoa_kick_enable(csb_ktoa, 1);
243b321acabSVincenzo Maffione 			/* Doublecheck. */
244b321acabSVincenzo Maffione 			sync_kloop_kernel_read(csb_atok, &shadow_ring, num_slots);
245b321acabSVincenzo Maffione 			if (shadow_ring.head != kring->rhead) {
246b321acabSVincenzo Maffione 				/* We won the race condition, there are more packets to
247b321acabSVincenzo Maffione 				 * transmit. Disable notifications and do another cycle */
248b321acabSVincenzo Maffione 				csb_ktoa_kick_enable(csb_ktoa, 0);
249b321acabSVincenzo Maffione 				continue;
250b321acabSVincenzo Maffione 			}
251b321acabSVincenzo Maffione 			break;
252b321acabSVincenzo Maffione 		}
253b321acabSVincenzo Maffione 
254b321acabSVincenzo Maffione 		if (nm_kr_txempty(kring)) {
255b321acabSVincenzo Maffione 			/* No more available TX slots. We stop waiting for a notification
256b321acabSVincenzo Maffione 			 * from the backend (netmap_tx_irq). */
257b321acabSVincenzo Maffione 			nm_prdis(1, "TX ring");
258b321acabSVincenzo Maffione 			break;
259b321acabSVincenzo Maffione 		}
260b321acabSVincenzo Maffione 	}
261b321acabSVincenzo Maffione 
262b321acabSVincenzo Maffione #ifdef SYNC_KLOOP_POLL
263b321acabSVincenzo Maffione 	if (a->irq_ctx && more_txspace && csb_atok_intr_enabled(csb_atok)) {
264b321acabSVincenzo Maffione 		eventfd_signal(a->irq_ctx, 1);
265b321acabSVincenzo Maffione 	}
266b321acabSVincenzo Maffione #endif /* SYNC_KLOOP_POLL */
267b321acabSVincenzo Maffione }
268b321acabSVincenzo Maffione 
269b321acabSVincenzo Maffione /* RX cycle without receive any packets */
270b321acabSVincenzo Maffione #define SYNC_LOOP_RX_DRY_CYCLES_MAX	2
271b321acabSVincenzo Maffione 
272b321acabSVincenzo Maffione static inline int
273b321acabSVincenzo Maffione sync_kloop_norxslots(struct netmap_kring *kring, uint32_t g_head)
274b321acabSVincenzo Maffione {
275b321acabSVincenzo Maffione 	return (NM_ACCESS_ONCE(kring->nr_hwtail) == nm_prev(g_head,
276b321acabSVincenzo Maffione 				kring->nkr_num_slots - 1));
277b321acabSVincenzo Maffione }
278b321acabSVincenzo Maffione 
279b321acabSVincenzo Maffione static void
280b321acabSVincenzo Maffione netmap_sync_kloop_rx_ring(const struct sync_kloop_ring_args *a)
281b321acabSVincenzo Maffione {
282b321acabSVincenzo Maffione 
283b321acabSVincenzo Maffione 	struct netmap_kring *kring = a->kring;
284b321acabSVincenzo Maffione 	struct nm_csb_atok *csb_atok = a->csb_atok;
285b321acabSVincenzo Maffione 	struct nm_csb_ktoa *csb_ktoa = a->csb_ktoa;
286b321acabSVincenzo Maffione 	struct netmap_ring shadow_ring; /* shadow copy of the netmap_ring */
287b321acabSVincenzo Maffione 	int dry_cycles = 0;
288b321acabSVincenzo Maffione 	bool some_recvd = false;
289b321acabSVincenzo Maffione 	uint32_t num_slots;
290b321acabSVincenzo Maffione 
291b321acabSVincenzo Maffione 	num_slots = kring->nkr_num_slots;
292b321acabSVincenzo Maffione 
293b321acabSVincenzo Maffione 	/* Get RX csb_atok and csb_ktoa pointers from the CSB. */
294b321acabSVincenzo Maffione 	num_slots = kring->nkr_num_slots;
295b321acabSVincenzo Maffione 
296b321acabSVincenzo Maffione 	/* Disable notifications. */
297b321acabSVincenzo Maffione 	csb_ktoa_kick_enable(csb_ktoa, 0);
298b321acabSVincenzo Maffione 	/* Copy the application kring pointers from the CSB */
299b321acabSVincenzo Maffione 	sync_kloop_kernel_read(csb_atok, &shadow_ring, num_slots);
300b321acabSVincenzo Maffione 
301b321acabSVincenzo Maffione 	for (;;) {
302b321acabSVincenzo Maffione 		uint32_t hwtail;
303b321acabSVincenzo Maffione 
304b321acabSVincenzo Maffione 		/* Netmap prologue */
305b321acabSVincenzo Maffione 		shadow_ring.tail = kring->rtail;
306b321acabSVincenzo Maffione 		if (unlikely(nm_rxsync_prologue(kring, &shadow_ring) >= num_slots)) {
307b321acabSVincenzo Maffione 			/* Reinit ring and enable notifications. */
308b321acabSVincenzo Maffione 			netmap_ring_reinit(kring);
309b321acabSVincenzo Maffione 			csb_ktoa_kick_enable(csb_ktoa, 1);
310b321acabSVincenzo Maffione 			break;
311b321acabSVincenzo Maffione 		}
312b321acabSVincenzo Maffione 
313b321acabSVincenzo Maffione 		if (unlikely(netmap_debug & NM_DEBUG_RXSYNC)) {
314b321acabSVincenzo Maffione 			sync_kloop_kring_dump("pre rxsync", kring);
315b321acabSVincenzo Maffione 		}
316b321acabSVincenzo Maffione 
317b321acabSVincenzo Maffione 		if (unlikely(kring->nm_sync(kring, shadow_ring.flags))) {
318b321acabSVincenzo Maffione 			/* Reenable notifications. */
319b321acabSVincenzo Maffione 			csb_ktoa_kick_enable(csb_ktoa, 1);
320b321acabSVincenzo Maffione 			nm_prerr("rxsync() failed");
321b321acabSVincenzo Maffione 			break;
322b321acabSVincenzo Maffione 		}
323b321acabSVincenzo Maffione 
324b321acabSVincenzo Maffione 		/*
325b321acabSVincenzo Maffione 		 * Finalize
326b321acabSVincenzo Maffione 		 * Copy kernel hwcur and hwtail into the CSB for the application sync()
327b321acabSVincenzo Maffione 		 */
328b321acabSVincenzo Maffione 		hwtail = NM_ACCESS_ONCE(kring->nr_hwtail);
329b321acabSVincenzo Maffione 		sync_kloop_kernel_write(csb_ktoa, kring->nr_hwcur, hwtail);
330b321acabSVincenzo Maffione 		if (kring->rtail != hwtail) {
331b321acabSVincenzo Maffione 			kring->rtail = hwtail;
332b321acabSVincenzo Maffione 			some_recvd = true;
333b321acabSVincenzo Maffione 			dry_cycles = 0;
334b321acabSVincenzo Maffione 		} else {
335b321acabSVincenzo Maffione 			dry_cycles++;
336b321acabSVincenzo Maffione 		}
337b321acabSVincenzo Maffione 
338b321acabSVincenzo Maffione 		if (unlikely(netmap_debug & NM_DEBUG_RXSYNC)) {
339b321acabSVincenzo Maffione 			sync_kloop_kring_dump("post rxsync", kring);
340b321acabSVincenzo Maffione 		}
341b321acabSVincenzo Maffione 
342b321acabSVincenzo Maffione #ifdef SYNC_KLOOP_POLL
343b321acabSVincenzo Maffione 		/* Interrupt the application if needed. */
344b321acabSVincenzo Maffione 		if (a->irq_ctx && some_recvd && csb_atok_intr_enabled(csb_atok)) {
345b321acabSVincenzo Maffione 			/* Disable application kick to avoid sending unnecessary kicks */
346b321acabSVincenzo Maffione 			eventfd_signal(a->irq_ctx, 1);
347b321acabSVincenzo Maffione 			some_recvd = false;
348b321acabSVincenzo Maffione 		}
349b321acabSVincenzo Maffione #endif /* SYNC_KLOOP_POLL */
350b321acabSVincenzo Maffione 
351b321acabSVincenzo Maffione 		/* Read CSB to see if there is more work to do. */
352b321acabSVincenzo Maffione 		sync_kloop_kernel_read(csb_atok, &shadow_ring, num_slots);
353b321acabSVincenzo Maffione 		if (sync_kloop_norxslots(kring, shadow_ring.head)) {
354b321acabSVincenzo Maffione 			/*
355b321acabSVincenzo Maffione 			 * No more slots available for reception. We enable notification and
356b321acabSVincenzo Maffione 			 * go to sleep, waiting for a kick from the application when new receive
357b321acabSVincenzo Maffione 			 * slots are available.
358b321acabSVincenzo Maffione 			 */
359b321acabSVincenzo Maffione 			/* Reenable notifications. */
360b321acabSVincenzo Maffione 			csb_ktoa_kick_enable(csb_ktoa, 1);
361b321acabSVincenzo Maffione 			/* Doublecheck. */
362b321acabSVincenzo Maffione 			sync_kloop_kernel_read(csb_atok, &shadow_ring, num_slots);
363b321acabSVincenzo Maffione 			if (!sync_kloop_norxslots(kring, shadow_ring.head)) {
364b321acabSVincenzo Maffione 				/* We won the race condition, more slots are available. Disable
365b321acabSVincenzo Maffione 				 * notifications and do another cycle. */
366b321acabSVincenzo Maffione 				csb_ktoa_kick_enable(csb_ktoa, 0);
367b321acabSVincenzo Maffione 				continue;
368b321acabSVincenzo Maffione 			}
369b321acabSVincenzo Maffione 			break;
370b321acabSVincenzo Maffione 		}
371b321acabSVincenzo Maffione 
372b321acabSVincenzo Maffione 		hwtail = NM_ACCESS_ONCE(kring->nr_hwtail);
373b321acabSVincenzo Maffione 		if (unlikely(hwtail == kring->rhead ||
374b321acabSVincenzo Maffione 					dry_cycles >= SYNC_LOOP_RX_DRY_CYCLES_MAX)) {
375b321acabSVincenzo Maffione 			/* No more packets to be read from the backend. We stop and
376b321acabSVincenzo Maffione 			 * wait for a notification from the backend (netmap_rx_irq). */
377b321acabSVincenzo Maffione 			nm_prdis(1, "nr_hwtail: %d rhead: %d dry_cycles: %d",
378b321acabSVincenzo Maffione 					hwtail, kring->rhead, dry_cycles);
379b321acabSVincenzo Maffione 			break;
380b321acabSVincenzo Maffione 		}
381b321acabSVincenzo Maffione 	}
382b321acabSVincenzo Maffione 
383b321acabSVincenzo Maffione 	nm_kr_put(kring);
384b321acabSVincenzo Maffione 
385b321acabSVincenzo Maffione #ifdef SYNC_KLOOP_POLL
386b321acabSVincenzo Maffione 	/* Interrupt the application if needed. */
387b321acabSVincenzo Maffione 	if (a->irq_ctx && some_recvd && csb_atok_intr_enabled(csb_atok)) {
388b321acabSVincenzo Maffione 		eventfd_signal(a->irq_ctx, 1);
389b321acabSVincenzo Maffione 	}
390b321acabSVincenzo Maffione #endif /* SYNC_KLOOP_POLL */
391b321acabSVincenzo Maffione }
392b321acabSVincenzo Maffione 
393b321acabSVincenzo Maffione #ifdef SYNC_KLOOP_POLL
394b321acabSVincenzo Maffione struct sync_kloop_poll_entry {
395b321acabSVincenzo Maffione 	/* Support for receiving notifications from
396b321acabSVincenzo Maffione 	 * a netmap ring or from the application. */
397b321acabSVincenzo Maffione 	struct file *filp;
398b321acabSVincenzo Maffione 	wait_queue_t wait;
399b321acabSVincenzo Maffione 	wait_queue_head_t *wqh;
400b321acabSVincenzo Maffione 
401b321acabSVincenzo Maffione 	/* Support for sending notifications to the application. */
402b321acabSVincenzo Maffione 	struct eventfd_ctx *irq_ctx;
403b321acabSVincenzo Maffione 	struct file *irq_filp;
404b321acabSVincenzo Maffione };
405b321acabSVincenzo Maffione 
406b321acabSVincenzo Maffione struct sync_kloop_poll_ctx {
407b321acabSVincenzo Maffione 	poll_table wait_table;
408b321acabSVincenzo Maffione 	unsigned int next_entry;
409b321acabSVincenzo Maffione 	unsigned int num_entries;
410b321acabSVincenzo Maffione 	struct sync_kloop_poll_entry entries[0];
411b321acabSVincenzo Maffione };
412b321acabSVincenzo Maffione 
413b321acabSVincenzo Maffione static void
414b321acabSVincenzo Maffione sync_kloop_poll_table_queue_proc(struct file *file, wait_queue_head_t *wqh,
415b321acabSVincenzo Maffione 				poll_table *pt)
416b321acabSVincenzo Maffione {
417b321acabSVincenzo Maffione 	struct sync_kloop_poll_ctx *poll_ctx =
418b321acabSVincenzo Maffione 		container_of(pt, struct sync_kloop_poll_ctx, wait_table);
419b321acabSVincenzo Maffione 	struct sync_kloop_poll_entry *entry = poll_ctx->entries +
420b321acabSVincenzo Maffione 						poll_ctx->next_entry;
421b321acabSVincenzo Maffione 
422b321acabSVincenzo Maffione 	BUG_ON(poll_ctx->next_entry >= poll_ctx->num_entries);
423b321acabSVincenzo Maffione 	entry->wqh = wqh;
424b321acabSVincenzo Maffione 	entry->filp = file;
425b321acabSVincenzo Maffione 	/* Use the default wake up function. */
426b321acabSVincenzo Maffione 	init_waitqueue_entry(&entry->wait, current);
427b321acabSVincenzo Maffione 	add_wait_queue(wqh, &entry->wait);
428b321acabSVincenzo Maffione 	poll_ctx->next_entry++;
429b321acabSVincenzo Maffione }
430b321acabSVincenzo Maffione #endif  /* SYNC_KLOOP_POLL */
431b321acabSVincenzo Maffione 
432b321acabSVincenzo Maffione int
433b321acabSVincenzo Maffione netmap_sync_kloop(struct netmap_priv_d *priv, struct nmreq_header *hdr)
434b321acabSVincenzo Maffione {
435b321acabSVincenzo Maffione 	struct nmreq_sync_kloop_start *req =
436b321acabSVincenzo Maffione 		(struct nmreq_sync_kloop_start *)(uintptr_t)hdr->nr_body;
437b321acabSVincenzo Maffione 	struct nmreq_opt_sync_kloop_eventfds *eventfds_opt = NULL;
438b321acabSVincenzo Maffione #ifdef SYNC_KLOOP_POLL
439b321acabSVincenzo Maffione 	struct sync_kloop_poll_ctx *poll_ctx = NULL;
440b321acabSVincenzo Maffione #endif  /* SYNC_KLOOP_POLL */
441b321acabSVincenzo Maffione 	int num_rx_rings, num_tx_rings, num_rings;
442b321acabSVincenzo Maffione 	uint32_t sleep_us = req->sleep_us;
443b321acabSVincenzo Maffione 	struct nm_csb_atok* csb_atok_base;
444b321acabSVincenzo Maffione 	struct nm_csb_ktoa* csb_ktoa_base;
445b321acabSVincenzo Maffione 	struct netmap_adapter *na;
446b321acabSVincenzo Maffione 	struct nmreq_option *opt;
447b321acabSVincenzo Maffione 	int err = 0;
448b321acabSVincenzo Maffione 	int i;
449b321acabSVincenzo Maffione 
450b321acabSVincenzo Maffione 	if (sleep_us > 1000000) {
451b321acabSVincenzo Maffione 		/* We do not accept sleeping for more than a second. */
452b321acabSVincenzo Maffione 		return EINVAL;
453b321acabSVincenzo Maffione 	}
454b321acabSVincenzo Maffione 
455b321acabSVincenzo Maffione 	if (priv->np_nifp == NULL) {
456b321acabSVincenzo Maffione 		return ENXIO;
457b321acabSVincenzo Maffione 	}
458b321acabSVincenzo Maffione 	mb(); /* make sure following reads are not from cache */
459b321acabSVincenzo Maffione 
460b321acabSVincenzo Maffione 	na = priv->np_na;
461b321acabSVincenzo Maffione 	if (!nm_netmap_on(na)) {
462b321acabSVincenzo Maffione 		return ENXIO;
463b321acabSVincenzo Maffione 	}
464b321acabSVincenzo Maffione 
465b321acabSVincenzo Maffione 	NMG_LOCK();
466b321acabSVincenzo Maffione 	/* Make sure the application is working in CSB mode. */
467b321acabSVincenzo Maffione 	if (!priv->np_csb_atok_base || !priv->np_csb_ktoa_base) {
468b321acabSVincenzo Maffione 		NMG_UNLOCK();
469b321acabSVincenzo Maffione 		nm_prerr("sync-kloop on %s requires "
470b321acabSVincenzo Maffione 				"NETMAP_REQ_OPT_CSB option", na->name);
471b321acabSVincenzo Maffione 		return EINVAL;
472b321acabSVincenzo Maffione 	}
473b321acabSVincenzo Maffione 
474b321acabSVincenzo Maffione 	csb_atok_base = priv->np_csb_atok_base;
475b321acabSVincenzo Maffione 	csb_ktoa_base = priv->np_csb_ktoa_base;
476b321acabSVincenzo Maffione 
477b321acabSVincenzo Maffione 	/* Make sure that no kloop is currently running. */
478b321acabSVincenzo Maffione 	if (priv->np_kloop_state & NM_SYNC_KLOOP_RUNNING) {
479b321acabSVincenzo Maffione 		err = EBUSY;
480b321acabSVincenzo Maffione 	}
481b321acabSVincenzo Maffione 	priv->np_kloop_state |= NM_SYNC_KLOOP_RUNNING;
482b321acabSVincenzo Maffione 	NMG_UNLOCK();
483b321acabSVincenzo Maffione 	if (err) {
484b321acabSVincenzo Maffione 		return err;
485b321acabSVincenzo Maffione 	}
486b321acabSVincenzo Maffione 
487b321acabSVincenzo Maffione 	num_rx_rings = priv->np_qlast[NR_RX] - priv->np_qfirst[NR_RX];
488b321acabSVincenzo Maffione 	num_tx_rings = priv->np_qlast[NR_TX] - priv->np_qfirst[NR_TX];
489b321acabSVincenzo Maffione 	num_rings = num_tx_rings + num_rx_rings;
490b321acabSVincenzo Maffione 
491b321acabSVincenzo Maffione 	/* Validate notification options. */
492b321acabSVincenzo Maffione 	opt = nmreq_findoption((struct nmreq_option *)(uintptr_t)hdr->nr_options,
493b321acabSVincenzo Maffione 				NETMAP_REQ_OPT_SYNC_KLOOP_EVENTFDS);
494b321acabSVincenzo Maffione 	if (opt != NULL) {
495b321acabSVincenzo Maffione 		err = nmreq_checkduplicate(opt);
496b321acabSVincenzo Maffione 		if (err) {
497b321acabSVincenzo Maffione 			opt->nro_status = err;
498b321acabSVincenzo Maffione 			goto out;
499b321acabSVincenzo Maffione 		}
500b321acabSVincenzo Maffione 		if (opt->nro_size != sizeof(*eventfds_opt) +
501b321acabSVincenzo Maffione 			sizeof(eventfds_opt->eventfds[0]) * num_rings) {
502b321acabSVincenzo Maffione 			/* Option size not consistent with the number of
503b321acabSVincenzo Maffione 			 * entries. */
504b321acabSVincenzo Maffione 			opt->nro_status = err = EINVAL;
505b321acabSVincenzo Maffione 			goto out;
506b321acabSVincenzo Maffione 		}
507b321acabSVincenzo Maffione #ifdef SYNC_KLOOP_POLL
508b321acabSVincenzo Maffione 		eventfds_opt = (struct nmreq_opt_sync_kloop_eventfds *)opt;
509b321acabSVincenzo Maffione 		opt->nro_status = 0;
510b321acabSVincenzo Maffione 		/* We need 2 poll entries for TX and RX notifications coming
511b321acabSVincenzo Maffione 		 * from the netmap adapter, plus one entries per ring for the
512b321acabSVincenzo Maffione 		 * notifications coming from the application. */
513b321acabSVincenzo Maffione 		poll_ctx = nm_os_malloc(sizeof(*poll_ctx) +
514b321acabSVincenzo Maffione 				(2 + num_rings) * sizeof(poll_ctx->entries[0]));
515b321acabSVincenzo Maffione 		init_poll_funcptr(&poll_ctx->wait_table,
516b321acabSVincenzo Maffione 					sync_kloop_poll_table_queue_proc);
517b321acabSVincenzo Maffione 		poll_ctx->num_entries = 2 + num_rings;
518b321acabSVincenzo Maffione 		poll_ctx->next_entry = 0;
519b321acabSVincenzo Maffione 		/* Poll for notifications coming from the applications through
520b321acabSVincenzo Maffione 		 * eventfds . */
521b321acabSVincenzo Maffione 		for (i = 0; i < num_rings; i++) {
522b321acabSVincenzo Maffione 			struct eventfd_ctx *irq;
523b321acabSVincenzo Maffione 			struct file *filp;
524b321acabSVincenzo Maffione 			unsigned long mask;
525b321acabSVincenzo Maffione 
526b321acabSVincenzo Maffione 			filp = eventfd_fget(eventfds_opt->eventfds[i].ioeventfd);
527b321acabSVincenzo Maffione 			if (IS_ERR(filp)) {
528b321acabSVincenzo Maffione 				err = PTR_ERR(filp);
529b321acabSVincenzo Maffione 				goto out;
530b321acabSVincenzo Maffione 			}
531b321acabSVincenzo Maffione 			mask = filp->f_op->poll(filp, &poll_ctx->wait_table);
532b321acabSVincenzo Maffione 			if (mask & POLLERR) {
533b321acabSVincenzo Maffione 				err = EINVAL;
534b321acabSVincenzo Maffione 				goto out;
535b321acabSVincenzo Maffione 			}
536b321acabSVincenzo Maffione 
537b321acabSVincenzo Maffione 			filp = eventfd_fget(eventfds_opt->eventfds[i].irqfd);
538b321acabSVincenzo Maffione 			if (IS_ERR(filp)) {
539b321acabSVincenzo Maffione 				err = PTR_ERR(filp);
540b321acabSVincenzo Maffione 				goto out;
541b321acabSVincenzo Maffione 			}
542b321acabSVincenzo Maffione 			poll_ctx->entries[i].irq_filp = filp;
543b321acabSVincenzo Maffione 			irq = eventfd_ctx_fileget(filp);
544b321acabSVincenzo Maffione 			if (IS_ERR(irq)) {
545b321acabSVincenzo Maffione 				err = PTR_ERR(irq);
546b321acabSVincenzo Maffione 				goto out;
547b321acabSVincenzo Maffione 			}
548b321acabSVincenzo Maffione 			poll_ctx->entries[i].irq_ctx = irq;
549b321acabSVincenzo Maffione 		}
550b321acabSVincenzo Maffione 		/* Poll for notifications coming from the netmap rings bound to
551b321acabSVincenzo Maffione 		 * this file descriptor. */
552b321acabSVincenzo Maffione 		{
553b321acabSVincenzo Maffione 			NM_SELINFO_T *si[NR_TXRX];
554b321acabSVincenzo Maffione 
555b321acabSVincenzo Maffione 			NMG_LOCK();
556b321acabSVincenzo Maffione 			si[NR_RX] = nm_si_user(priv, NR_RX) ? &na->si[NR_RX] :
557b321acabSVincenzo Maffione 				&na->rx_rings[priv->np_qfirst[NR_RX]]->si;
558b321acabSVincenzo Maffione 			si[NR_TX] = nm_si_user(priv, NR_TX) ? &na->si[NR_TX] :
559b321acabSVincenzo Maffione 				&na->tx_rings[priv->np_qfirst[NR_TX]]->si;
560b321acabSVincenzo Maffione 			NMG_UNLOCK();
561b321acabSVincenzo Maffione 			poll_wait(priv->np_filp, si[NR_RX], &poll_ctx->wait_table);
562b321acabSVincenzo Maffione 			poll_wait(priv->np_filp, si[NR_TX], &poll_ctx->wait_table);
563b321acabSVincenzo Maffione 		}
564b321acabSVincenzo Maffione #else   /* SYNC_KLOOP_POLL */
565b321acabSVincenzo Maffione 		opt->nro_status = EOPNOTSUPP;
566b321acabSVincenzo Maffione 		goto out;
567b321acabSVincenzo Maffione #endif  /* SYNC_KLOOP_POLL */
568b321acabSVincenzo Maffione 	}
569b321acabSVincenzo Maffione 
570b321acabSVincenzo Maffione 	/* Main loop. */
571b321acabSVincenzo Maffione 	for (;;) {
572b321acabSVincenzo Maffione 		if (unlikely(NM_ACCESS_ONCE(priv->np_kloop_state) & NM_SYNC_KLOOP_STOPPING)) {
573b321acabSVincenzo Maffione 			break;
574b321acabSVincenzo Maffione 		}
575b321acabSVincenzo Maffione 
576b321acabSVincenzo Maffione #ifdef SYNC_KLOOP_POLL
577b321acabSVincenzo Maffione 		if (poll_ctx)
578b321acabSVincenzo Maffione 			__set_current_state(TASK_INTERRUPTIBLE);
579b321acabSVincenzo Maffione #endif  /* SYNC_KLOOP_POLL */
580b321acabSVincenzo Maffione 
581b321acabSVincenzo Maffione 		/* Process all the TX rings bound to this file descriptor. */
582b321acabSVincenzo Maffione 		for (i = 0; i < num_tx_rings; i++) {
583b321acabSVincenzo Maffione 			struct sync_kloop_ring_args a = {
584b321acabSVincenzo Maffione 				.kring = NMR(na, NR_TX)[i + priv->np_qfirst[NR_TX]],
585b321acabSVincenzo Maffione 				.csb_atok = csb_atok_base + i,
586b321acabSVincenzo Maffione 				.csb_ktoa = csb_ktoa_base + i,
587b321acabSVincenzo Maffione 			};
588b321acabSVincenzo Maffione 
589b321acabSVincenzo Maffione #ifdef SYNC_KLOOP_POLL
590b321acabSVincenzo Maffione 			if (poll_ctx)
591b321acabSVincenzo Maffione 				a.irq_ctx = poll_ctx->entries[i].irq_ctx;
592b321acabSVincenzo Maffione #endif /* SYNC_KLOOP_POLL */
593b321acabSVincenzo Maffione 			if (unlikely(nm_kr_tryget(a.kring, 1, NULL))) {
594b321acabSVincenzo Maffione 				continue;
595b321acabSVincenzo Maffione 			}
596b321acabSVincenzo Maffione 			netmap_sync_kloop_tx_ring(&a);
597b321acabSVincenzo Maffione 			nm_kr_put(a.kring);
598b321acabSVincenzo Maffione 		}
599b321acabSVincenzo Maffione 
600b321acabSVincenzo Maffione 		/* Process all the RX rings bound to this file descriptor. */
601b321acabSVincenzo Maffione 		for (i = 0; i < num_rx_rings; i++) {
602b321acabSVincenzo Maffione 			struct sync_kloop_ring_args a = {
603b321acabSVincenzo Maffione 				.kring = NMR(na, NR_RX)[i + priv->np_qfirst[NR_RX]],
604b321acabSVincenzo Maffione 				.csb_atok = csb_atok_base + num_tx_rings + i,
605b321acabSVincenzo Maffione 				.csb_ktoa = csb_ktoa_base + num_tx_rings + i,
606b321acabSVincenzo Maffione 			};
607b321acabSVincenzo Maffione 
608b321acabSVincenzo Maffione #ifdef SYNC_KLOOP_POLL
609b321acabSVincenzo Maffione 			if (poll_ctx)
610b321acabSVincenzo Maffione 				a.irq_ctx = poll_ctx->entries[num_tx_rings + i].irq_ctx;
611b321acabSVincenzo Maffione #endif /* SYNC_KLOOP_POLL */
612b321acabSVincenzo Maffione 
613b321acabSVincenzo Maffione 			if (unlikely(nm_kr_tryget(a.kring, 1, NULL))) {
614b321acabSVincenzo Maffione 				continue;
615b321acabSVincenzo Maffione 			}
616b321acabSVincenzo Maffione 			netmap_sync_kloop_rx_ring(&a);
617b321acabSVincenzo Maffione 			nm_kr_put(a.kring);
618b321acabSVincenzo Maffione 		}
619b321acabSVincenzo Maffione 
620b321acabSVincenzo Maffione #ifdef SYNC_KLOOP_POLL
621b321acabSVincenzo Maffione 		if (poll_ctx) {
622b321acabSVincenzo Maffione 			/* If a poll context is present, yield to the scheduler
623b321acabSVincenzo Maffione 			 * waiting for a notification to come either from
624b321acabSVincenzo Maffione 			 * netmap or the application. */
625b321acabSVincenzo Maffione 			schedule_timeout_interruptible(msecs_to_jiffies(1000));
626b321acabSVincenzo Maffione 		} else
627b321acabSVincenzo Maffione #endif /* SYNC_KLOOP_POLL */
628b321acabSVincenzo Maffione 		{
629b321acabSVincenzo Maffione 			/* Default synchronization method: sleep for a while. */
630b321acabSVincenzo Maffione 			usleep_range(sleep_us, sleep_us);
631b321acabSVincenzo Maffione 		}
632b321acabSVincenzo Maffione 	}
633b321acabSVincenzo Maffione out:
634b321acabSVincenzo Maffione #ifdef SYNC_KLOOP_POLL
635b321acabSVincenzo Maffione 	if (poll_ctx) {
636b321acabSVincenzo Maffione 		/* Stop polling from netmap and the eventfds, and deallocate
637b321acabSVincenzo Maffione 		 * the poll context. */
638b321acabSVincenzo Maffione 		__set_current_state(TASK_RUNNING);
639b321acabSVincenzo Maffione 		for (i = 0; i < poll_ctx->next_entry; i++) {
640b321acabSVincenzo Maffione 			struct sync_kloop_poll_entry *entry =
641b321acabSVincenzo Maffione 						poll_ctx->entries + i;
642b321acabSVincenzo Maffione 
643b321acabSVincenzo Maffione 			if (entry->wqh)
644b321acabSVincenzo Maffione 				remove_wait_queue(entry->wqh, &entry->wait);
645b321acabSVincenzo Maffione 			/* We did not get a reference to the eventfds, but
646b321acabSVincenzo Maffione 			 * don't do that on netmap file descriptors (since
647b321acabSVincenzo Maffione 			 * a reference was not taken. */
648b321acabSVincenzo Maffione 			if (entry->filp && entry->filp != priv->np_filp)
649b321acabSVincenzo Maffione 				fput(entry->filp);
650b321acabSVincenzo Maffione 			if (entry->irq_ctx)
651b321acabSVincenzo Maffione 				eventfd_ctx_put(entry->irq_ctx);
652b321acabSVincenzo Maffione 			if (entry->irq_filp)
653b321acabSVincenzo Maffione 				fput(entry->irq_filp);
654b321acabSVincenzo Maffione 		}
655b321acabSVincenzo Maffione 		nm_os_free(poll_ctx);
656b321acabSVincenzo Maffione 		poll_ctx = NULL;
657b321acabSVincenzo Maffione 	}
658b321acabSVincenzo Maffione #endif /* SYNC_KLOOP_POLL */
659b321acabSVincenzo Maffione 
660b321acabSVincenzo Maffione 	/* Reset the kloop state. */
661b321acabSVincenzo Maffione 	NMG_LOCK();
662b321acabSVincenzo Maffione 	priv->np_kloop_state = 0;
663b321acabSVincenzo Maffione 	NMG_UNLOCK();
664b321acabSVincenzo Maffione 
665b321acabSVincenzo Maffione 	return err;
666b321acabSVincenzo Maffione }
667b321acabSVincenzo Maffione 
668b321acabSVincenzo Maffione int
669b321acabSVincenzo Maffione netmap_sync_kloop_stop(struct netmap_priv_d *priv)
670b321acabSVincenzo Maffione {
671b321acabSVincenzo Maffione 	bool running = true;
672b321acabSVincenzo Maffione 	int err = 0;
673b321acabSVincenzo Maffione 
674b321acabSVincenzo Maffione 	NMG_LOCK();
675b321acabSVincenzo Maffione 	priv->np_kloop_state |= NM_SYNC_KLOOP_STOPPING;
676b321acabSVincenzo Maffione 	NMG_UNLOCK();
677b321acabSVincenzo Maffione 	while (running) {
678b321acabSVincenzo Maffione 		usleep_range(1000, 1500);
679b321acabSVincenzo Maffione 		NMG_LOCK();
680b321acabSVincenzo Maffione 		running = (NM_ACCESS_ONCE(priv->np_kloop_state)
681b321acabSVincenzo Maffione 				& NM_SYNC_KLOOP_RUNNING);
682b321acabSVincenzo Maffione 		NMG_UNLOCK();
683b321acabSVincenzo Maffione 	}
684b321acabSVincenzo Maffione 
685b321acabSVincenzo Maffione 	return err;
686b321acabSVincenzo Maffione }
687b321acabSVincenzo Maffione 
688b321acabSVincenzo Maffione #ifdef WITH_PTNETMAP
689b321acabSVincenzo Maffione /*
690b321acabSVincenzo Maffione  * Guest ptnetmap txsync()/rxsync() routines, used in ptnet device drivers.
691b321acabSVincenzo Maffione  * These routines are reused across the different operating systems supported
692b321acabSVincenzo Maffione  * by netmap.
693b321acabSVincenzo Maffione  */
694b321acabSVincenzo Maffione 
695b321acabSVincenzo Maffione /*
696b321acabSVincenzo Maffione  * Reconcile host and guest views of the transmit ring.
697b321acabSVincenzo Maffione  *
698b321acabSVincenzo Maffione  * Guest user wants to transmit packets up to the one before ring->head,
699b321acabSVincenzo Maffione  * and guest kernel knows tx_ring->hwcur is the first packet unsent
700b321acabSVincenzo Maffione  * by the host kernel.
701b321acabSVincenzo Maffione  *
702b321acabSVincenzo Maffione  * We push out as many packets as possible, and possibly
703b321acabSVincenzo Maffione  * reclaim buffers from previously completed transmission.
704b321acabSVincenzo Maffione  *
705b321acabSVincenzo Maffione  * Notifications from the host are enabled only if the user guest would
706b321acabSVincenzo Maffione  * block (no space in the ring).
707b321acabSVincenzo Maffione  */
708b321acabSVincenzo Maffione bool
709b321acabSVincenzo Maffione netmap_pt_guest_txsync(struct nm_csb_atok *atok, struct nm_csb_ktoa *ktoa,
710b321acabSVincenzo Maffione 			struct netmap_kring *kring, int flags)
711b321acabSVincenzo Maffione {
712b321acabSVincenzo Maffione 	bool notify = false;
713b321acabSVincenzo Maffione 
714b321acabSVincenzo Maffione 	/* Disable notifications */
715b321acabSVincenzo Maffione 	atok->appl_need_kick = 0;
716b321acabSVincenzo Maffione 
717b321acabSVincenzo Maffione 	/*
718b321acabSVincenzo Maffione 	 * First part: tell the host (updating the CSB) to process the new
719b321acabSVincenzo Maffione 	 * packets.
720b321acabSVincenzo Maffione 	 */
721b321acabSVincenzo Maffione 	kring->nr_hwcur = ktoa->hwcur;
722b321acabSVincenzo Maffione 	ptnetmap_guest_write_kring_csb(atok, kring->rcur, kring->rhead);
723b321acabSVincenzo Maffione 
724b321acabSVincenzo Maffione         /* Ask for a kick from a guest to the host if needed. */
725b321acabSVincenzo Maffione 	if (((kring->rhead != kring->nr_hwcur || nm_kr_txempty(kring))
726b321acabSVincenzo Maffione 		&& NM_ACCESS_ONCE(ktoa->kern_need_kick)) ||
727b321acabSVincenzo Maffione 			(flags & NAF_FORCE_RECLAIM)) {
728b321acabSVincenzo Maffione 		atok->sync_flags = flags;
729b321acabSVincenzo Maffione 		notify = true;
730b321acabSVincenzo Maffione 	}
731b321acabSVincenzo Maffione 
732b321acabSVincenzo Maffione 	/*
733b321acabSVincenzo Maffione 	 * Second part: reclaim buffers for completed transmissions.
734b321acabSVincenzo Maffione 	 */
735b321acabSVincenzo Maffione 	if (nm_kr_txempty(kring) || (flags & NAF_FORCE_RECLAIM)) {
736b321acabSVincenzo Maffione                 ptnetmap_guest_read_kring_csb(ktoa, kring);
737b321acabSVincenzo Maffione 	}
738b321acabSVincenzo Maffione 
739b321acabSVincenzo Maffione         /*
740b321acabSVincenzo Maffione          * No more room in the ring for new transmissions. The user thread will
741b321acabSVincenzo Maffione 	 * go to sleep and we need to be notified by the host when more free
742b321acabSVincenzo Maffione 	 * space is available.
743b321acabSVincenzo Maffione          */
744b321acabSVincenzo Maffione 	if (nm_kr_txempty(kring) && !(kring->nr_kflags & NKR_NOINTR)) {
745b321acabSVincenzo Maffione 		/* Reenable notifications. */
746b321acabSVincenzo Maffione 		atok->appl_need_kick = 1;
747b321acabSVincenzo Maffione                 /* Double check */
748b321acabSVincenzo Maffione                 ptnetmap_guest_read_kring_csb(ktoa, kring);
749b321acabSVincenzo Maffione                 /* If there is new free space, disable notifications */
750b321acabSVincenzo Maffione 		if (unlikely(!nm_kr_txempty(kring))) {
751b321acabSVincenzo Maffione 			atok->appl_need_kick = 0;
752b321acabSVincenzo Maffione 		}
753b321acabSVincenzo Maffione 	}
754b321acabSVincenzo Maffione 
755b321acabSVincenzo Maffione 	nm_prdis(1, "%s CSB(head:%u cur:%u hwtail:%u) KRING(head:%u cur:%u tail:%u)",
756b321acabSVincenzo Maffione 		kring->name, atok->head, atok->cur, ktoa->hwtail,
757b321acabSVincenzo Maffione 		kring->rhead, kring->rcur, kring->nr_hwtail);
758b321acabSVincenzo Maffione 
759b321acabSVincenzo Maffione 	return notify;
760b321acabSVincenzo Maffione }
761b321acabSVincenzo Maffione 
762b321acabSVincenzo Maffione /*
763b321acabSVincenzo Maffione  * Reconcile host and guest view of the receive ring.
764b321acabSVincenzo Maffione  *
765b321acabSVincenzo Maffione  * Update hwcur/hwtail from host (reading from CSB).
766b321acabSVincenzo Maffione  *
767b321acabSVincenzo Maffione  * If guest user has released buffers up to the one before ring->head, we
768b321acabSVincenzo Maffione  * also give them to the host.
769b321acabSVincenzo Maffione  *
770b321acabSVincenzo Maffione  * Notifications from the host are enabled only if the user guest would
771b321acabSVincenzo Maffione  * block (no more completed slots in the ring).
772b321acabSVincenzo Maffione  */
773b321acabSVincenzo Maffione bool
774b321acabSVincenzo Maffione netmap_pt_guest_rxsync(struct nm_csb_atok *atok, struct nm_csb_ktoa *ktoa,
775b321acabSVincenzo Maffione 			struct netmap_kring *kring, int flags)
776b321acabSVincenzo Maffione {
777b321acabSVincenzo Maffione 	bool notify = false;
778b321acabSVincenzo Maffione 
779b321acabSVincenzo Maffione         /* Disable notifications */
780b321acabSVincenzo Maffione 	atok->appl_need_kick = 0;
781b321acabSVincenzo Maffione 
782b321acabSVincenzo Maffione 	/*
783b321acabSVincenzo Maffione 	 * First part: import newly received packets, by updating the kring
784b321acabSVincenzo Maffione 	 * hwtail to the hwtail known from the host (read from the CSB).
785b321acabSVincenzo Maffione 	 * This also updates the kring hwcur.
786b321acabSVincenzo Maffione 	 */
787b321acabSVincenzo Maffione         ptnetmap_guest_read_kring_csb(ktoa, kring);
788b321acabSVincenzo Maffione 	kring->nr_kflags &= ~NKR_PENDINTR;
789b321acabSVincenzo Maffione 
790b321acabSVincenzo Maffione 	/*
791b321acabSVincenzo Maffione 	 * Second part: tell the host about the slots that guest user has
792b321acabSVincenzo Maffione 	 * released, by updating cur and head in the CSB.
793b321acabSVincenzo Maffione 	 */
794b321acabSVincenzo Maffione 	if (kring->rhead != kring->nr_hwcur) {
795b321acabSVincenzo Maffione 		ptnetmap_guest_write_kring_csb(atok, kring->rcur,
796b321acabSVincenzo Maffione 					       kring->rhead);
797b321acabSVincenzo Maffione                 /* Ask for a kick from the guest to the host if needed. */
798b321acabSVincenzo Maffione 		if (NM_ACCESS_ONCE(ktoa->kern_need_kick)) {
799b321acabSVincenzo Maffione 			atok->sync_flags = flags;
800b321acabSVincenzo Maffione 			notify = true;
801b321acabSVincenzo Maffione 		}
802b321acabSVincenzo Maffione 	}
803b321acabSVincenzo Maffione 
804b321acabSVincenzo Maffione         /*
805b321acabSVincenzo Maffione          * No more completed RX slots. The user thread will go to sleep and
806b321acabSVincenzo Maffione 	 * we need to be notified by the host when more RX slots have been
807b321acabSVincenzo Maffione 	 * completed.
808b321acabSVincenzo Maffione          */
809b321acabSVincenzo Maffione 	if (nm_kr_rxempty(kring) && !(kring->nr_kflags & NKR_NOINTR)) {
810b321acabSVincenzo Maffione 		/* Reenable notifications. */
811b321acabSVincenzo Maffione                 atok->appl_need_kick = 1;
812b321acabSVincenzo Maffione                 /* Double check */
813b321acabSVincenzo Maffione                 ptnetmap_guest_read_kring_csb(ktoa, kring);
814b321acabSVincenzo Maffione                 /* If there are new slots, disable notifications. */
815b321acabSVincenzo Maffione 		if (!nm_kr_rxempty(kring)) {
816b321acabSVincenzo Maffione                         atok->appl_need_kick = 0;
817b321acabSVincenzo Maffione                 }
818b321acabSVincenzo Maffione         }
819b321acabSVincenzo Maffione 
820b321acabSVincenzo Maffione 	nm_prdis(1, "%s CSB(head:%u cur:%u hwtail:%u) KRING(head:%u cur:%u tail:%u)",
821b321acabSVincenzo Maffione 		kring->name, atok->head, atok->cur, ktoa->hwtail,
822b321acabSVincenzo Maffione 		kring->rhead, kring->rcur, kring->nr_hwtail);
823b321acabSVincenzo Maffione 
824b321acabSVincenzo Maffione 	return notify;
825b321acabSVincenzo Maffione }
826b321acabSVincenzo Maffione 
827b321acabSVincenzo Maffione /*
828b321acabSVincenzo Maffione  * Callbacks for ptnet drivers: nm_krings_create, nm_krings_delete, nm_dtor.
829b321acabSVincenzo Maffione  */
830b321acabSVincenzo Maffione int
831b321acabSVincenzo Maffione ptnet_nm_krings_create(struct netmap_adapter *na)
832b321acabSVincenzo Maffione {
833b321acabSVincenzo Maffione 	struct netmap_pt_guest_adapter *ptna =
834b321acabSVincenzo Maffione 			(struct netmap_pt_guest_adapter *)na; /* Upcast. */
835b321acabSVincenzo Maffione 	struct netmap_adapter *na_nm = &ptna->hwup.up;
836b321acabSVincenzo Maffione 	struct netmap_adapter *na_dr = &ptna->dr.up;
837b321acabSVincenzo Maffione 	int ret;
838b321acabSVincenzo Maffione 
839b321acabSVincenzo Maffione 	if (ptna->backend_users) {
840b321acabSVincenzo Maffione 		return 0;
841b321acabSVincenzo Maffione 	}
842b321acabSVincenzo Maffione 
843b321acabSVincenzo Maffione 	/* Create krings on the public netmap adapter. */
844b321acabSVincenzo Maffione 	ret = netmap_hw_krings_create(na_nm);
845b321acabSVincenzo Maffione 	if (ret) {
846b321acabSVincenzo Maffione 		return ret;
847b321acabSVincenzo Maffione 	}
848b321acabSVincenzo Maffione 
849b321acabSVincenzo Maffione 	/* Copy krings into the netmap adapter private to the driver. */
850b321acabSVincenzo Maffione 	na_dr->tx_rings = na_nm->tx_rings;
851b321acabSVincenzo Maffione 	na_dr->rx_rings = na_nm->rx_rings;
852b321acabSVincenzo Maffione 
853b321acabSVincenzo Maffione 	return 0;
854b321acabSVincenzo Maffione }
855b321acabSVincenzo Maffione 
856b321acabSVincenzo Maffione void
857b321acabSVincenzo Maffione ptnet_nm_krings_delete(struct netmap_adapter *na)
858b321acabSVincenzo Maffione {
859b321acabSVincenzo Maffione 	struct netmap_pt_guest_adapter *ptna =
860b321acabSVincenzo Maffione 			(struct netmap_pt_guest_adapter *)na; /* Upcast. */
861b321acabSVincenzo Maffione 	struct netmap_adapter *na_nm = &ptna->hwup.up;
862b321acabSVincenzo Maffione 	struct netmap_adapter *na_dr = &ptna->dr.up;
863b321acabSVincenzo Maffione 
864b321acabSVincenzo Maffione 	if (ptna->backend_users) {
865b321acabSVincenzo Maffione 		return;
866b321acabSVincenzo Maffione 	}
867b321acabSVincenzo Maffione 
868b321acabSVincenzo Maffione 	na_dr->tx_rings = NULL;
869b321acabSVincenzo Maffione 	na_dr->rx_rings = NULL;
870b321acabSVincenzo Maffione 
871b321acabSVincenzo Maffione 	netmap_hw_krings_delete(na_nm);
872b321acabSVincenzo Maffione }
873b321acabSVincenzo Maffione 
874b321acabSVincenzo Maffione void
875b321acabSVincenzo Maffione ptnet_nm_dtor(struct netmap_adapter *na)
876b321acabSVincenzo Maffione {
877b321acabSVincenzo Maffione 	struct netmap_pt_guest_adapter *ptna =
878b321acabSVincenzo Maffione 			(struct netmap_pt_guest_adapter *)na;
879b321acabSVincenzo Maffione 
880b321acabSVincenzo Maffione 	netmap_mem_put(ptna->dr.up.nm_mem);
881b321acabSVincenzo Maffione 	memset(&ptna->dr, 0, sizeof(ptna->dr));
882b321acabSVincenzo Maffione 	netmap_mem_pt_guest_ifp_del(na->nm_mem, na->ifp);
883b321acabSVincenzo Maffione }
884b321acabSVincenzo Maffione 
885b321acabSVincenzo Maffione int
886b321acabSVincenzo Maffione netmap_pt_guest_attach(struct netmap_adapter *arg,
887b321acabSVincenzo Maffione 		       unsigned int nifp_offset, unsigned int memid)
888b321acabSVincenzo Maffione {
889b321acabSVincenzo Maffione 	struct netmap_pt_guest_adapter *ptna;
890b321acabSVincenzo Maffione 	struct ifnet *ifp = arg ? arg->ifp : NULL;
891b321acabSVincenzo Maffione 	int error;
892b321acabSVincenzo Maffione 
893b321acabSVincenzo Maffione 	/* get allocator */
894b321acabSVincenzo Maffione 	arg->nm_mem = netmap_mem_pt_guest_new(ifp, nifp_offset, memid);
895b321acabSVincenzo Maffione 	if (arg->nm_mem == NULL)
896b321acabSVincenzo Maffione 		return ENOMEM;
897b321acabSVincenzo Maffione 	arg->na_flags |= NAF_MEM_OWNER;
898b321acabSVincenzo Maffione 	error = netmap_attach_ext(arg, sizeof(struct netmap_pt_guest_adapter), 1);
899b321acabSVincenzo Maffione 	if (error)
900b321acabSVincenzo Maffione 		return error;
901b321acabSVincenzo Maffione 
902b321acabSVincenzo Maffione 	/* get the netmap_pt_guest_adapter */
903b321acabSVincenzo Maffione 	ptna = (struct netmap_pt_guest_adapter *) NA(ifp);
904b321acabSVincenzo Maffione 
905b321acabSVincenzo Maffione 	/* Initialize a separate pass-through netmap adapter that is going to
906b321acabSVincenzo Maffione 	 * be used by the ptnet driver only, and so never exposed to netmap
907b321acabSVincenzo Maffione          * applications. We only need a subset of the available fields. */
908b321acabSVincenzo Maffione 	memset(&ptna->dr, 0, sizeof(ptna->dr));
909b321acabSVincenzo Maffione 	ptna->dr.up.ifp = ifp;
910b321acabSVincenzo Maffione 	ptna->dr.up.nm_mem = netmap_mem_get(ptna->hwup.up.nm_mem);
911b321acabSVincenzo Maffione         ptna->dr.up.nm_config = ptna->hwup.up.nm_config;
912b321acabSVincenzo Maffione 
913b321acabSVincenzo Maffione 	ptna->backend_users = 0;
914b321acabSVincenzo Maffione 
915b321acabSVincenzo Maffione 	return 0;
916b321acabSVincenzo Maffione }
917b321acabSVincenzo Maffione 
918b321acabSVincenzo Maffione #endif /* WITH_PTNETMAP */
919