xref: /dpdk/examples/server_node_efd/server/main.c (revision 70febdcf)
13998e2a0SBruce Richardson /* SPDX-License-Identifier: BSD-3-Clause
23998e2a0SBruce Richardson  * Copyright(c) 2016-2017 Intel Corporation
3ed2a80fdSPablo de Lara  */
4ed2a80fdSPablo de Lara 
5ed2a80fdSPablo de Lara #include <stdio.h>
6ed2a80fdSPablo de Lara #include <stdlib.h>
7ed2a80fdSPablo de Lara #include <string.h>
8ed2a80fdSPablo de Lara #include <unistd.h>
9ed2a80fdSPablo de Lara #include <stdint.h>
10ed2a80fdSPablo de Lara #include <stdarg.h>
11ed2a80fdSPablo de Lara #include <inttypes.h>
12ed2a80fdSPablo de Lara #include <sys/queue.h>
13ed2a80fdSPablo de Lara #include <errno.h>
14ed2a80fdSPablo de Lara #include <netinet/ip.h>
15ed2a80fdSPablo de Lara 
16ed2a80fdSPablo de Lara #include <rte_common.h>
17ed2a80fdSPablo de Lara #include <rte_memory.h>
18ed2a80fdSPablo de Lara #include <rte_eal.h>
19ed2a80fdSPablo de Lara #include <rte_launch.h>
20ed2a80fdSPablo de Lara #include <rte_per_lcore.h>
21ed2a80fdSPablo de Lara #include <rte_lcore.h>
22ed2a80fdSPablo de Lara #include <rte_branch_prediction.h>
23ed2a80fdSPablo de Lara #include <rte_atomic.h>
24ed2a80fdSPablo de Lara #include <rte_ring.h>
25ed2a80fdSPablo de Lara #include <rte_log.h>
26ed2a80fdSPablo de Lara #include <rte_debug.h>
27ed2a80fdSPablo de Lara #include <rte_mempool.h>
28ed2a80fdSPablo de Lara #include <rte_memcpy.h>
29ed2a80fdSPablo de Lara #include <rte_mbuf.h>
30ed2a80fdSPablo de Lara #include <rte_ether.h>
31ed2a80fdSPablo de Lara #include <rte_interrupts.h>
32ed2a80fdSPablo de Lara #include <rte_ethdev.h>
33ed2a80fdSPablo de Lara #include <rte_byteorder.h>
34ed2a80fdSPablo de Lara #include <rte_malloc.h>
35ed2a80fdSPablo de Lara #include <rte_string_fns.h>
36ed2a80fdSPablo de Lara #include <rte_efd.h>
37ed2a80fdSPablo de Lara #include <rte_ip.h>
38ed2a80fdSPablo de Lara 
39ed2a80fdSPablo de Lara #include "common.h"
40ed2a80fdSPablo de Lara #include "args.h"
41ed2a80fdSPablo de Lara #include "init.h"
42ed2a80fdSPablo de Lara 
43ed2a80fdSPablo de Lara /*
44ed2a80fdSPablo de Lara  * When doing reads from the NIC or the node queues,
45ed2a80fdSPablo de Lara  * use this batch size
46ed2a80fdSPablo de Lara  */
47ed2a80fdSPablo de Lara #define PACKET_READ_SIZE 32
48ed2a80fdSPablo de Lara 
49ed2a80fdSPablo de Lara /*
50ed2a80fdSPablo de Lara  * Local buffers to put packets in, used to send packets in bursts to the
51ed2a80fdSPablo de Lara  * nodes
52ed2a80fdSPablo de Lara  */
53ed2a80fdSPablo de Lara struct node_rx_buf {
54ed2a80fdSPablo de Lara 	struct rte_mbuf *buffer[PACKET_READ_SIZE];
55ed2a80fdSPablo de Lara 	uint16_t count;
56ed2a80fdSPablo de Lara };
57ed2a80fdSPablo de Lara 
58ed2a80fdSPablo de Lara struct efd_stats {
59ed2a80fdSPablo de Lara 	uint64_t distributed;
60ed2a80fdSPablo de Lara 	uint64_t drop;
61ed2a80fdSPablo de Lara } flow_dist_stats;
62ed2a80fdSPablo de Lara 
63ed2a80fdSPablo de Lara /* One buffer per node rx queue - dynamically allocate array */
64ed2a80fdSPablo de Lara static struct node_rx_buf *cl_rx_buf;
65ed2a80fdSPablo de Lara 
66ed2a80fdSPablo de Lara static const char *
67f8244c63SZhiyong Yang get_printable_mac_addr(uint16_t port)
68ed2a80fdSPablo de Lara {
69ed2a80fdSPablo de Lara 	static const char err_address[] = "00:00:00:00:00:00";
70ed2a80fdSPablo de Lara 	static char addresses[RTE_MAX_ETHPORTS][sizeof(err_address)];
716d13ea8eSOlivier Matz 	struct rte_ether_addr mac;
72*70febdcfSIgor Romanov 	int ret;
73ed2a80fdSPablo de Lara 
74ed2a80fdSPablo de Lara 	if (unlikely(port >= RTE_MAX_ETHPORTS))
75ed2a80fdSPablo de Lara 		return err_address;
76ed2a80fdSPablo de Lara 	if (unlikely(addresses[port][0] == '\0')) {
77*70febdcfSIgor Romanov 		ret = rte_eth_macaddr_get(port, &mac);
78*70febdcfSIgor Romanov 		if (ret != 0) {
79*70febdcfSIgor Romanov 			printf("Failed to get MAC address (port %u): %s\n",
80*70febdcfSIgor Romanov 			       port, rte_strerror(-ret));
81*70febdcfSIgor Romanov 			return err_address;
82*70febdcfSIgor Romanov 		}
83*70febdcfSIgor Romanov 
84ed2a80fdSPablo de Lara 		snprintf(addresses[port], sizeof(addresses[port]),
85ed2a80fdSPablo de Lara 				"%02x:%02x:%02x:%02x:%02x:%02x\n",
86ed2a80fdSPablo de Lara 				mac.addr_bytes[0], mac.addr_bytes[1],
87ed2a80fdSPablo de Lara 				mac.addr_bytes[2], mac.addr_bytes[3],
88ed2a80fdSPablo de Lara 				mac.addr_bytes[4], mac.addr_bytes[5]);
89ed2a80fdSPablo de Lara 	}
90ed2a80fdSPablo de Lara 	return addresses[port];
91ed2a80fdSPablo de Lara }
92ed2a80fdSPablo de Lara 
93ed2a80fdSPablo de Lara /*
94ed2a80fdSPablo de Lara  * This function displays the recorded statistics for each port
95ed2a80fdSPablo de Lara  * and for each node. It uses ANSI terminal codes to clear
96ed2a80fdSPablo de Lara  * screen when called. It is called from a single non-master
97ed2a80fdSPablo de Lara  * thread in the server process, when the process is run with more
98ed2a80fdSPablo de Lara  * than one lcore enabled.
99ed2a80fdSPablo de Lara  */
100ed2a80fdSPablo de Lara static void
101ed2a80fdSPablo de Lara do_stats_display(void)
102ed2a80fdSPablo de Lara {
103ed2a80fdSPablo de Lara 	unsigned int i, j;
104ed2a80fdSPablo de Lara 	const char clr[] = {27, '[', '2', 'J', '\0'};
105ed2a80fdSPablo de Lara 	const char topLeft[] = {27, '[', '1', ';', '1', 'H', '\0'};
106ed2a80fdSPablo de Lara 	uint64_t port_tx[RTE_MAX_ETHPORTS], port_tx_drop[RTE_MAX_ETHPORTS];
107ed2a80fdSPablo de Lara 	uint64_t node_tx[MAX_NODES], node_tx_drop[MAX_NODES];
108ed2a80fdSPablo de Lara 
109ed2a80fdSPablo de Lara 	/* to get TX stats, we need to do some summing calculations */
110ed2a80fdSPablo de Lara 	memset(port_tx, 0, sizeof(port_tx));
111ed2a80fdSPablo de Lara 	memset(port_tx_drop, 0, sizeof(port_tx_drop));
112ed2a80fdSPablo de Lara 	memset(node_tx, 0, sizeof(node_tx));
113ed2a80fdSPablo de Lara 	memset(node_tx_drop, 0, sizeof(node_tx_drop));
114ed2a80fdSPablo de Lara 
115ed2a80fdSPablo de Lara 	for (i = 0; i < num_nodes; i++) {
116ed2a80fdSPablo de Lara 		const struct tx_stats *tx = &info->tx_stats[i];
117ed2a80fdSPablo de Lara 
118ed2a80fdSPablo de Lara 		for (j = 0; j < info->num_ports; j++) {
119ed2a80fdSPablo de Lara 			const uint64_t tx_val = tx->tx[info->id[j]];
120ed2a80fdSPablo de Lara 			const uint64_t drop_val = tx->tx_drop[info->id[j]];
121ed2a80fdSPablo de Lara 
122ed2a80fdSPablo de Lara 			port_tx[j] += tx_val;
123ed2a80fdSPablo de Lara 			port_tx_drop[j] += drop_val;
124ed2a80fdSPablo de Lara 			node_tx[i] += tx_val;
125ed2a80fdSPablo de Lara 			node_tx_drop[i] += drop_val;
126ed2a80fdSPablo de Lara 		}
127ed2a80fdSPablo de Lara 	}
128ed2a80fdSPablo de Lara 
129ed2a80fdSPablo de Lara 	/* Clear screen and move to top left */
130ed2a80fdSPablo de Lara 	printf("%s%s", clr, topLeft);
131ed2a80fdSPablo de Lara 
132ed2a80fdSPablo de Lara 	printf("PORTS\n");
133ed2a80fdSPablo de Lara 	printf("-----\n");
134ed2a80fdSPablo de Lara 	for (i = 0; i < info->num_ports; i++)
135ed2a80fdSPablo de Lara 		printf("Port %u: '%s'\t", (unsigned int)info->id[i],
136ed2a80fdSPablo de Lara 				get_printable_mac_addr(info->id[i]));
137ed2a80fdSPablo de Lara 	printf("\n\n");
138ed2a80fdSPablo de Lara 	for (i = 0; i < info->num_ports; i++) {
139ed2a80fdSPablo de Lara 		printf("Port %u - rx: %9"PRIu64"\t"
140ed2a80fdSPablo de Lara 				"tx: %9"PRIu64"\n",
141ed2a80fdSPablo de Lara 				(unsigned int)info->id[i], info->rx_stats.rx[i],
142ed2a80fdSPablo de Lara 				port_tx[i]);
143ed2a80fdSPablo de Lara 	}
144ed2a80fdSPablo de Lara 
145ed2a80fdSPablo de Lara 	printf("\nSERVER\n");
146ed2a80fdSPablo de Lara 	printf("-----\n");
147ed2a80fdSPablo de Lara 	printf("distributed: %9"PRIu64", drop: %9"PRIu64"\n",
148ed2a80fdSPablo de Lara 			flow_dist_stats.distributed, flow_dist_stats.drop);
149ed2a80fdSPablo de Lara 
150ed2a80fdSPablo de Lara 	printf("\nNODES\n");
151ed2a80fdSPablo de Lara 	printf("-------\n");
152ed2a80fdSPablo de Lara 	for (i = 0; i < num_nodes; i++) {
153ed2a80fdSPablo de Lara 		const unsigned long long rx = nodes[i].stats.rx;
154ed2a80fdSPablo de Lara 		const unsigned long long rx_drop = nodes[i].stats.rx_drop;
155ed2a80fdSPablo de Lara 		const struct filter_stats *filter = &info->filter_stats[i];
156ed2a80fdSPablo de Lara 
157ed2a80fdSPablo de Lara 		printf("Node %2u - rx: %9llu, rx_drop: %9llu\n"
158ed2a80fdSPablo de Lara 				"            tx: %9"PRIu64", tx_drop: %9"PRIu64"\n"
159ed2a80fdSPablo de Lara 				"            filter_passed: %9"PRIu64", "
160ed2a80fdSPablo de Lara 				"filter_drop: %9"PRIu64"\n",
161ed2a80fdSPablo de Lara 				i, rx, rx_drop, node_tx[i], node_tx_drop[i],
162ed2a80fdSPablo de Lara 				filter->passed, filter->drop);
163ed2a80fdSPablo de Lara 	}
164ed2a80fdSPablo de Lara 
165ed2a80fdSPablo de Lara 	printf("\n");
166ed2a80fdSPablo de Lara }
167ed2a80fdSPablo de Lara 
168ed2a80fdSPablo de Lara /*
169ed2a80fdSPablo de Lara  * The function called from each non-master lcore used by the process.
170ed2a80fdSPablo de Lara  * The test_and_set function is used to randomly pick a single lcore on which
171ed2a80fdSPablo de Lara  * the code to display the statistics will run. Otherwise, the code just
172ed2a80fdSPablo de Lara  * repeatedly sleeps.
173ed2a80fdSPablo de Lara  */
174ed2a80fdSPablo de Lara static int
175ed2a80fdSPablo de Lara sleep_lcore(__attribute__((unused)) void *dummy)
176ed2a80fdSPablo de Lara {
177ed2a80fdSPablo de Lara 	/* Used to pick a display thread - static, so zero-initialised */
178ed2a80fdSPablo de Lara 	static rte_atomic32_t display_stats;
179ed2a80fdSPablo de Lara 
180ed2a80fdSPablo de Lara 	/* Only one core should display stats */
181ed2a80fdSPablo de Lara 	if (rte_atomic32_test_and_set(&display_stats)) {
182ed2a80fdSPablo de Lara 		const unsigned int sleeptime = 1;
183ed2a80fdSPablo de Lara 
184ed2a80fdSPablo de Lara 		printf("Core %u displaying statistics\n", rte_lcore_id());
185ed2a80fdSPablo de Lara 
186ed2a80fdSPablo de Lara 		/* Longer initial pause so above printf is seen */
187ed2a80fdSPablo de Lara 		sleep(sleeptime * 3);
188ed2a80fdSPablo de Lara 
189ed2a80fdSPablo de Lara 		/* Loop forever: sleep always returns 0 or <= param */
190ed2a80fdSPablo de Lara 		while (sleep(sleeptime) <= sleeptime)
191ed2a80fdSPablo de Lara 			do_stats_display();
192ed2a80fdSPablo de Lara 	}
193ed2a80fdSPablo de Lara 	return 0;
194ed2a80fdSPablo de Lara }
195ed2a80fdSPablo de Lara 
196ed2a80fdSPablo de Lara /*
197ed2a80fdSPablo de Lara  * Function to set all the node statistic values to zero.
198ed2a80fdSPablo de Lara  * Called at program startup.
199ed2a80fdSPablo de Lara  */
200ed2a80fdSPablo de Lara static void
201ed2a80fdSPablo de Lara clear_stats(void)
202ed2a80fdSPablo de Lara {
203ed2a80fdSPablo de Lara 	unsigned int i;
204ed2a80fdSPablo de Lara 
205ed2a80fdSPablo de Lara 	for (i = 0; i < num_nodes; i++)
206ed2a80fdSPablo de Lara 		nodes[i].stats.rx = nodes[i].stats.rx_drop = 0;
207ed2a80fdSPablo de Lara }
208ed2a80fdSPablo de Lara 
209ed2a80fdSPablo de Lara /*
210ed2a80fdSPablo de Lara  * send a burst of traffic to a node, assuming there are packets
211ed2a80fdSPablo de Lara  * available to be sent to this node
212ed2a80fdSPablo de Lara  */
213ed2a80fdSPablo de Lara static void
214ed2a80fdSPablo de Lara flush_rx_queue(uint16_t node)
215ed2a80fdSPablo de Lara {
216ed2a80fdSPablo de Lara 	uint16_t j;
217ed2a80fdSPablo de Lara 	struct node *cl;
218ed2a80fdSPablo de Lara 
219ed2a80fdSPablo de Lara 	if (cl_rx_buf[node].count == 0)
220ed2a80fdSPablo de Lara 		return;
221ed2a80fdSPablo de Lara 
222ed2a80fdSPablo de Lara 	cl = &nodes[node];
223ed2a80fdSPablo de Lara 	if (rte_ring_enqueue_bulk(cl->rx_q, (void **)cl_rx_buf[node].buffer,
22414fbffb0SBruce Richardson 			cl_rx_buf[node].count, NULL) != cl_rx_buf[node].count){
225ed2a80fdSPablo de Lara 		for (j = 0; j < cl_rx_buf[node].count; j++)
226ed2a80fdSPablo de Lara 			rte_pktmbuf_free(cl_rx_buf[node].buffer[j]);
227ed2a80fdSPablo de Lara 		cl->stats.rx_drop += cl_rx_buf[node].count;
228ed2a80fdSPablo de Lara 	} else
229ed2a80fdSPablo de Lara 		cl->stats.rx += cl_rx_buf[node].count;
230ed2a80fdSPablo de Lara 
231ed2a80fdSPablo de Lara 	cl_rx_buf[node].count = 0;
232ed2a80fdSPablo de Lara }
233ed2a80fdSPablo de Lara 
234ed2a80fdSPablo de Lara /*
235ed2a80fdSPablo de Lara  * marks a packet down to be sent to a particular node process
236ed2a80fdSPablo de Lara  */
237ed2a80fdSPablo de Lara static inline void
238ed2a80fdSPablo de Lara enqueue_rx_packet(uint8_t node, struct rte_mbuf *buf)
239ed2a80fdSPablo de Lara {
240ed2a80fdSPablo de Lara 	cl_rx_buf[node].buffer[cl_rx_buf[node].count++] = buf;
241ed2a80fdSPablo de Lara }
242ed2a80fdSPablo de Lara 
243ed2a80fdSPablo de Lara /*
244ed2a80fdSPablo de Lara  * This function takes a group of packets and routes them
245ed2a80fdSPablo de Lara  * individually to the node process. Very simply round-robins the packets
246ed2a80fdSPablo de Lara  * without checking any of the packet contents.
247ed2a80fdSPablo de Lara  */
248ed2a80fdSPablo de Lara static void
249ed2a80fdSPablo de Lara process_packets(uint32_t port_num __rte_unused, struct rte_mbuf *pkts[],
250ed2a80fdSPablo de Lara 		uint16_t rx_count, unsigned int socket_id)
251ed2a80fdSPablo de Lara {
252ed2a80fdSPablo de Lara 	uint16_t i;
253ed2a80fdSPablo de Lara 	uint8_t node;
254ed2a80fdSPablo de Lara 	efd_value_t data[RTE_EFD_BURST_MAX];
255ed2a80fdSPablo de Lara 	const void *key_ptrs[RTE_EFD_BURST_MAX];
256ed2a80fdSPablo de Lara 
257a7c528e5SOlivier Matz 	struct rte_ipv4_hdr *ipv4_hdr;
258ed2a80fdSPablo de Lara 	uint32_t ipv4_dst_ip[RTE_EFD_BURST_MAX];
259ed2a80fdSPablo de Lara 
260ed2a80fdSPablo de Lara 	for (i = 0; i < rx_count; i++) {
261ed2a80fdSPablo de Lara 		/* Handle IPv4 header.*/
262a7c528e5SOlivier Matz 		ipv4_hdr = rte_pktmbuf_mtod_offset(pkts[i],
263a7c528e5SOlivier Matz 			struct rte_ipv4_hdr *, sizeof(struct rte_ether_hdr));
264ed2a80fdSPablo de Lara 		ipv4_dst_ip[i] = ipv4_hdr->dst_addr;
265ed2a80fdSPablo de Lara 		key_ptrs[i] = (void *)&ipv4_dst_ip[i];
266ed2a80fdSPablo de Lara 	}
267ed2a80fdSPablo de Lara 
268ed2a80fdSPablo de Lara 	rte_efd_lookup_bulk(efd_table, socket_id, rx_count,
269ed2a80fdSPablo de Lara 				(const void **) key_ptrs, data);
270ed2a80fdSPablo de Lara 	for (i = 0; i < rx_count; i++) {
271ed2a80fdSPablo de Lara 		node = (uint8_t) ((uintptr_t)data[i]);
272ed2a80fdSPablo de Lara 
273ed2a80fdSPablo de Lara 		if (node >= num_nodes) {
274ed2a80fdSPablo de Lara 			/*
275ed2a80fdSPablo de Lara 			 * Node is out of range, which means that
276ed2a80fdSPablo de Lara 			 * flow has not been inserted
277ed2a80fdSPablo de Lara 			 */
278ed2a80fdSPablo de Lara 			flow_dist_stats.drop++;
279ed2a80fdSPablo de Lara 			rte_pktmbuf_free(pkts[i]);
280ed2a80fdSPablo de Lara 		} else {
281ed2a80fdSPablo de Lara 			flow_dist_stats.distributed++;
282ed2a80fdSPablo de Lara 			enqueue_rx_packet(node, pkts[i]);
283ed2a80fdSPablo de Lara 		}
284ed2a80fdSPablo de Lara 	}
285ed2a80fdSPablo de Lara 
286ed2a80fdSPablo de Lara 	for (i = 0; i < num_nodes; i++)
287ed2a80fdSPablo de Lara 		flush_rx_queue(i);
288ed2a80fdSPablo de Lara }
289ed2a80fdSPablo de Lara 
290ed2a80fdSPablo de Lara /*
291ed2a80fdSPablo de Lara  * Function called by the master lcore of the DPDK process.
292ed2a80fdSPablo de Lara  */
293ed2a80fdSPablo de Lara static void
294ed2a80fdSPablo de Lara do_packet_forwarding(void)
295ed2a80fdSPablo de Lara {
296ed2a80fdSPablo de Lara 	unsigned int port_num = 0; /* indexes the port[] array */
297ed2a80fdSPablo de Lara 	unsigned int socket_id = rte_socket_id();
298ed2a80fdSPablo de Lara 
299ed2a80fdSPablo de Lara 	for (;;) {
300ed2a80fdSPablo de Lara 		struct rte_mbuf *buf[PACKET_READ_SIZE];
301ed2a80fdSPablo de Lara 		uint16_t rx_count;
302ed2a80fdSPablo de Lara 
303ed2a80fdSPablo de Lara 		/* read a port */
304ed2a80fdSPablo de Lara 		rx_count = rte_eth_rx_burst(info->id[port_num], 0,
305ed2a80fdSPablo de Lara 				buf, PACKET_READ_SIZE);
306ed2a80fdSPablo de Lara 		info->rx_stats.rx[port_num] += rx_count;
307ed2a80fdSPablo de Lara 
308ed2a80fdSPablo de Lara 		/* Now process the NIC packets read */
309ed2a80fdSPablo de Lara 		if (likely(rx_count > 0))
310ed2a80fdSPablo de Lara 			process_packets(port_num, buf, rx_count, socket_id);
311ed2a80fdSPablo de Lara 
312ed2a80fdSPablo de Lara 		/* move to next port */
313ed2a80fdSPablo de Lara 		if (++port_num == info->num_ports)
314ed2a80fdSPablo de Lara 			port_num = 0;
315ed2a80fdSPablo de Lara 	}
316ed2a80fdSPablo de Lara }
317ed2a80fdSPablo de Lara 
318ed2a80fdSPablo de Lara int
319ed2a80fdSPablo de Lara main(int argc, char *argv[])
320ed2a80fdSPablo de Lara {
321ed2a80fdSPablo de Lara 	/* initialise the system */
322ed2a80fdSPablo de Lara 	if (init(argc, argv) < 0)
323ed2a80fdSPablo de Lara 		return -1;
324ed2a80fdSPablo de Lara 	RTE_LOG(INFO, APP, "Finished Process Init.\n");
325ed2a80fdSPablo de Lara 
326ed2a80fdSPablo de Lara 	cl_rx_buf = calloc(num_nodes, sizeof(cl_rx_buf[0]));
327ed2a80fdSPablo de Lara 
328ed2a80fdSPablo de Lara 	/* clear statistics */
329ed2a80fdSPablo de Lara 	clear_stats();
330ed2a80fdSPablo de Lara 
331ed2a80fdSPablo de Lara 	/* put all other cores to sleep bar master */
332ed2a80fdSPablo de Lara 	rte_eal_mp_remote_launch(sleep_lcore, NULL, SKIP_MASTER);
333ed2a80fdSPablo de Lara 
334ed2a80fdSPablo de Lara 	do_packet_forwarding();
335ed2a80fdSPablo de Lara 	return 0;
336ed2a80fdSPablo de Lara }
337