test/tbb/test_function_node.cpp

*51c0b2f7Stbbdev/*
*51c0b2f7Stbbdev    Copyright (c) 2005-2020 Intel Corporation
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    Licensed under the Apache License, Version 2.0 (the "License");
*51c0b2f7Stbbdev    you may not use this file except in compliance with the License.
*51c0b2f7Stbbdev    You may obtain a copy of the License at
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev        http://www.apache.org/licenses/LICENSE-2.0
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    Unless required by applicable law or agreed to in writing, software
*51c0b2f7Stbbdev    distributed under the License is distributed on an "AS IS" BASIS,
*51c0b2f7Stbbdev    WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
*51c0b2f7Stbbdev    See the License for the specific language governing permissions and
*51c0b2f7Stbbdev    limitations under the License.
*51c0b2f7Stbbdev*/
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#include "common/config.h"
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev// TODO revamp: move parts dependent on __TBB_EXTRA_DEBUG into separate test(s) since having these
*51c0b2f7Stbbdev// parts in all of tests might make testing of the product, which is different from what is actually
*51c0b2f7Stbbdev// released.
*51c0b2f7Stbbdev#define __TBB_EXTRA_DEBUG 1
*51c0b2f7Stbbdev#include "tbb/flow_graph.h"
*51c0b2f7Stbbdev#include "tbb/spin_rw_mutex.h"
*51c0b2f7Stbbdev#include "tbb/global_control.h"
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#include "common/test.h"
*51c0b2f7Stbbdev#include "common/utils.h"
*51c0b2f7Stbbdev#include "common/graph_utils.h"
*51c0b2f7Stbbdev#include "common/test_follows_and_precedes_api.h"
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev//! \file test_function_node.cpp
*51c0b2f7Stbbdev//! \brief Test for [flow_graph.function_node] specification
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#define N 100
*51c0b2f7Stbbdev#define MAX_NODES 4
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev//! Performs test on function nodes with limited concurrency and buffering
*51c0b2f7Stbbdev/** These tests check:
*51c0b2f7Stbbdev    1) that the number of executing copies never exceed the concurrency limit
*51c0b2f7Stbbdev    2) that the node never rejects
*51c0b2f7Stbbdev    3) that no items are lost
*51c0b2f7Stbbdev    and 4) all of this happens even if there are multiple predecessors and successors
*51c0b2f7Stbbdev*/
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevtemplate<typename IO>
*51c0b2f7Stbbdevstruct pass_through {
*51c0b2f7Stbbdev    IO operator()(const IO& i) { return i; }
*51c0b2f7Stbbdev};
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevtemplate< typename InputType, typename OutputType, typename Body >
*51c0b2f7Stbbdevvoid buffered_levels( size_t concurrency, Body body ) {
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev   // Do for lc = 1 to concurrency level
*51c0b2f7Stbbdev   for ( size_t lc = 1; lc <= concurrency; ++lc ) {
*51c0b2f7Stbbdev   tbb::flow::graph g;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev   // Set the execute_counter back to zero in the harness
*51c0b2f7Stbbdev   harness_graph_executor<InputType, OutputType>::execute_count = 0;
*51c0b2f7Stbbdev   // Set the number of current executors to zero.
*51c0b2f7Stbbdev   harness_graph_executor<InputType, OutputType>::current_executors = 0;
*51c0b2f7Stbbdev   // Set the max allowed executors to lc.  There is a check in the functor to make sure this is never exceeded.
*51c0b2f7Stbbdev   harness_graph_executor<InputType, OutputType>::max_executors = lc;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev   // Create the function_node with the appropriate concurrency level, and use default buffering
*51c0b2f7Stbbdev   tbb::flow::function_node< InputType, OutputType > exe_node( g, lc, body );
*51c0b2f7Stbbdev   tbb::flow::function_node<InputType, InputType> pass_thru( g, tbb::flow::unlimited, pass_through<InputType>());
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev   // Create a vector of identical exe_nodes and pass_thrus
*51c0b2f7Stbbdev   std::vector< tbb::flow::function_node< InputType, OutputType > > exe_vec(2, exe_node);
*51c0b2f7Stbbdev   std::vector< tbb::flow::function_node< InputType, InputType > > pass_thru_vec(2, pass_thru);
*51c0b2f7Stbbdev   // Attach each pass_thru to its corresponding exe_node
*51c0b2f7Stbbdev   for (size_t node_idx=0; node_idx<exe_vec.size(); ++node_idx) {
*51c0b2f7Stbbdev       tbb::flow::make_edge(pass_thru_vec[node_idx], exe_vec[node_idx]);
*51c0b2f7Stbbdev   }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev   // TODO: why the test is executed serially for the node pairs, not concurrently?
*51c0b2f7Stbbdev   for (size_t node_idx=0; node_idx<exe_vec.size(); ++node_idx) {
*51c0b2f7Stbbdev   // For num_receivers = 1 to MAX_NODES
*51c0b2f7Stbbdev       for (size_t num_receivers = 1; num_receivers <= MAX_NODES; ++num_receivers ) {
*51c0b2f7Stbbdev           // Create num_receivers counting receivers and connect the exe_vec[node_idx] to them.
*51c0b2f7Stbbdev           std::vector< std::shared_ptr<harness_mapped_receiver<OutputType>> > receivers;
*51c0b2f7Stbbdev           for (size_t i = 0; i < num_receivers; i++) {
*51c0b2f7Stbbdev               receivers.push_back( std::make_shared<harness_mapped_receiver<OutputType>>(g) );
*51c0b2f7Stbbdev           }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev           for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev               tbb::flow::make_edge( exe_vec[node_idx], *receivers[r] );
*51c0b2f7Stbbdev           }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev           // Do the test with varying numbers of senders
*51c0b2f7Stbbdev           std::vector< std::shared_ptr<harness_counting_sender<InputType>> > senders;
*51c0b2f7Stbbdev           for (size_t num_senders = 1; num_senders <= MAX_NODES; ++num_senders ) {
*51c0b2f7Stbbdev               // Create num_senders senders, set there message limit each to N, and connect them to
*51c0b2f7Stbbdev               // pass_thru_vec[node_idx]
*51c0b2f7Stbbdev               senders.clear();
*51c0b2f7Stbbdev               for (size_t s = 0; s < num_senders; ++s ) {
*51c0b2f7Stbbdev                   senders.push_back( std::make_shared<harness_counting_sender<InputType>>() );
*51c0b2f7Stbbdev                   senders.back()->my_limit = N;
*51c0b2f7Stbbdev                   senders.back()->register_successor(pass_thru_vec[node_idx] );
*51c0b2f7Stbbdev               }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev               // Initialize the receivers so they know how many senders and messages to check for
*51c0b2f7Stbbdev               for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev                   receivers[r]->initialize_map( N, num_senders );
*51c0b2f7Stbbdev               }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev               // Do the test
*51c0b2f7Stbbdev               utils::NativeParallelFor( (int)num_senders, parallel_put_until_limit<InputType>(senders) );
*51c0b2f7Stbbdev               g.wait_for_all();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev               // confirm that each sender was requested from N times
*51c0b2f7Stbbdev               for (size_t s = 0; s < num_senders; ++s ) {
*51c0b2f7Stbbdev                   size_t n = senders[s]->my_received;
*51c0b2f7Stbbdev                   CHECK( n == N );
*51c0b2f7Stbbdev                   CHECK( senders[s]->my_receiver.load(std::memory_order_relaxed) == &pass_thru_vec[node_idx] );
*51c0b2f7Stbbdev               }
*51c0b2f7Stbbdev               // validate the receivers
*51c0b2f7Stbbdev               for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev                   receivers[r]->validate();
*51c0b2f7Stbbdev               }
*51c0b2f7Stbbdev           }
*51c0b2f7Stbbdev           for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev               tbb::flow::remove_edge( exe_vec[node_idx], *receivers[r] );
*51c0b2f7Stbbdev           }
*51c0b2f7Stbbdev           CHECK( exe_vec[node_idx].try_put( InputType() ) == true );
*51c0b2f7Stbbdev           g.wait_for_all();
*51c0b2f7Stbbdev           for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev               // since it's detached, nothing should have changed
*51c0b2f7Stbbdev               receivers[r]->validate();
*51c0b2f7Stbbdev           }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev       } // for num_receivers
*51c0b2f7Stbbdev    } // for node_idx
*51c0b2f7Stbbdev    } // for concurrency level lc
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevconst size_t Offset = 123;
*51c0b2f7Stbbdevstd::atomic<size_t> global_execute_count;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevstruct inc_functor {
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    std::atomic<size_t> local_execute_count;
*51c0b2f7Stbbdev    inc_functor( ) { local_execute_count = 0; }
*51c0b2f7Stbbdev    inc_functor( const inc_functor &f ) { local_execute_count = size_t(f.local_execute_count); }
*51c0b2f7Stbbdev    void operator=( const inc_functor &f ) { local_execute_count = size_t(f.local_execute_count); }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    int operator()( int i ) {
*51c0b2f7Stbbdev       ++global_execute_count;
*51c0b2f7Stbbdev       ++local_execute_count;
*51c0b2f7Stbbdev       return i;
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev};
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevtemplate< typename InputType, typename OutputType >
*51c0b2f7Stbbdevvoid buffered_levels_with_copy( size_t concurrency ) {
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    // Do for lc = 1 to concurrency level
*51c0b2f7Stbbdev    for ( size_t lc = 1; lc <= concurrency; ++lc ) {
*51c0b2f7Stbbdev        tbb::flow::graph g;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev        inc_functor cf;
*51c0b2f7Stbbdev        cf.local_execute_count = Offset;
*51c0b2f7Stbbdev        global_execute_count = Offset;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev        tbb::flow::function_node< InputType, OutputType > exe_node( g, lc, cf );
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev        for (size_t num_receivers = 1; num_receivers <= MAX_NODES; ++num_receivers ) {
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev            std::vector< std::shared_ptr<harness_mapped_receiver<OutputType>> > receivers;
*51c0b2f7Stbbdev            for (size_t i = 0; i < num_receivers; i++) {
*51c0b2f7Stbbdev                receivers.push_back( std::make_shared<harness_mapped_receiver<OutputType>>(g) );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev                tbb::flow::make_edge( exe_node, *receivers[r] );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev            std::vector< std::shared_ptr<harness_counting_sender<InputType>> > senders;
*51c0b2f7Stbbdev            for (size_t num_senders = 1; num_senders <= MAX_NODES; ++num_senders ) {
*51c0b2f7Stbbdev                senders.clear();
*51c0b2f7Stbbdev                for (size_t s = 0; s < num_senders; ++s ) {
*51c0b2f7Stbbdev                    senders.push_back( std::make_shared<harness_counting_sender<InputType>>() );
*51c0b2f7Stbbdev                    senders.back()->my_limit = N;
*51c0b2f7Stbbdev                    tbb::flow::make_edge( *senders.back(), exe_node );
*51c0b2f7Stbbdev                }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev                for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev                    receivers[r]->initialize_map( N, num_senders );
*51c0b2f7Stbbdev                }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev                utils::NativeParallelFor( (int)num_senders, parallel_put_until_limit<InputType>(senders) );
*51c0b2f7Stbbdev                g.wait_for_all();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev                for (size_t s = 0; s < num_senders; ++s ) {
*51c0b2f7Stbbdev                    size_t n = senders[s]->my_received;
*51c0b2f7Stbbdev                    CHECK( n == N );
*51c0b2f7Stbbdev                    CHECK( senders[s]->my_receiver.load(std::memory_order_relaxed) == &exe_node );
*51c0b2f7Stbbdev                }
*51c0b2f7Stbbdev                for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev                    receivers[r]->validate();
*51c0b2f7Stbbdev                }
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev                tbb::flow::remove_edge( exe_node, *receivers[r] );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev            CHECK( exe_node.try_put( InputType() ) == true );
*51c0b2f7Stbbdev            g.wait_for_all();
*51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev                receivers[r]->validate();
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev        // validate that the local body matches the global execute_count and both are correct
*51c0b2f7Stbbdev        inc_functor body_copy = tbb::flow::copy_body<inc_functor>( exe_node );
*51c0b2f7Stbbdev        const size_t expected_count = N/2 * MAX_NODES * MAX_NODES * ( MAX_NODES + 1 ) + MAX_NODES + Offset;
*51c0b2f7Stbbdev        size_t global_count = global_execute_count;
*51c0b2f7Stbbdev        size_t inc_count = body_copy.local_execute_count;
*51c0b2f7Stbbdev        CHECK(global_count == expected_count);
*51c0b2f7Stbbdev        CHECK(global_count == inc_count );
*51c0b2f7Stbbdev        g.reset(tbb::flow::rf_reset_bodies);
*51c0b2f7Stbbdev        body_copy = tbb::flow::copy_body<inc_functor>( exe_node );
*51c0b2f7Stbbdev        inc_count = body_copy.local_execute_count;
*51c0b2f7Stbbdev        CHECK_MESSAGE( Offset == inc_count, "reset(rf_reset_bodies) did not reset functor" );
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevtemplate< typename InputType, typename OutputType >
*51c0b2f7Stbbdevvoid run_buffered_levels( int c ) {
*51c0b2f7Stbbdev    buffered_levels<InputType,OutputType>( c, []( InputType i ) -> OutputType { return harness_graph_executor<InputType, OutputType>::func(i); } );
*51c0b2f7Stbbdev    buffered_levels<InputType,OutputType>( c, &harness_graph_executor<InputType, OutputType>::func );
*51c0b2f7Stbbdev    buffered_levels<InputType,OutputType>( c, typename harness_graph_executor<InputType, OutputType>::functor() );
*51c0b2f7Stbbdev    buffered_levels_with_copy<InputType,OutputType>( c );
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev//! Performs test on executable nodes with limited concurrency
*51c0b2f7Stbbdev/** These tests check:
*51c0b2f7Stbbdev    1) that the nodes will accepts puts up to the concurrency limit,
*51c0b2f7Stbbdev    2) the nodes do not exceed the concurrency limit even when run with more threads (this is checked in the harness_graph_executor),
*51c0b2f7Stbbdev    3) the nodes will receive puts from multiple successors simultaneously,
*51c0b2f7Stbbdev    and 4) the nodes will send to multiple predecessors.
*51c0b2f7Stbbdev    There is no checking of the contents of the messages for corruption.
*51c0b2f7Stbbdev*/
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevtemplate< typename InputType, typename OutputType, typename Body >
*51c0b2f7Stbbdevvoid concurrency_levels( size_t concurrency, Body body ) {
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    for ( size_t lc = 1; lc <= concurrency; ++lc ) {
*51c0b2f7Stbbdev        tbb::flow::graph g;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev        // Set the execute_counter back to zero in the harness
*51c0b2f7Stbbdev        harness_graph_executor<InputType, OutputType>::execute_count = 0;
*51c0b2f7Stbbdev        // Set the number of current executors to zero.
*51c0b2f7Stbbdev        harness_graph_executor<InputType, OutputType>::current_executors = 0;
*51c0b2f7Stbbdev        // Set the max allowed executors to lc. There is a check in the functor to make sure this is never exceeded.
*51c0b2f7Stbbdev        harness_graph_executor<InputType, OutputType>::max_executors = lc;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev        typedef tbb::flow::function_node< InputType, OutputType, tbb::flow::rejecting > fnode_type;
*51c0b2f7Stbbdev        fnode_type exe_node( g, lc, body );
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev        for (size_t num_receivers = 1; num_receivers <= MAX_NODES; ++num_receivers ) {
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev            std::vector< std::shared_ptr<harness_counting_receiver<OutputType>> > receivers;
*51c0b2f7Stbbdev            for (size_t i = 0; i < num_receivers; ++i) {
*51c0b2f7Stbbdev                receivers.push_back( std::make_shared<harness_counting_receiver<OutputType>>(g) );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev                tbb::flow::make_edge( exe_node, *receivers[r] );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev            std::vector< std::shared_ptr<harness_counting_sender<InputType>> > senders;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev            for (size_t num_senders = 1; num_senders <= MAX_NODES; ++num_senders ) {
*51c0b2f7Stbbdev                senders.clear();
*51c0b2f7Stbbdev                {
*51c0b2f7Stbbdev                    // Exclusively lock m to prevent exe_node from finishing
*51c0b2f7Stbbdev                    tbb::spin_rw_mutex::scoped_lock l(
*51c0b2f7Stbbdev                        harness_graph_executor<InputType, OutputType>::template mutex_holder<tbb::spin_rw_mutex>::mutex
*51c0b2f7Stbbdev                    );
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev                    // put to lc level, it will accept and then block at m
*51c0b2f7Stbbdev                    for ( size_t c = 0 ; c < lc ; ++c ) {
*51c0b2f7Stbbdev                        CHECK( exe_node.try_put( InputType() ) == true );
*51c0b2f7Stbbdev                    }
*51c0b2f7Stbbdev                    // it only accepts to lc level
*51c0b2f7Stbbdev                    CHECK( exe_node.try_put( InputType() ) == false );
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev                    for (size_t s = 0; s < num_senders; ++s ) {
*51c0b2f7Stbbdev                        senders.push_back( std::make_shared<harness_counting_sender<InputType>>() );
*51c0b2f7Stbbdev                        // register a sender
*51c0b2f7Stbbdev                        senders.back()->my_limit = N;
*51c0b2f7Stbbdev                        exe_node.register_predecessor( *senders.back() );
*51c0b2f7Stbbdev                    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev                } // release lock at end of scope, setting the exe node free to continue
*51c0b2f7Stbbdev                // wait for graph to settle down
*51c0b2f7Stbbdev                g.wait_for_all();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev                // confirm that each sender was requested from N times
*51c0b2f7Stbbdev                for (size_t s = 0; s < num_senders; ++s ) {
*51c0b2f7Stbbdev                    size_t n = senders[s]->my_received;
*51c0b2f7Stbbdev                    CHECK( n == N );
*51c0b2f7Stbbdev                    CHECK( senders[s]->my_receiver.load(std::memory_order_relaxed) == &exe_node );
*51c0b2f7Stbbdev                }
*51c0b2f7Stbbdev                // confirm that each receivers got N * num_senders + the initial lc puts
*51c0b2f7Stbbdev                for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev                    size_t n = receivers[r]->my_count;
*51c0b2f7Stbbdev                    CHECK( n == num_senders*N+lc );
*51c0b2f7Stbbdev                    receivers[r]->my_count = 0;
*51c0b2f7Stbbdev                }
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev                tbb::flow::remove_edge( exe_node, *receivers[r] );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev            CHECK( exe_node.try_put( InputType() ) == true );
*51c0b2f7Stbbdev            g.wait_for_all();
*51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev                CHECK( int(receivers[r]->my_count) == 0 );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevtemplate< typename InputType, typename OutputType >
*51c0b2f7Stbbdevvoid run_concurrency_levels( int c ) {
*51c0b2f7Stbbdev    concurrency_levels<InputType,OutputType>( c, []( InputType i ) -> OutputType { return harness_graph_executor<InputType, OutputType>::template tfunc<tbb::spin_rw_mutex>(i); } );
*51c0b2f7Stbbdev    concurrency_levels<InputType,OutputType>( c, &harness_graph_executor<InputType, OutputType>::template tfunc<tbb::spin_rw_mutex> );
*51c0b2f7Stbbdev    concurrency_levels<InputType,OutputType>( c, typename harness_graph_executor<InputType, OutputType>::template tfunctor<tbb::spin_rw_mutex>() );
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevstruct empty_no_assign {
*51c0b2f7Stbbdev   empty_no_assign() {}
*51c0b2f7Stbbdev   empty_no_assign( int ) {}
*51c0b2f7Stbbdev   operator int() { return 0; }
*51c0b2f7Stbbdev};
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevtemplate< typename InputType >
*51c0b2f7Stbbdevstruct parallel_puts : private utils::NoAssign {
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    tbb::flow::receiver< InputType > * const my_exe_node;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    parallel_puts( tbb::flow::receiver< InputType > &exe_node ) : my_exe_node(&exe_node) {}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    void operator()( int ) const  {
*51c0b2f7Stbbdev        for ( int i = 0; i < N; ++i ) {
*51c0b2f7Stbbdev            // the nodes will accept all puts
*51c0b2f7Stbbdev            CHECK( my_exe_node->try_put( InputType() ) == true );
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev};
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev//! Performs test on executable nodes with unlimited concurrency
*51c0b2f7Stbbdev/** These tests check:
*51c0b2f7Stbbdev    1) that the nodes will accept all puts
*51c0b2f7Stbbdev    2) the nodes will receive puts from multiple predecessors simultaneously,
*51c0b2f7Stbbdev    and 3) the nodes will send to multiple successors.
*51c0b2f7Stbbdev    There is no checking of the contents of the messages for corruption.
*51c0b2f7Stbbdev*/
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevtemplate< typename InputType, typename OutputType, typename Body >
*51c0b2f7Stbbdevvoid unlimited_concurrency( Body body ) {
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    for (unsigned p = 1; p < 2*utils::MaxThread; ++p) {
*51c0b2f7Stbbdev        tbb::flow::graph g;
*51c0b2f7Stbbdev        tbb::flow::function_node< InputType, OutputType, tbb::flow::rejecting > exe_node( g, tbb::flow::unlimited, body );
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev        for (size_t num_receivers = 1; num_receivers <= MAX_NODES; ++num_receivers ) {
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev            std::vector< std::shared_ptr<harness_counting_receiver<OutputType>> > receivers;
*51c0b2f7Stbbdev            for (size_t i = 0; i < num_receivers; ++i) {
*51c0b2f7Stbbdev                receivers.push_back( std::make_shared<harness_counting_receiver<OutputType>>(g) );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev            harness_graph_executor<InputType, OutputType>::execute_count = 0;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev                tbb::flow::make_edge( exe_node, *receivers[r] );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev            utils::NativeParallelFor( p, parallel_puts<InputType>(exe_node) );
*51c0b2f7Stbbdev            g.wait_for_all();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev            // 2) the nodes will receive puts from multiple predecessors simultaneously,
*51c0b2f7Stbbdev            size_t ec = harness_graph_executor<InputType, OutputType>::execute_count;
*51c0b2f7Stbbdev            CHECK( ec == p*N );
*51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev                size_t c = receivers[r]->my_count;
*51c0b2f7Stbbdev                // 3) the nodes will send to multiple successors.
*51c0b2f7Stbbdev                CHECK( c == p*N );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
*51c0b2f7Stbbdev                tbb::flow::remove_edge( exe_node, *receivers[r] );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevtemplate< typename InputType, typename OutputType >
*51c0b2f7Stbbdevvoid run_unlimited_concurrency() {
*51c0b2f7Stbbdev    harness_graph_executor<InputType, OutputType>::max_executors = 0;
*51c0b2f7Stbbdev    unlimited_concurrency<InputType,OutputType>( []( InputType i ) -> OutputType { return harness_graph_executor<InputType, OutputType>::func(i); } );
*51c0b2f7Stbbdev    unlimited_concurrency<InputType,OutputType>( &harness_graph_executor<InputType, OutputType>::func );
*51c0b2f7Stbbdev    unlimited_concurrency<InputType,OutputType>( typename harness_graph_executor<InputType, OutputType>::functor() );
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevstruct continue_msg_to_int {
*51c0b2f7Stbbdev    int my_int;
*51c0b2f7Stbbdev    continue_msg_to_int(int x) : my_int(x) {}
*51c0b2f7Stbbdev    int operator()(tbb::flow::continue_msg) { return my_int; }
*51c0b2f7Stbbdev};
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevvoid test_function_node_with_continue_msg_as_input() {
*51c0b2f7Stbbdev    // If this function terminates, then this test is successful
*51c0b2f7Stbbdev    tbb::flow::graph g;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    tbb::flow::broadcast_node<tbb::flow::continue_msg> Start(g);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    tbb::flow::function_node<tbb::flow::continue_msg, int, tbb::flow::rejecting> FN1( g, tbb::flow::serial, continue_msg_to_int(42));
*51c0b2f7Stbbdev    tbb::flow::function_node<tbb::flow::continue_msg, int, tbb::flow::rejecting> FN2( g, tbb::flow::serial, continue_msg_to_int(43));
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    tbb::flow::make_edge( Start, FN1 );
*51c0b2f7Stbbdev    tbb::flow::make_edge( Start, FN2 );
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    Start.try_put( tbb::flow::continue_msg() );
*51c0b2f7Stbbdev    g.wait_for_all();
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev//! Tests limited concurrency cases for nodes that accept data messages
*51c0b2f7Stbbdevvoid test_concurrency(int num_threads) {
*51c0b2f7Stbbdev    tbb::global_control thread_limit(tbb::global_control::max_allowed_parallelism, num_threads);
*51c0b2f7Stbbdev    run_concurrency_levels<int,int>(num_threads);
*51c0b2f7Stbbdev    run_concurrency_levels<int,tbb::flow::continue_msg>(num_threads);
*51c0b2f7Stbbdev    run_buffered_levels<int, int>(num_threads);
*51c0b2f7Stbbdev    run_unlimited_concurrency<int,int>();
*51c0b2f7Stbbdev    run_unlimited_concurrency<int,empty_no_assign>();
*51c0b2f7Stbbdev    run_unlimited_concurrency<empty_no_assign,int>();
*51c0b2f7Stbbdev    run_unlimited_concurrency<empty_no_assign,empty_no_assign>();
*51c0b2f7Stbbdev    run_unlimited_concurrency<int,tbb::flow::continue_msg>();
*51c0b2f7Stbbdev    run_unlimited_concurrency<empty_no_assign,tbb::flow::continue_msg>();
*51c0b2f7Stbbdev    test_function_node_with_continue_msg_as_input();
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#if __TBB_PREVIEW_FLOW_GRAPH_NODE_SET
*51c0b2f7Stbbdev#include <array>
*51c0b2f7Stbbdev#include <vector>
*51c0b2f7Stbbdevvoid test_follows_and_precedes_api() {
*51c0b2f7Stbbdev    using msg_t = tbb::flow::continue_msg;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    std::array<msg_t, 3> messages_for_follows = { {msg_t(), msg_t(), msg_t()} };
*51c0b2f7Stbbdev    std::vector<msg_t> messages_for_precedes = { msg_t() };
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    pass_through<msg_t> pass_msg;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    follows_and_precedes_testing::test_follows
*51c0b2f7Stbbdev        <msg_t, tbb::flow::function_node<msg_t, msg_t>>
*51c0b2f7Stbbdev        (messages_for_follows, tbb::flow::unlimited, pass_msg);
*51c0b2f7Stbbdev    follows_and_precedes_testing::test_precedes
*51c0b2f7Stbbdev        <msg_t, tbb::flow::function_node<msg_t, msg_t>>
*51c0b2f7Stbbdev        (messages_for_precedes, tbb::flow::unlimited, pass_msg, tbb::flow::node_priority_t(1));
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#if __TBB_CPP17_DEDUCTION_GUIDES_PRESENT
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevint function_body_f(const int&) { return 1; }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevtemplate <typename Body>
*51c0b2f7Stbbdevvoid test_deduction_guides_common(Body body) {
*51c0b2f7Stbbdev    using namespace tbb::flow;
*51c0b2f7Stbbdev    graph g;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    function_node f1(g, unlimited, body);
*51c0b2f7Stbbdev    static_assert(std::is_same_v<decltype(f1), function_node<int, int>>);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    function_node f2(g, unlimited, body, rejecting());
*51c0b2f7Stbbdev    static_assert(std::is_same_v<decltype(f2), function_node<int, int, rejecting>>);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    function_node f3(g, unlimited, body, node_priority_t(5));
*51c0b2f7Stbbdev    static_assert(std::is_same_v<decltype(f3), function_node<int, int>>);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    function_node f4(g, unlimited, body, rejecting(), node_priority_t(5));
*51c0b2f7Stbbdev    static_assert(std::is_same_v<decltype(f4), function_node<int, int, rejecting>>);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#if __TBB_PREVIEW_FLOW_GRAPH_NODE_SET
*51c0b2f7Stbbdev    function_node f5(follows(f2), unlimited, body);
*51c0b2f7Stbbdev    static_assert(std::is_same_v<decltype(f5), function_node<int, int>>);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    function_node f6(follows(f5), unlimited, body, rejecting());
*51c0b2f7Stbbdev    static_assert(std::is_same_v<decltype(f6), function_node<int, int, rejecting>>);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    function_node f7(follows(f6), unlimited, body, node_priority_t(5));
*51c0b2f7Stbbdev    static_assert(std::is_same_v<decltype(f7), function_node<int, int>>);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    function_node f8(follows(f7), unlimited, body, rejecting(), node_priority_t(5));
*51c0b2f7Stbbdev    static_assert(std::is_same_v<decltype(f8), function_node<int, int, rejecting>>);
*51c0b2f7Stbbdev#endif // __TBB_PREVIEW_FLOW_GRAPH_NODE_SET
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    function_node f9(f1);
*51c0b2f7Stbbdev    static_assert(std::is_same_v<decltype(f9), function_node<int, int>>);
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevvoid test_deduction_guides() {
*51c0b2f7Stbbdev    test_deduction_guides_common([](const int&)->int { return 1; });
*51c0b2f7Stbbdev    test_deduction_guides_common([](const int&) mutable ->int { return 1; });
*51c0b2f7Stbbdev    test_deduction_guides_common(function_body_f);
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev//! Test various node bodies with concurrency
*51c0b2f7Stbbdev//! \brief \ref error_guessing
*51c0b2f7StbbdevTEST_CASE("Concurrency test") {
*51c0b2f7Stbbdev    for(unsigned int p = utils::MinThread; p <= utils::MaxThread; ++p ) {
*51c0b2f7Stbbdev        test_concurrency(p);
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev//! NativeParallelFor testing with various concurrency settings
*51c0b2f7Stbbdev//! \brief \ref error_guessing
*51c0b2f7StbbdevTEST_CASE("Lightweight testing"){
*51c0b2f7Stbbdev   lightweight_testing::test<tbb::flow::function_node>(10);
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#if __TBB_PREVIEW_FLOW_GRAPH_NODE_SET
*51c0b2f7Stbbdev//! Test follows and precedes API
*51c0b2f7Stbbdev//! \brief \ref error_guessing
*51c0b2f7StbbdevTEST_CASE("Flowgraph node set test"){
*51c0b2f7Stbbdev     test_follows_and_precedes_api();
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#if __TBB_CPP17_DEDUCTION_GUIDES_PRESENT
*51c0b2f7Stbbdev//! Test decution guides
*51c0b2f7Stbbdev//! \brief \ref requirement
*51c0b2f7StbbdevTEST_CASE("Deduction guides test"){
*51c0b2f7Stbbdev     test_deduction_guides();
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev//! try_release and try_consume test
*51c0b2f7Stbbdev//! \brief \ref error_guessing
*51c0b2f7StbbdevTEST_CASE("try_release try_consume"){
*51c0b2f7Stbbdev    tbb::flow::graph g;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    tbb::flow::function_node<int, int> fn(g, tbb::flow::unlimited, [](const int&v){return v;});
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    CHECK_MESSAGE((fn.try_release()==false), "try_release should initially return false on a node");
*51c0b2f7Stbbdev    CHECK_MESSAGE((fn.try_consume()==false), "try_consume should initially return false on a node");
*51c0b2f7Stbbdev}