test/tbb/test_function_node.cpp

51c0b2f7Stbbdev/*
b15aabb3Stbbdev    Copyright (c) 2005-2021 Intel Corporation
51c0b2f7Stbbdev
51c0b2f7Stbbdev    Licensed under the Apache License, Version 2.0 (the "License");
51c0b2f7Stbbdev    you may not use this file except in compliance with the License.
51c0b2f7Stbbdev    You may obtain a copy of the License at
51c0b2f7Stbbdev
51c0b2f7Stbbdev        http://www.apache.org/licenses/LICENSE-2.0
51c0b2f7Stbbdev
51c0b2f7Stbbdev    Unless required by applicable law or agreed to in writing, software
51c0b2f7Stbbdev    distributed under the License is distributed on an "AS IS" BASIS,
51c0b2f7Stbbdev    WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
51c0b2f7Stbbdev    See the License for the specific language governing permissions and
51c0b2f7Stbbdev    limitations under the License.
51c0b2f7Stbbdev*/
51c0b2f7Stbbdev
b15aabb3Stbbdev#if __INTEL_COMPILER && _MSC_VER
b15aabb3Stbbdev#pragma warning(disable : 2586) // decorated name length exceeded, name was truncated
b15aabb3Stbbdev#endif
b15aabb3Stbbdev
51c0b2f7Stbbdev#include "common/config.h"
51c0b2f7Stbbdev
51c0b2f7Stbbdev#include "tbb/flow_graph.h"
51c0b2f7Stbbdev#include "tbb/spin_rw_mutex.h"
51c0b2f7Stbbdev#include "tbb/global_control.h"
51c0b2f7Stbbdev
51c0b2f7Stbbdev#include "common/test.h"
51c0b2f7Stbbdev#include "common/utils.h"
51c0b2f7Stbbdev#include "common/graph_utils.h"
51c0b2f7Stbbdev#include "common/test_follows_and_precedes_api.h"
*478de5b1Stbbdev#include "common/concepts_common.h"
51c0b2f7Stbbdev
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! \file test_function_node.cpp
51c0b2f7Stbbdev//! \brief Test for [flow_graph.function_node] specification
51c0b2f7Stbbdev
51c0b2f7Stbbdev
51c0b2f7Stbbdev#define N 100
51c0b2f7Stbbdev#define MAX_NODES 4
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! Performs test on function nodes with limited concurrency and buffering
51c0b2f7Stbbdev/** These tests check:
51c0b2f7Stbbdev    1) that the number of executing copies never exceed the concurrency limit
51c0b2f7Stbbdev    2) that the node never rejects
51c0b2f7Stbbdev    3) that no items are lost
51c0b2f7Stbbdev    and 4) all of this happens even if there are multiple predecessors and successors
51c0b2f7Stbbdev*/
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<typename IO>
51c0b2f7Stbbdevstruct pass_through {
51c0b2f7Stbbdev    IO operator()(const IO& i) { return i; }
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate< typename InputType, typename OutputType, typename Body >
51c0b2f7Stbbdevvoid buffered_levels( size_t concurrency, Body body ) {
51c0b2f7Stbbdev
51c0b2f7Stbbdev   // Do for lc = 1 to concurrency level
51c0b2f7Stbbdev   for ( size_t lc = 1; lc <= concurrency; ++lc ) {
51c0b2f7Stbbdev   tbb::flow::graph g;
51c0b2f7Stbbdev
51c0b2f7Stbbdev   // Set the execute_counter back to zero in the harness
51c0b2f7Stbbdev   harness_graph_executor<InputType, OutputType>::execute_count = 0;
51c0b2f7Stbbdev   // Set the number of current executors to zero.
51c0b2f7Stbbdev   harness_graph_executor<InputType, OutputType>::current_executors = 0;
51c0b2f7Stbbdev   // Set the max allowed executors to lc.  There is a check in the functor to make sure this is never exceeded.
51c0b2f7Stbbdev   harness_graph_executor<InputType, OutputType>::max_executors = lc;
51c0b2f7Stbbdev
51c0b2f7Stbbdev   // Create the function_node with the appropriate concurrency level, and use default buffering
51c0b2f7Stbbdev   tbb::flow::function_node< InputType, OutputType > exe_node( g, lc, body );
51c0b2f7Stbbdev   tbb::flow::function_node<InputType, InputType> pass_thru( g, tbb::flow::unlimited, pass_through<InputType>());
51c0b2f7Stbbdev
51c0b2f7Stbbdev   // Create a vector of identical exe_nodes and pass_thrus
51c0b2f7Stbbdev   std::vector< tbb::flow::function_node< InputType, OutputType > > exe_vec(2, exe_node);
51c0b2f7Stbbdev   std::vector< tbb::flow::function_node< InputType, InputType > > pass_thru_vec(2, pass_thru);
51c0b2f7Stbbdev   // Attach each pass_thru to its corresponding exe_node
51c0b2f7Stbbdev   for (size_t node_idx=0; node_idx<exe_vec.size(); ++node_idx) {
51c0b2f7Stbbdev       tbb::flow::make_edge(pass_thru_vec[node_idx], exe_vec[node_idx]);
51c0b2f7Stbbdev   }
51c0b2f7Stbbdev
51c0b2f7Stbbdev   // TODO: why the test is executed serially for the node pairs, not concurrently?
51c0b2f7Stbbdev   for (size_t node_idx=0; node_idx<exe_vec.size(); ++node_idx) {
51c0b2f7Stbbdev   // For num_receivers = 1 to MAX_NODES
51c0b2f7Stbbdev       for (size_t num_receivers = 1; num_receivers <= MAX_NODES; ++num_receivers ) {
51c0b2f7Stbbdev           // Create num_receivers counting receivers and connect the exe_vec[node_idx] to them.
51c0b2f7Stbbdev           std::vector< std::shared_ptr<harness_mapped_receiver<OutputType>> > receivers;
51c0b2f7Stbbdev           for (size_t i = 0; i < num_receivers; i++) {
51c0b2f7Stbbdev               receivers.push_back( std::make_shared<harness_mapped_receiver<OutputType>>(g) );
51c0b2f7Stbbdev           }
51c0b2f7Stbbdev
51c0b2f7Stbbdev           for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev               tbb::flow::make_edge( exe_vec[node_idx], *receivers[r] );
51c0b2f7Stbbdev           }
51c0b2f7Stbbdev
51c0b2f7Stbbdev           // Do the test with varying numbers of senders
51c0b2f7Stbbdev           std::vector< std::shared_ptr<harness_counting_sender<InputType>> > senders;
51c0b2f7Stbbdev           for (size_t num_senders = 1; num_senders <= MAX_NODES; ++num_senders ) {
51c0b2f7Stbbdev               // Create num_senders senders, set there message limit each to N, and connect them to
51c0b2f7Stbbdev               // pass_thru_vec[node_idx]
51c0b2f7Stbbdev               senders.clear();
51c0b2f7Stbbdev               for (size_t s = 0; s < num_senders; ++s ) {
51c0b2f7Stbbdev                   senders.push_back( std::make_shared<harness_counting_sender<InputType>>() );
51c0b2f7Stbbdev                   senders.back()->my_limit = N;
51c0b2f7Stbbdev                   senders.back()->register_successor(pass_thru_vec[node_idx] );
51c0b2f7Stbbdev               }
51c0b2f7Stbbdev
51c0b2f7Stbbdev               // Initialize the receivers so they know how many senders and messages to check for
51c0b2f7Stbbdev               for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev                   receivers[r]->initialize_map( N, num_senders );
51c0b2f7Stbbdev               }
51c0b2f7Stbbdev
51c0b2f7Stbbdev               // Do the test
51c0b2f7Stbbdev               utils::NativeParallelFor( (int)num_senders, parallel_put_until_limit<InputType>(senders) );
51c0b2f7Stbbdev               g.wait_for_all();
51c0b2f7Stbbdev
51c0b2f7Stbbdev               // confirm that each sender was requested from N times
51c0b2f7Stbbdev               for (size_t s = 0; s < num_senders; ++s ) {
51c0b2f7Stbbdev                   size_t n = senders[s]->my_received;
51c0b2f7Stbbdev                   CHECK( n == N );
51c0b2f7Stbbdev                   CHECK( senders[s]->my_receiver.load(std::memory_order_relaxed) == &pass_thru_vec[node_idx] );
51c0b2f7Stbbdev               }
51c0b2f7Stbbdev               // validate the receivers
51c0b2f7Stbbdev               for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev                   receivers[r]->validate();
51c0b2f7Stbbdev               }
51c0b2f7Stbbdev           }
51c0b2f7Stbbdev           for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev               tbb::flow::remove_edge( exe_vec[node_idx], *receivers[r] );
51c0b2f7Stbbdev           }
51c0b2f7Stbbdev           CHECK( exe_vec[node_idx].try_put( InputType() ) == true );
51c0b2f7Stbbdev           g.wait_for_all();
51c0b2f7Stbbdev           for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev               // since it's detached, nothing should have changed
51c0b2f7Stbbdev               receivers[r]->validate();
51c0b2f7Stbbdev           }
51c0b2f7Stbbdev
51c0b2f7Stbbdev       } // for num_receivers
51c0b2f7Stbbdev    } // for node_idx
51c0b2f7Stbbdev    } // for concurrency level lc
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevconst size_t Offset = 123;
51c0b2f7Stbbdevstd::atomic<size_t> global_execute_count;
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct inc_functor {
51c0b2f7Stbbdev
51c0b2f7Stbbdev    std::atomic<size_t> local_execute_count;
51c0b2f7Stbbdev    inc_functor( ) { local_execute_count = 0; }
51c0b2f7Stbbdev    inc_functor( const inc_functor &f ) { local_execute_count = size_t(f.local_execute_count); }
51c0b2f7Stbbdev    void operator=( const inc_functor &f ) { local_execute_count = size_t(f.local_execute_count); }
51c0b2f7Stbbdev
51c0b2f7Stbbdev    int operator()( int i ) {
51c0b2f7Stbbdev       ++global_execute_count;
51c0b2f7Stbbdev       ++local_execute_count;
51c0b2f7Stbbdev       return i;
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate< typename InputType, typename OutputType >
51c0b2f7Stbbdevvoid buffered_levels_with_copy( size_t concurrency ) {
51c0b2f7Stbbdev
51c0b2f7Stbbdev    // Do for lc = 1 to concurrency level
51c0b2f7Stbbdev    for ( size_t lc = 1; lc <= concurrency; ++lc ) {
51c0b2f7Stbbdev        tbb::flow::graph g;
51c0b2f7Stbbdev
51c0b2f7Stbbdev        inc_functor cf;
51c0b2f7Stbbdev        cf.local_execute_count = Offset;
51c0b2f7Stbbdev        global_execute_count = Offset;
51c0b2f7Stbbdev
51c0b2f7Stbbdev        tbb::flow::function_node< InputType, OutputType > exe_node( g, lc, cf );
51c0b2f7Stbbdev
51c0b2f7Stbbdev        for (size_t num_receivers = 1; num_receivers <= MAX_NODES; ++num_receivers ) {
51c0b2f7Stbbdev
51c0b2f7Stbbdev            std::vector< std::shared_ptr<harness_mapped_receiver<OutputType>> > receivers;
51c0b2f7Stbbdev            for (size_t i = 0; i < num_receivers; i++) {
51c0b2f7Stbbdev                receivers.push_back( std::make_shared<harness_mapped_receiver<OutputType>>(g) );
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev
51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev                tbb::flow::make_edge( exe_node, *receivers[r] );
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev
51c0b2f7Stbbdev            std::vector< std::shared_ptr<harness_counting_sender<InputType>> > senders;
51c0b2f7Stbbdev            for (size_t num_senders = 1; num_senders <= MAX_NODES; ++num_senders ) {
51c0b2f7Stbbdev                senders.clear();
51c0b2f7Stbbdev                for (size_t s = 0; s < num_senders; ++s ) {
51c0b2f7Stbbdev                    senders.push_back( std::make_shared<harness_counting_sender<InputType>>() );
51c0b2f7Stbbdev                    senders.back()->my_limit = N;
51c0b2f7Stbbdev                    tbb::flow::make_edge( *senders.back(), exe_node );
51c0b2f7Stbbdev                }
51c0b2f7Stbbdev
51c0b2f7Stbbdev                for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev                    receivers[r]->initialize_map( N, num_senders );
51c0b2f7Stbbdev                }
51c0b2f7Stbbdev
51c0b2f7Stbbdev                utils::NativeParallelFor( (int)num_senders, parallel_put_until_limit<InputType>(senders) );
51c0b2f7Stbbdev                g.wait_for_all();
51c0b2f7Stbbdev
51c0b2f7Stbbdev                for (size_t s = 0; s < num_senders; ++s ) {
51c0b2f7Stbbdev                    size_t n = senders[s]->my_received;
51c0b2f7Stbbdev                    CHECK( n == N );
51c0b2f7Stbbdev                    CHECK( senders[s]->my_receiver.load(std::memory_order_relaxed) == &exe_node );
51c0b2f7Stbbdev                }
51c0b2f7Stbbdev                for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev                    receivers[r]->validate();
51c0b2f7Stbbdev                }
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev                tbb::flow::remove_edge( exe_node, *receivers[r] );
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev            CHECK( exe_node.try_put( InputType() ) == true );
51c0b2f7Stbbdev            g.wait_for_all();
51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev                receivers[r]->validate();
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev        }
51c0b2f7Stbbdev
51c0b2f7Stbbdev        // validate that the local body matches the global execute_count and both are correct
51c0b2f7Stbbdev        inc_functor body_copy = tbb::flow::copy_body<inc_functor>( exe_node );
51c0b2f7Stbbdev        const size_t expected_count = N/2 * MAX_NODES * MAX_NODES * ( MAX_NODES + 1 ) + MAX_NODES + Offset;
51c0b2f7Stbbdev        size_t global_count = global_execute_count;
51c0b2f7Stbbdev        size_t inc_count = body_copy.local_execute_count;
51c0b2f7Stbbdev        CHECK(global_count == expected_count);
51c0b2f7Stbbdev        CHECK(global_count == inc_count );
51c0b2f7Stbbdev        g.reset(tbb::flow::rf_reset_bodies);
51c0b2f7Stbbdev        body_copy = tbb::flow::copy_body<inc_functor>( exe_node );
51c0b2f7Stbbdev        inc_count = body_copy.local_execute_count;
51c0b2f7Stbbdev        CHECK_MESSAGE( Offset == inc_count, "reset(rf_reset_bodies) did not reset functor" );
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate< typename InputType, typename OutputType >
51c0b2f7Stbbdevvoid run_buffered_levels( int c ) {
51c0b2f7Stbbdev    buffered_levels<InputType,OutputType>( c, []( InputType i ) -> OutputType { return harness_graph_executor<InputType, OutputType>::func(i); } );
51c0b2f7Stbbdev    buffered_levels<InputType,OutputType>( c, &harness_graph_executor<InputType, OutputType>::func );
51c0b2f7Stbbdev    buffered_levels<InputType,OutputType>( c, typename harness_graph_executor<InputType, OutputType>::functor() );
51c0b2f7Stbbdev    buffered_levels_with_copy<InputType,OutputType>( c );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! Performs test on executable nodes with limited concurrency
51c0b2f7Stbbdev/** These tests check:
51c0b2f7Stbbdev    1) that the nodes will accepts puts up to the concurrency limit,
51c0b2f7Stbbdev    2) the nodes do not exceed the concurrency limit even when run with more threads (this is checked in the harness_graph_executor),
51c0b2f7Stbbdev    3) the nodes will receive puts from multiple successors simultaneously,
51c0b2f7Stbbdev    and 4) the nodes will send to multiple predecessors.
51c0b2f7Stbbdev    There is no checking of the contents of the messages for corruption.
51c0b2f7Stbbdev*/
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate< typename InputType, typename OutputType, typename Body >
51c0b2f7Stbbdevvoid concurrency_levels( size_t concurrency, Body body ) {
51c0b2f7Stbbdev
51c0b2f7Stbbdev    for ( size_t lc = 1; lc <= concurrency; ++lc ) {
51c0b2f7Stbbdev        tbb::flow::graph g;
51c0b2f7Stbbdev
51c0b2f7Stbbdev        // Set the execute_counter back to zero in the harness
51c0b2f7Stbbdev        harness_graph_executor<InputType, OutputType>::execute_count = 0;
51c0b2f7Stbbdev        // Set the number of current executors to zero.
51c0b2f7Stbbdev        harness_graph_executor<InputType, OutputType>::current_executors = 0;
51c0b2f7Stbbdev        // Set the max allowed executors to lc. There is a check in the functor to make sure this is never exceeded.
51c0b2f7Stbbdev        harness_graph_executor<InputType, OutputType>::max_executors = lc;
51c0b2f7Stbbdev
51c0b2f7Stbbdev        typedef tbb::flow::function_node< InputType, OutputType, tbb::flow::rejecting > fnode_type;
51c0b2f7Stbbdev        fnode_type exe_node( g, lc, body );
51c0b2f7Stbbdev
51c0b2f7Stbbdev        for (size_t num_receivers = 1; num_receivers <= MAX_NODES; ++num_receivers ) {
51c0b2f7Stbbdev
51c0b2f7Stbbdev            std::vector< std::shared_ptr<harness_counting_receiver<OutputType>> > receivers;
51c0b2f7Stbbdev            for (size_t i = 0; i < num_receivers; ++i) {
51c0b2f7Stbbdev                receivers.push_back( std::make_shared<harness_counting_receiver<OutputType>>(g) );
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev
51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev                tbb::flow::make_edge( exe_node, *receivers[r] );
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev
51c0b2f7Stbbdev            std::vector< std::shared_ptr<harness_counting_sender<InputType>> > senders;
51c0b2f7Stbbdev
51c0b2f7Stbbdev            for (size_t num_senders = 1; num_senders <= MAX_NODES; ++num_senders ) {
51c0b2f7Stbbdev                senders.clear();
51c0b2f7Stbbdev                {
51c0b2f7Stbbdev                    // Exclusively lock m to prevent exe_node from finishing
51c0b2f7Stbbdev                    tbb::spin_rw_mutex::scoped_lock l(
51c0b2f7Stbbdev                        harness_graph_executor<InputType, OutputType>::template mutex_holder<tbb::spin_rw_mutex>::mutex
51c0b2f7Stbbdev                    );
51c0b2f7Stbbdev
51c0b2f7Stbbdev                    // put to lc level, it will accept and then block at m
51c0b2f7Stbbdev                    for ( size_t c = 0 ; c < lc ; ++c ) {
51c0b2f7Stbbdev                        CHECK( exe_node.try_put( InputType() ) == true );
51c0b2f7Stbbdev                    }
51c0b2f7Stbbdev                    // it only accepts to lc level
51c0b2f7Stbbdev                    CHECK( exe_node.try_put( InputType() ) == false );
51c0b2f7Stbbdev
51c0b2f7Stbbdev                    for (size_t s = 0; s < num_senders; ++s ) {
51c0b2f7Stbbdev                        senders.push_back( std::make_shared<harness_counting_sender<InputType>>() );
51c0b2f7Stbbdev                        // register a sender
51c0b2f7Stbbdev                        senders.back()->my_limit = N;
51c0b2f7Stbbdev                        exe_node.register_predecessor( *senders.back() );
51c0b2f7Stbbdev                    }
51c0b2f7Stbbdev
51c0b2f7Stbbdev                } // release lock at end of scope, setting the exe node free to continue
51c0b2f7Stbbdev                // wait for graph to settle down
51c0b2f7Stbbdev                g.wait_for_all();
51c0b2f7Stbbdev
51c0b2f7Stbbdev                // confirm that each sender was requested from N times
51c0b2f7Stbbdev                for (size_t s = 0; s < num_senders; ++s ) {
51c0b2f7Stbbdev                    size_t n = senders[s]->my_received;
51c0b2f7Stbbdev                    CHECK( n == N );
51c0b2f7Stbbdev                    CHECK( senders[s]->my_receiver.load(std::memory_order_relaxed) == &exe_node );
51c0b2f7Stbbdev                }
51c0b2f7Stbbdev                // confirm that each receivers got N * num_senders + the initial lc puts
51c0b2f7Stbbdev                for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev                    size_t n = receivers[r]->my_count;
51c0b2f7Stbbdev                    CHECK( n == num_senders*N+lc );
51c0b2f7Stbbdev                    receivers[r]->my_count = 0;
51c0b2f7Stbbdev                }
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev                tbb::flow::remove_edge( exe_node, *receivers[r] );
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev            CHECK( exe_node.try_put( InputType() ) == true );
51c0b2f7Stbbdev            g.wait_for_all();
51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev                CHECK( int(receivers[r]->my_count) == 0 );
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev        }
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate< typename InputType, typename OutputType >
51c0b2f7Stbbdevvoid run_concurrency_levels( int c ) {
51c0b2f7Stbbdev    concurrency_levels<InputType,OutputType>( c, []( InputType i ) -> OutputType { return harness_graph_executor<InputType, OutputType>::template tfunc<tbb::spin_rw_mutex>(i); } );
51c0b2f7Stbbdev    concurrency_levels<InputType,OutputType>( c, &harness_graph_executor<InputType, OutputType>::template tfunc<tbb::spin_rw_mutex> );
51c0b2f7Stbbdev    concurrency_levels<InputType,OutputType>( c, typename harness_graph_executor<InputType, OutputType>::template tfunctor<tbb::spin_rw_mutex>() );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct empty_no_assign {
51c0b2f7Stbbdev   empty_no_assign() {}
51c0b2f7Stbbdev   empty_no_assign( int ) {}
51c0b2f7Stbbdev   operator int() { return 0; }
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate< typename InputType >
51c0b2f7Stbbdevstruct parallel_puts : private utils::NoAssign {
51c0b2f7Stbbdev
51c0b2f7Stbbdev    tbb::flow::receiver< InputType > * const my_exe_node;
51c0b2f7Stbbdev
51c0b2f7Stbbdev    parallel_puts( tbb::flow::receiver< InputType > &exe_node ) : my_exe_node(&exe_node) {}
51c0b2f7Stbbdev
51c0b2f7Stbbdev    void operator()( int ) const  {
51c0b2f7Stbbdev        for ( int i = 0; i < N; ++i ) {
51c0b2f7Stbbdev            // the nodes will accept all puts
51c0b2f7Stbbdev            CHECK( my_exe_node->try_put( InputType() ) == true );
51c0b2f7Stbbdev        }
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! Performs test on executable nodes with unlimited concurrency
51c0b2f7Stbbdev/** These tests check:
51c0b2f7Stbbdev    1) that the nodes will accept all puts
51c0b2f7Stbbdev    2) the nodes will receive puts from multiple predecessors simultaneously,
51c0b2f7Stbbdev    and 3) the nodes will send to multiple successors.
51c0b2f7Stbbdev    There is no checking of the contents of the messages for corruption.
51c0b2f7Stbbdev*/
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate< typename InputType, typename OutputType, typename Body >
51c0b2f7Stbbdevvoid unlimited_concurrency( Body body ) {
51c0b2f7Stbbdev
51c0b2f7Stbbdev    for (unsigned p = 1; p < 2*utils::MaxThread; ++p) {
51c0b2f7Stbbdev        tbb::flow::graph g;
51c0b2f7Stbbdev        tbb::flow::function_node< InputType, OutputType, tbb::flow::rejecting > exe_node( g, tbb::flow::unlimited, body );
51c0b2f7Stbbdev
51c0b2f7Stbbdev        for (size_t num_receivers = 1; num_receivers <= MAX_NODES; ++num_receivers ) {
51c0b2f7Stbbdev
51c0b2f7Stbbdev            std::vector< std::shared_ptr<harness_counting_receiver<OutputType>> > receivers;
51c0b2f7Stbbdev            for (size_t i = 0; i < num_receivers; ++i) {
51c0b2f7Stbbdev                receivers.push_back( std::make_shared<harness_counting_receiver<OutputType>>(g) );
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev
51c0b2f7Stbbdev            harness_graph_executor<InputType, OutputType>::execute_count = 0;
51c0b2f7Stbbdev
51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev                tbb::flow::make_edge( exe_node, *receivers[r] );
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev
51c0b2f7Stbbdev            utils::NativeParallelFor( p, parallel_puts<InputType>(exe_node) );
51c0b2f7Stbbdev            g.wait_for_all();
51c0b2f7Stbbdev
51c0b2f7Stbbdev            // 2) the nodes will receive puts from multiple predecessors simultaneously,
51c0b2f7Stbbdev            size_t ec = harness_graph_executor<InputType, OutputType>::execute_count;
51c0b2f7Stbbdev            CHECK( ec == p*N );
51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev                size_t c = receivers[r]->my_count;
51c0b2f7Stbbdev                // 3) the nodes will send to multiple successors.
51c0b2f7Stbbdev                CHECK( c == p*N );
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev            for (size_t r = 0; r < num_receivers; ++r ) {
51c0b2f7Stbbdev                tbb::flow::remove_edge( exe_node, *receivers[r] );
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev        }
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate< typename InputType, typename OutputType >
51c0b2f7Stbbdevvoid run_unlimited_concurrency() {
51c0b2f7Stbbdev    harness_graph_executor<InputType, OutputType>::max_executors = 0;
51c0b2f7Stbbdev    unlimited_concurrency<InputType,OutputType>( []( InputType i ) -> OutputType { return harness_graph_executor<InputType, OutputType>::func(i); } );
51c0b2f7Stbbdev    unlimited_concurrency<InputType,OutputType>( &harness_graph_executor<InputType, OutputType>::func );
51c0b2f7Stbbdev    unlimited_concurrency<InputType,OutputType>( typename harness_graph_executor<InputType, OutputType>::functor() );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct continue_msg_to_int {
51c0b2f7Stbbdev    int my_int;
51c0b2f7Stbbdev    continue_msg_to_int(int x) : my_int(x) {}
51c0b2f7Stbbdev    int operator()(tbb::flow::continue_msg) { return my_int; }
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevvoid test_function_node_with_continue_msg_as_input() {
51c0b2f7Stbbdev    // If this function terminates, then this test is successful
51c0b2f7Stbbdev    tbb::flow::graph g;
51c0b2f7Stbbdev
51c0b2f7Stbbdev    tbb::flow::broadcast_node<tbb::flow::continue_msg> Start(g);
51c0b2f7Stbbdev
51c0b2f7Stbbdev    tbb::flow::function_node<tbb::flow::continue_msg, int, tbb::flow::rejecting> FN1( g, tbb::flow::serial, continue_msg_to_int(42));
51c0b2f7Stbbdev    tbb::flow::function_node<tbb::flow::continue_msg, int, tbb::flow::rejecting> FN2( g, tbb::flow::serial, continue_msg_to_int(43));
51c0b2f7Stbbdev
51c0b2f7Stbbdev    tbb::flow::make_edge( Start, FN1 );
51c0b2f7Stbbdev    tbb::flow::make_edge( Start, FN2 );
51c0b2f7Stbbdev
51c0b2f7Stbbdev    Start.try_put( tbb::flow::continue_msg() );
51c0b2f7Stbbdev    g.wait_for_all();
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! Tests limited concurrency cases for nodes that accept data messages
51c0b2f7Stbbdevvoid test_concurrency(int num_threads) {
51c0b2f7Stbbdev    tbb::global_control thread_limit(tbb::global_control::max_allowed_parallelism, num_threads);
51c0b2f7Stbbdev    run_concurrency_levels<int,int>(num_threads);
51c0b2f7Stbbdev    run_concurrency_levels<int,tbb::flow::continue_msg>(num_threads);
51c0b2f7Stbbdev    run_buffered_levels<int, int>(num_threads);
51c0b2f7Stbbdev    run_unlimited_concurrency<int,int>();
51c0b2f7Stbbdev    run_unlimited_concurrency<int,empty_no_assign>();
51c0b2f7Stbbdev    run_unlimited_concurrency<empty_no_assign,int>();
51c0b2f7Stbbdev    run_unlimited_concurrency<empty_no_assign,empty_no_assign>();
51c0b2f7Stbbdev    run_unlimited_concurrency<int,tbb::flow::continue_msg>();
51c0b2f7Stbbdev    run_unlimited_concurrency<empty_no_assign,tbb::flow::continue_msg>();
51c0b2f7Stbbdev    test_function_node_with_continue_msg_as_input();
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev#if __TBB_PREVIEW_FLOW_GRAPH_NODE_SET
51c0b2f7Stbbdev#include <array>
51c0b2f7Stbbdev#include <vector>
51c0b2f7Stbbdevvoid test_follows_and_precedes_api() {
51c0b2f7Stbbdev    using msg_t = tbb::flow::continue_msg;
51c0b2f7Stbbdev
51c0b2f7Stbbdev    std::array<msg_t, 3> messages_for_follows = { {msg_t(), msg_t(), msg_t()} };
51c0b2f7Stbbdev    std::vector<msg_t> messages_for_precedes = { msg_t() };
51c0b2f7Stbbdev
51c0b2f7Stbbdev    pass_through<msg_t> pass_msg;
51c0b2f7Stbbdev
51c0b2f7Stbbdev    follows_and_precedes_testing::test_follows
51c0b2f7Stbbdev        <msg_t, tbb::flow::function_node<msg_t, msg_t>>
51c0b2f7Stbbdev        (messages_for_follows, tbb::flow::unlimited, pass_msg);
51c0b2f7Stbbdev    follows_and_precedes_testing::test_precedes
51c0b2f7Stbbdev        <msg_t, tbb::flow::function_node<msg_t, msg_t>>
51c0b2f7Stbbdev        (messages_for_precedes, tbb::flow::unlimited, pass_msg, tbb::flow::node_priority_t(1));
51c0b2f7Stbbdev}
51c0b2f7Stbbdev#endif
51c0b2f7Stbbdev
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! Test various node bodies with concurrency
51c0b2f7Stbbdev//! \brief \ref error_guessing
51c0b2f7StbbdevTEST_CASE("Concurrency test") {
51c0b2f7Stbbdev    for(unsigned int p = utils::MinThread; p <= utils::MaxThread; ++p ) {
51c0b2f7Stbbdev        test_concurrency(p);
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! NativeParallelFor testing with various concurrency settings
51c0b2f7Stbbdev//! \brief \ref error_guessing
51c0b2f7StbbdevTEST_CASE("Lightweight testing"){
51c0b2f7Stbbdev   lightweight_testing::test<tbb::flow::function_node>(10);
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev#if __TBB_PREVIEW_FLOW_GRAPH_NODE_SET
51c0b2f7Stbbdev//! Test follows and precedes API
51c0b2f7Stbbdev//! \brief \ref error_guessing
51c0b2f7StbbdevTEST_CASE("Flowgraph node set test"){
51c0b2f7Stbbdev     test_follows_and_precedes_api();
51c0b2f7Stbbdev}
51c0b2f7Stbbdev#endif
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! try_release and try_consume test
51c0b2f7Stbbdev//! \brief \ref error_guessing
51c0b2f7StbbdevTEST_CASE("try_release try_consume"){
51c0b2f7Stbbdev    tbb::flow::graph g;
51c0b2f7Stbbdev
51c0b2f7Stbbdev    tbb::flow::function_node<int, int> fn(g, tbb::flow::unlimited, [](const int&v){return v;});
51c0b2f7Stbbdev
51c0b2f7Stbbdev    CHECK_MESSAGE((fn.try_release()==false), "try_release should initially return false on a node");
51c0b2f7Stbbdev    CHECK_MESSAGE((fn.try_consume()==false), "try_consume should initially return false on a node");
51c0b2f7Stbbdev}
*478de5b1Stbbdev
*478de5b1Stbbdev#if __TBB_CPP20_CONCEPTS_PRESENT
*478de5b1Stbbdev//! \brief \ref error_guessing
*478de5b1StbbdevTEST_CASE("constraints for function_node input and output") {
*478de5b1Stbbdev    struct InputObject {
*478de5b1Stbbdev        InputObject() = default;
*478de5b1Stbbdev        InputObject( const InputObject& ) = default;
*478de5b1Stbbdev    };
*478de5b1Stbbdev    struct OutputObject : test_concepts::Copyable {};
*478de5b1Stbbdev
*478de5b1Stbbdev    static_assert(utils::well_formed_instantiation<tbb::flow::function_node, InputObject, OutputObject>);
*478de5b1Stbbdev    static_assert(utils::well_formed_instantiation<tbb::flow::function_node, int, int>);
*478de5b1Stbbdev    static_assert(!utils::well_formed_instantiation<tbb::flow::function_node, test_concepts::NonCopyable, OutputObject>);
*478de5b1Stbbdev    static_assert(!utils::well_formed_instantiation<tbb::flow::function_node, test_concepts::NonDefaultInitializable, OutputObject>);
*478de5b1Stbbdev    static_assert(!utils::well_formed_instantiation<tbb::flow::function_node, InputObject, test_concepts::NonCopyable>);
*478de5b1Stbbdev}
*478de5b1Stbbdev
*478de5b1Stbbdevtemplate <typename Input, typename Output, typename Body>
*478de5b1Stbbdevconcept can_call_function_node_ctor = requires( tbb::flow::graph& graph, std::size_t concurrency, Body body,
*478de5b1Stbbdev                                                tbb::flow::node_priority_t priority, tbb::flow::buffer_node<int>& f ) {
*478de5b1Stbbdev    tbb::flow::function_node<Input, Output>(graph, concurrency, body);
*478de5b1Stbbdev    tbb::flow::function_node<Input, Output>(graph, concurrency, body, priority);
*478de5b1Stbbdev#if __TBB_PREVIEW_FLOW_GRAPH_NODE_SET
*478de5b1Stbbdev    tbb::flow::function_node<Input, Output>(tbb::flow::follows(f), concurrency, body);
*478de5b1Stbbdev    tbb::flow::function_node<Input, Output>(tbb::flow::follows(f), concurrency, body, priority);
*478de5b1Stbbdev#endif
*478de5b1Stbbdev};
*478de5b1Stbbdev
*478de5b1Stbbdev//! \brief \ref error_guessing
*478de5b1StbbdevTEST_CASE("constraints for function_node body") {
*478de5b1Stbbdev    using input_type = int;
*478de5b1Stbbdev    using output_type = int;
*478de5b1Stbbdev    using namespace test_concepts::function_node_body;
*478de5b1Stbbdev
*478de5b1Stbbdev    static_assert(can_call_function_node_ctor<input_type, output_type, Correct<input_type, output_type>>);
*478de5b1Stbbdev    static_assert(!can_call_function_node_ctor<input_type, output_type, NonCopyable<input_type, output_type>>);
*478de5b1Stbbdev    static_assert(!can_call_function_node_ctor<input_type, output_type, NonDestructible<input_type, output_type>>);
*478de5b1Stbbdev    static_assert(!can_call_function_node_ctor<input_type, output_type, NoOperatorRoundBrackets<input_type, output_type>>);
*478de5b1Stbbdev    static_assert(!can_call_function_node_ctor<input_type, output_type, WrongInputRoundBrackets<input_type, output_type>>);
*478de5b1Stbbdev    static_assert(!can_call_function_node_ctor<input_type, output_type, WrongReturnRoundBrackets<input_type, output_type>>);
*478de5b1Stbbdev}
*478de5b1Stbbdev#endif // __TBB_CPP20_CONCEPTS_PRESENT