test/tbb/test_flow_graph_priorities.cpp

51c0b2f7Stbbdev/*
b15aabb3Stbbdev    Copyright (c) 2018-2021 Intel Corporation
51c0b2f7Stbbdev
51c0b2f7Stbbdev    Licensed under the Apache License, Version 2.0 (the "License");
51c0b2f7Stbbdev    you may not use this file except in compliance with the License.
51c0b2f7Stbbdev    You may obtain a copy of the License at
51c0b2f7Stbbdev
51c0b2f7Stbbdev        http://www.apache.org/licenses/LICENSE-2.0
51c0b2f7Stbbdev
51c0b2f7Stbbdev    Unless required by applicable law or agreed to in writing, software
51c0b2f7Stbbdev    distributed under the License is distributed on an "AS IS" BASIS,
51c0b2f7Stbbdev    WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
51c0b2f7Stbbdev    See the License for the specific language governing permissions and
51c0b2f7Stbbdev    limitations under the License.
51c0b2f7Stbbdev*/
51c0b2f7Stbbdev
b15aabb3Stbbdev#if __INTEL_COMPILER && _MSC_VER
b15aabb3Stbbdev#pragma warning(disable : 2586) // decorated name length exceeded, name was truncated
b15aabb3Stbbdev#endif
b15aabb3Stbbdev
51c0b2f7Stbbdev#include "common/config.h"
51c0b2f7Stbbdev
51c0b2f7Stbbdev#include "tbb/flow_graph.h"
51c0b2f7Stbbdev#include "tbb/parallel_for.h"
b15aabb3Stbbdev#include "tbb/global_control.h"
b15aabb3Stbbdev#include "tbb/task_arena.h"
51c0b2f7Stbbdev
51c0b2f7Stbbdev#include "common/test.h"
51c0b2f7Stbbdev#include "common/utils.h"
8dcbd5b1Stbbdev#include "common/utils_concurrency_limit.h"
51c0b2f7Stbbdev#include "common/spin_barrier.h"
51c0b2f7Stbbdev
51c0b2f7Stbbdev#include <vector>
51c0b2f7Stbbdev#include <cstdlib>
51c0b2f7Stbbdev#include <random>
51c0b2f7Stbbdev#include <algorithm>
b15aabb3Stbbdev#include <memory>
51c0b2f7Stbbdev
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! \file test_flow_graph_priorities.cpp
51c0b2f7Stbbdev//! \brief Test for [flow_graph.copy_body flow_graph.function_node flow_graph.multifunction_node flow_graph.continue_node flow_graph.async_node] specification
51c0b2f7Stbbdev
51c0b2f7Stbbdev
51c0b2f7Stbbdevusing namespace tbb::flow;
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct TaskInfo {
51c0b2f7Stbbdev    TaskInfo() : my_priority(-1), my_task_index(-1) {}
51c0b2f7Stbbdev    TaskInfo( int priority, int task_index )
51c0b2f7Stbbdev        : my_priority(priority), my_task_index(task_index) {}
51c0b2f7Stbbdev    int my_priority;
51c0b2f7Stbbdev    int my_task_index;
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevstd::vector<TaskInfo> g_task_info;
51c0b2f7Stbbdev
51c0b2f7Stbbdevstd::atomic<unsigned> g_task_num;
51c0b2f7Stbbdev
51c0b2f7Stbbdevvoid spin_for( double delta ) {
51c0b2f7Stbbdev    tbb::tick_count start = tbb::tick_count::now();
51c0b2f7Stbbdev    while( (tbb::tick_count::now() - start).seconds() < delta ) ;
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevnamespace PriorityNodesTakePrecedence {
51c0b2f7Stbbdev
51c0b2f7Stbbdevstd::atomic<bool> g_work_submitted;
51c0b2f7Stbbdev
51c0b2f7Stbbdevconst unsigned node_num = 100;
51c0b2f7Stbbdevconst unsigned start_index = node_num / 3;
51c0b2f7Stbbdevconst unsigned end_index = node_num * 2 / 3;
51c0b2f7Stbbdevstd::atomic<unsigned> g_priority_task_index;
51c0b2f7Stbbdev
51c0b2f7Stbbdevvoid body_func( int priority, utils::SpinBarrier& my_barrier ) {
b15aabb3Stbbdev    while( !g_work_submitted.load(std::memory_order_acquire) )
b15aabb3Stbbdev        tbb::detail::d0::yield();
51c0b2f7Stbbdev    int current_task_index = g_task_num++;
51c0b2f7Stbbdev    if( priority != no_priority )
51c0b2f7Stbbdev        g_task_info[g_priority_task_index++] = TaskInfo( priority, current_task_index );
51c0b2f7Stbbdev    const bool all_threads_will_come =
51c0b2f7Stbbdev        unsigned(current_task_index) < node_num - (node_num % tbb::this_task_arena::max_concurrency());
51c0b2f7Stbbdev    if( all_threads_will_come )
51c0b2f7Stbbdev        my_barrier.wait();
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevtypedef multifunction_node< int, std::tuple<int> > multi_node;
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate <typename T>
51c0b2f7Stbbdevstruct Body {
51c0b2f7Stbbdev    Body( int priority, utils::SpinBarrier& barrier )
51c0b2f7Stbbdev        : my_priority( priority ), my_barrier( barrier ) {}
51c0b2f7Stbbdev    T operator()( const T& msg ) const {
51c0b2f7Stbbdev        body_func( my_priority, my_barrier );
51c0b2f7Stbbdev        return msg;
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev    void operator()( int msg, multi_node::output_ports_type& op ) const {
51c0b2f7Stbbdev        body_func( my_priority, my_barrier );
51c0b2f7Stbbdev        std::get<0>(op).try_put( msg );
51c0b2f7Stbbdev    }
51c0b2f7Stbbdevprivate:
51c0b2f7Stbbdev    int my_priority;
51c0b2f7Stbbdev    utils::SpinBarrier& my_barrier;
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<typename NodeType, typename BodyType>
51c0b2f7Stbbdevstruct node_creator_t {
51c0b2f7Stbbdev    NodeType* operator()( graph& g, unsigned index, utils::SpinBarrier& barrier ) {
51c0b2f7Stbbdev        if( start_index <= index && index < end_index )
51c0b2f7Stbbdev            return new NodeType( g, unlimited, BodyType(index, barrier), node_priority_t(index) );
51c0b2f7Stbbdev        else
51c0b2f7Stbbdev            return new NodeType( g, unlimited, BodyType(no_priority, barrier) );
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<typename BodyType>
51c0b2f7Stbbdevstruct node_creator_t< continue_node<continue_msg>, BodyType > {
51c0b2f7Stbbdev    continue_node<continue_msg>* operator()( graph& g, unsigned index, utils::SpinBarrier& barrier ) {
51c0b2f7Stbbdev        if( start_index <= index && index < end_index )
51c0b2f7Stbbdev            return new continue_node<continue_msg>( g, BodyType(index, barrier), node_priority_t(index) );
51c0b2f7Stbbdev        else
51c0b2f7Stbbdev            return new continue_node<continue_msg>( g, BodyType(no_priority, barrier) );
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct passthru_body {
51c0b2f7Stbbdev    template<typename T>
51c0b2f7Stbbdev    continue_msg operator()( T ) const { return continue_msg(); }
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<typename NodeType, typename NodeTypeCreator>
51c0b2f7Stbbdevvoid test_node( NodeTypeCreator node_creator ) {
51c0b2f7Stbbdev    const int num_threads = tbb::this_task_arena::max_concurrency();
51c0b2f7Stbbdev    utils::SpinBarrier barrier( num_threads );
51c0b2f7Stbbdev    graph g;
51c0b2f7Stbbdev    broadcast_node<typename NodeType::input_type> bn(g);
51c0b2f7Stbbdev    function_node<typename NodeType::input_type> tn(g, unlimited, passthru_body());
51c0b2f7Stbbdev    // Using pointers to nodes to avoid errors on compilers, which try to generate assignment
51c0b2f7Stbbdev    // operator for the nodes
b15aabb3Stbbdev    std::vector< std::unique_ptr<NodeType> > nodes;
51c0b2f7Stbbdev    for( unsigned i = 0; i < node_num; ++i ) {
b15aabb3Stbbdev        nodes.push_back(std::unique_ptr<NodeType>( node_creator(g, i, barrier) ));
51c0b2f7Stbbdev        make_edge( bn, *nodes.back() );
51c0b2f7Stbbdev        make_edge( *nodes.back(), tn );
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev
51c0b2f7Stbbdev    const size_t repeats = 10;
51c0b2f7Stbbdev    const size_t priority_nodes_num = end_index - start_index;
51c0b2f7Stbbdev    size_t global_order_failures = 0;
51c0b2f7Stbbdev    for( size_t repeat = 0; repeat < repeats; ++repeat ) {
51c0b2f7Stbbdev        g_work_submitted.store( false, std::memory_order_release );
51c0b2f7Stbbdev        g_task_num = g_priority_task_index = 0;
51c0b2f7Stbbdev        g_task_info.clear(); g_task_info.resize( priority_nodes_num );
51c0b2f7Stbbdev
51c0b2f7Stbbdev        bn.try_put( typename NodeType::input_type{} );
51c0b2f7Stbbdev        // Setting of the flag is based on the knowledge that the calling thread broadcasts the
51c0b2f7Stbbdev        // message to successor nodes. Thus, once the calling thread returns from try_put() call all
51c0b2f7Stbbdev        // necessary tasks are spawned. Thus, this makes this test to be a whitebox test to some
51c0b2f7Stbbdev        // extent.
51c0b2f7Stbbdev        g_work_submitted.store( true, std::memory_order_release );
51c0b2f7Stbbdev
51c0b2f7Stbbdev        g.wait_for_all();
51c0b2f7Stbbdev
51c0b2f7Stbbdev        CHECK_MESSAGE( (g_priority_task_index == g_task_info.size()), "Incorrect number of tasks with priority." );
51c0b2f7Stbbdev        CHECK_MESSAGE( (priority_nodes_num == g_task_info.size()), "Incorrect number of tasks with priority executed." );
51c0b2f7Stbbdev
51c0b2f7Stbbdev        for( unsigned i = 0; i < g_priority_task_index; i += num_threads ) {
51c0b2f7Stbbdev            bool found = false;
51c0b2f7Stbbdev            unsigned highest_priority_within_group = end_index - i - 1;
51c0b2f7Stbbdev            for( unsigned j = i; j < i+num_threads; ++j ) {
51c0b2f7Stbbdev                if( g_task_info[j].my_priority == int(highest_priority_within_group) ) {
51c0b2f7Stbbdev                    found = true;
51c0b2f7Stbbdev                    break;
51c0b2f7Stbbdev                }
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev            CHECK_MESSAGE( found, "Highest priority task within a group was not found" );
51c0b2f7Stbbdev        }
51c0b2f7Stbbdev        for( unsigned i = 0; i < g_priority_task_index; ++i ) {
51c0b2f7Stbbdev            // This check might fail because priorities do not guarantee ordering, i.e. assumption
51c0b2f7Stbbdev            // that all priority nodes should increment the task counter before any subsequent
51c0b2f7Stbbdev            // no-priority node is not correct. In the worst case, a thread that took a priority
51c0b2f7Stbbdev            // node might be preempted and become the last to increment the counter. That's why the
51c0b2f7Stbbdev            // test passing is based on statistics, which could be affected by machine overload
51c0b2f7Stbbdev            // unfortunately.
51c0b2f7Stbbdev            // TODO revamp: reconsider the following check for this test
b15aabb3Stbbdev            if( g_task_info[i].my_task_index > int(priority_nodes_num + num_threads) )
51c0b2f7Stbbdev                ++global_order_failures;
51c0b2f7Stbbdev        }
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev    float failure_ratio = float(global_order_failures) / float(repeats*priority_nodes_num);
51c0b2f7Stbbdev    CHECK_MESSAGE(
51c0b2f7Stbbdev        failure_ratio <= 0.1f,
51c0b2f7Stbbdev        "Nodes with priorities executed in wrong order too frequently over non-prioritized nodes."
51c0b2f7Stbbdev    );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<typename NodeType, typename NodeBody>
51c0b2f7Stbbdevvoid call_within_arena( tbb::task_arena& arena ) {
51c0b2f7Stbbdev    arena.execute(
51c0b2f7Stbbdev        [&]() {
51c0b2f7Stbbdev            test_node<NodeType>( node_creator_t<NodeType, NodeBody>() );
51c0b2f7Stbbdev        }
51c0b2f7Stbbdev    );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevvoid test( int num_threads ) {
51c0b2f7Stbbdev    INFO( "Testing execution of nodes with priority takes precedence (num_threads=" << num_threads << ") - " );
51c0b2f7Stbbdev    tbb::task_arena arena(num_threads);
51c0b2f7Stbbdev    call_within_arena< function_node<int,int>, Body<int> >( arena );
51c0b2f7Stbbdev    call_within_arena< multi_node, Body<int> >( arena );
51c0b2f7Stbbdev    call_within_arena< continue_node<continue_msg>, Body<continue_msg> >( arena );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev} /* namespace PriorityNodesTakePrecedence */
51c0b2f7Stbbdev
51c0b2f7Stbbdevnamespace ThreadsEagerReaction {
51c0b2f7Stbbdev
51c0b2f7Stbbdev// TODO revamp: combine with similar queue from test_async_node
51c0b2f7Stbbdevtemplate <typename T>
51c0b2f7Stbbdevclass concurrent_queue {
51c0b2f7Stbbdevpublic:
51c0b2f7Stbbdev    bool try_pop(T& item) {
51c0b2f7Stbbdev        std::lock_guard<queue_mutex> lock(mutex);
51c0b2f7Stbbdev        if ( q.empty() )
51c0b2f7Stbbdev            return false;
51c0b2f7Stbbdev        item = q.front();
51c0b2f7Stbbdev        q.pop();
51c0b2f7Stbbdev        return true;
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev
51c0b2f7Stbbdev    void push(const T& item) {
51c0b2f7Stbbdev        std::lock_guard<queue_mutex> lock(mutex);
51c0b2f7Stbbdev        q.push(item);
51c0b2f7Stbbdev    }
51c0b2f7Stbbdevprivate:
51c0b2f7Stbbdev    std::queue<T> q;
51c0b2f7Stbbdev    using queue_mutex = std::mutex;
51c0b2f7Stbbdev    std::mutex mutex;
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevusing utils::SpinBarrier;
51c0b2f7Stbbdev
51c0b2f7Stbbdevenum task_type_t { no_task, regular_task, async_task };
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct profile_t {
51c0b2f7Stbbdev    task_type_t task_type;
51c0b2f7Stbbdev    unsigned global_task_id;
51c0b2f7Stbbdev    double elapsed;
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevstd::vector<unsigned> g_async_task_ids;
51c0b2f7Stbbdev
51c0b2f7Stbbdevtypedef unsigned data_type;
51c0b2f7Stbbdevtypedef async_node<data_type, data_type> async_node_type;
51c0b2f7Stbbdevtypedef multifunction_node<
51c0b2f7Stbbdev    data_type, std::tuple<data_type, data_type> > decider_node_type;
51c0b2f7Stbbdevstruct AsyncActivity {
51c0b2f7Stbbdev    typedef async_node_type::gateway_type gateway_type;
51c0b2f7Stbbdev
51c0b2f7Stbbdev    struct work_type { data_type input; gateway_type* gateway; };
59ac78faSAlex    std::atomic<bool> done;
51c0b2f7Stbbdev    concurrent_queue<work_type> my_queue;
51c0b2f7Stbbdev    std::thread my_service_thread;
51c0b2f7Stbbdev
51c0b2f7Stbbdev    struct ServiceThreadFunc {
51c0b2f7Stbbdev        SpinBarrier& my_barrier;
51c0b2f7Stbbdev        ServiceThreadFunc(SpinBarrier& barrier) : my_barrier(barrier) {}
51c0b2f7Stbbdev        void operator()(AsyncActivity* activity) {
51c0b2f7Stbbdev            while (!activity->done) {
51c0b2f7Stbbdev                work_type work;
51c0b2f7Stbbdev                while (activity->my_queue.try_pop(work)) {
51c0b2f7Stbbdev                    g_async_task_ids.push_back( ++g_task_num );
51c0b2f7Stbbdev                    work.gateway->try_put(work.input);
51c0b2f7Stbbdev                    work.gateway->release_wait();
51c0b2f7Stbbdev                    my_barrier.wait();
51c0b2f7Stbbdev                }
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev        }
51c0b2f7Stbbdev    };
51c0b2f7Stbbdev    void stop_and_wait() { done = true; my_service_thread.join(); }
51c0b2f7Stbbdev
51c0b2f7Stbbdev    void submit(data_type input, gateway_type* gateway) {
51c0b2f7Stbbdev        work_type work = { input, gateway };
51c0b2f7Stbbdev        gateway->reserve_wait();
51c0b2f7Stbbdev        my_queue.push(work);
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev    AsyncActivity(SpinBarrier& barrier)
51c0b2f7Stbbdev        : done(false), my_service_thread(ServiceThreadFunc(barrier), this) {}
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct StartBody {
51c0b2f7Stbbdev    bool has_run;
51c0b2f7Stbbdev    data_type operator()(tbb::flow_control& fc) {
51c0b2f7Stbbdev        if (has_run){
51c0b2f7Stbbdev            fc.stop();
51c0b2f7Stbbdev            return data_type();
51c0b2f7Stbbdev        }
51c0b2f7Stbbdev        has_run = true;
51c0b2f7Stbbdev        return 1;
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev    StartBody() : has_run(false) {}
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct ParallelForBody {
51c0b2f7Stbbdev    SpinBarrier& my_barrier;
51c0b2f7Stbbdev    const data_type& my_input;
51c0b2f7Stbbdev    ParallelForBody(SpinBarrier& barrier, const data_type& input)
51c0b2f7Stbbdev        : my_barrier(barrier), my_input(input) {}
51c0b2f7Stbbdev    void operator()(const data_type&) const {
51c0b2f7Stbbdev        my_barrier.wait();
51c0b2f7Stbbdev        ++g_task_num;
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct CpuWorkBody {
51c0b2f7Stbbdev    SpinBarrier& my_barrier;
51c0b2f7Stbbdev    const int my_tasks_count;
51c0b2f7Stbbdev    data_type operator()(const data_type& input) {
51c0b2f7Stbbdev        tbb::parallel_for(0, my_tasks_count, ParallelForBody(my_barrier, input), tbb::simple_partitioner());
51c0b2f7Stbbdev        return input;
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev    CpuWorkBody(SpinBarrier& barrier, int tasks_count)
51c0b2f7Stbbdev        : my_barrier(barrier), my_tasks_count(tasks_count) {}
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct DeciderBody {
51c0b2f7Stbbdev    const data_type my_limit;
51c0b2f7Stbbdev    DeciderBody( const data_type& limit ) : my_limit( limit ) {}
51c0b2f7Stbbdev    void operator()(data_type input, decider_node_type::output_ports_type& ports) {
51c0b2f7Stbbdev        if (input < my_limit)
51c0b2f7Stbbdev            std::get<0>(ports).try_put(input + 1);
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct AsyncSubmissionBody {
51c0b2f7Stbbdev    AsyncActivity* my_activity;
*324afd9eSIlya Mishin    // It is important that async_node in the test executes without spawning a TBB task, because
*324afd9eSIlya Mishin    // it passes the work to asynchronous thread, which unlocks the barrier that is waited
*324afd9eSIlya Mishin    // by every execution thread (asynchronous thread and any TBB worker or main thread).
*324afd9eSIlya Mishin    // This is why async_node's body marked noexcept.
*324afd9eSIlya Mishin    void operator()(data_type input, async_node_type::gateway_type& gateway) noexcept {
51c0b2f7Stbbdev        my_activity->submit(input, &gateway);
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev    AsyncSubmissionBody(AsyncActivity* activity) : my_activity(activity) {}
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevvoid test( unsigned num_threads ) {
51c0b2f7Stbbdev    INFO( "Testing threads react eagerly on asynchronous tasks (num_threads=" << num_threads << ") - " );
51c0b2f7Stbbdev    if( num_threads == std::thread::hardware_concurrency() ) {
51c0b2f7Stbbdev        // one thread is required for asynchronous compute resource
51c0b2f7Stbbdev        INFO("skipping test since it is designed to work on less number of threads than "
51c0b2f7Stbbdev             "hardware concurrency allows\n");
51c0b2f7Stbbdev        return;
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev    const unsigned cpu_threads = unsigned(num_threads);
51c0b2f7Stbbdev    const unsigned cpu_tasks_per_thread = 4;
51c0b2f7Stbbdev    const unsigned nested_cpu_tasks = cpu_tasks_per_thread * cpu_threads;
51c0b2f7Stbbdev    const unsigned async_subgraph_reruns = 8;
51c0b2f7Stbbdev    const unsigned cpu_subgraph_reruns = 2;
51c0b2f7Stbbdev
51c0b2f7Stbbdev    SpinBarrier barrier(cpu_threads + /*async thread=*/1);
51c0b2f7Stbbdev    g_task_num = 0;
51c0b2f7Stbbdev    g_async_task_ids.clear();
51c0b2f7Stbbdev    g_async_task_ids.reserve(async_subgraph_reruns);
51c0b2f7Stbbdev
51c0b2f7Stbbdev    tbb::task_arena arena(cpu_threads);
51c0b2f7Stbbdev	arena.execute(
51c0b2f7Stbbdev        [&]() {
51c0b2f7Stbbdev            AsyncActivity activity(barrier);
51c0b2f7Stbbdev            graph g;
51c0b2f7Stbbdev
51c0b2f7Stbbdev            input_node<data_type> starter_node(g, StartBody());
51c0b2f7Stbbdev            function_node<data_type, data_type> cpu_work_node(
51c0b2f7Stbbdev                g, unlimited, CpuWorkBody(barrier, nested_cpu_tasks));
51c0b2f7Stbbdev            decider_node_type cpu_restarter_node(g, unlimited, DeciderBody(cpu_subgraph_reruns));
51c0b2f7Stbbdev            async_node_type async_node(g, unlimited, AsyncSubmissionBody(&activity));
51c0b2f7Stbbdev            decider_node_type async_restarter_node(
51c0b2f7Stbbdev                g, unlimited, DeciderBody(async_subgraph_reruns), node_priority_t(1)
51c0b2f7Stbbdev            );
51c0b2f7Stbbdev
51c0b2f7Stbbdev            make_edge(starter_node, cpu_work_node);
51c0b2f7Stbbdev            make_edge(cpu_work_node, cpu_restarter_node);
51c0b2f7Stbbdev            make_edge(output_port<0>(cpu_restarter_node), cpu_work_node);
51c0b2f7Stbbdev
51c0b2f7Stbbdev            make_edge(starter_node, async_node);
51c0b2f7Stbbdev            make_edge(async_node, async_restarter_node);
51c0b2f7Stbbdev            make_edge(output_port<0>(async_restarter_node), async_node);
51c0b2f7Stbbdev
51c0b2f7Stbbdev            starter_node.activate();
51c0b2f7Stbbdev            g.wait_for_all();
51c0b2f7Stbbdev            activity.stop_and_wait();
51c0b2f7Stbbdev
51c0b2f7Stbbdev            const size_t async_task_num = size_t(async_subgraph_reruns);
51c0b2f7Stbbdev            CHECK_MESSAGE( ( g_async_task_ids.size() == async_task_num), "Incorrect number of async tasks." );
51c0b2f7Stbbdev            unsigned max_span = unsigned(2 * cpu_threads + 1);
51c0b2f7Stbbdev            for( size_t idx = 1; idx < async_task_num; ++idx ) {
51c0b2f7Stbbdev                CHECK_MESSAGE( (g_async_task_ids[idx] - g_async_task_ids[idx-1] <= max_span),
51c0b2f7Stbbdev                               "Async tasks were not able to interfere with CPU tasks." );
51c0b2f7Stbbdev
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev        }
51c0b2f7Stbbdev    );
51c0b2f7Stbbdev    INFO("done\n");
51c0b2f7Stbbdev}
51c0b2f7Stbbdev} /* ThreadsEagerReaction */
51c0b2f7Stbbdev
51c0b2f7Stbbdevnamespace LimitingExecutionToPriorityTask {
51c0b2f7Stbbdev
51c0b2f7Stbbdevenum work_type_t { NONPRIORITIZED_WORK, PRIORITIZED_WORK };
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct execution_tracker_t {
51c0b2f7Stbbdev    execution_tracker_t() { reset(); }
51c0b2f7Stbbdev    void reset() {
51c0b2f7Stbbdev        prioritized_work_submitter = std::thread::id();
51c0b2f7Stbbdev        prioritized_work_started = false;
51c0b2f7Stbbdev        prioritized_work_finished = false;
51c0b2f7Stbbdev        prioritized_work_interrupted = false;
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev    std::thread::id prioritized_work_submitter;
59ac78faSAlex    std::atomic<bool> prioritized_work_started;
51c0b2f7Stbbdev    bool prioritized_work_finished;
51c0b2f7Stbbdev    bool prioritized_work_interrupted;
51c0b2f7Stbbdev} exec_tracker;
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<work_type_t work_type>
51c0b2f7Stbbdevvoid do_node_work( int work_size );
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<work_type_t>
51c0b2f7Stbbdevvoid do_nested_work( const std::thread::id& tid, const tbb::blocked_range<int>& subrange );
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<work_type_t work_type>
51c0b2f7Stbbdevstruct CommonBody {
51c0b2f7Stbbdev    CommonBody() : my_body_size( 0 ) { }
51c0b2f7Stbbdev    CommonBody( int body_size ) : my_body_size( body_size ) { }
51c0b2f7Stbbdev    continue_msg operator()( const continue_msg& msg ) const {
51c0b2f7Stbbdev        do_node_work<work_type>(my_body_size);
51c0b2f7Stbbdev        return msg;
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev    void operator()( const tbb::blocked_range<int>& subrange ) const {
51c0b2f7Stbbdev        do_nested_work<work_type>( /*tid=*/std::this_thread::get_id(), subrange );
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev    int my_body_size;
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<work_type_t work_type>
51c0b2f7Stbbdevvoid do_node_work(int work_size) {
51c0b2f7Stbbdev    tbb::parallel_for( tbb::blocked_range<int>(0, work_size), CommonBody<work_type>(),
51c0b2f7Stbbdev                       tbb::simple_partitioner() );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<work_type_t>
51c0b2f7Stbbdevvoid do_nested_work( const std::thread::id& tid, const tbb::blocked_range<int>& /*subrange*/ ) {
51c0b2f7Stbbdev    // This is non-prioritized work...
59ac78faSAlex    if( !exec_tracker.prioritized_work_started || exec_tracker.prioritized_work_submitter != tid )
51c0b2f7Stbbdev        return;
51c0b2f7Stbbdev    // ...being executed by the thread that initially started prioritized one...
51c0b2f7Stbbdev    CHECK_MESSAGE( exec_tracker.prioritized_work_started,
51c0b2f7Stbbdev                   "Prioritized work should have been started by that time." );
51c0b2f7Stbbdev    // ...prioritized work has been started already...
51c0b2f7Stbbdev    if( exec_tracker.prioritized_work_finished )
51c0b2f7Stbbdev        return;
51c0b2f7Stbbdev    // ...but has not been finished yet
51c0b2f7Stbbdev    exec_tracker.prioritized_work_interrupted = true;
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct IsolationFunctor {
51c0b2f7Stbbdev    int work_size;
51c0b2f7Stbbdev    IsolationFunctor(int ws) : work_size(ws) {}
51c0b2f7Stbbdev    void operator()() const {
51c0b2f7Stbbdev        tbb::parallel_for( tbb::blocked_range<int>(0, work_size), CommonBody<PRIORITIZED_WORK>(),
51c0b2f7Stbbdev                           tbb::simple_partitioner() );
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<>
51c0b2f7Stbbdevvoid do_node_work<PRIORITIZED_WORK>(int work_size) {
51c0b2f7Stbbdev    exec_tracker.prioritized_work_submitter = std::this_thread::get_id();
51c0b2f7Stbbdev    exec_tracker.prioritized_work_started = true;
51c0b2f7Stbbdev    tbb::this_task_arena::isolate( IsolationFunctor(work_size) );
51c0b2f7Stbbdev    exec_tracker.prioritized_work_finished = true;
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<>
51c0b2f7Stbbdevvoid do_nested_work<PRIORITIZED_WORK>( const std::thread::id& tid,
51c0b2f7Stbbdev                                       const tbb::blocked_range<int>& /*subrange*/ ) {
59ac78faSAlex    if( exec_tracker.prioritized_work_started && exec_tracker.prioritized_work_submitter == tid ) {
51c0b2f7Stbbdev        CHECK_MESSAGE( !exec_tracker.prioritized_work_interrupted,
51c0b2f7Stbbdev                       "Thread was not fully devoted to processing of prioritized task." );
51c0b2f7Stbbdev    } else {
51c0b2f7Stbbdev        // prolong processing of prioritized work so that the thread that started
51c0b2f7Stbbdev        // prioritized work has higher probability to help with non-prioritized one.
51c0b2f7Stbbdev        spin_for(0.1);
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev// Using pointers to nodes to avoid errors on compilers, which try to generate assignment operator
51c0b2f7Stbbdev// for the nodes
b15aabb3Stbbdevtypedef std::vector< std::unique_ptr<continue_node<continue_msg>> > nodes_container_t;
51c0b2f7Stbbdev
51c0b2f7Stbbdevvoid create_nodes( nodes_container_t& nodes, graph& g, int num, int body_size ) {
51c0b2f7Stbbdev    for( int i = 0; i < num; ++i )
51c0b2f7Stbbdev        nodes.push_back(
b15aabb3Stbbdev            std::unique_ptr<continue_node<continue_msg>>(
51c0b2f7Stbbdev                new continue_node<continue_msg>( g, CommonBody<NONPRIORITIZED_WORK>( body_size ) )
b15aabb3Stbbdev            )
51c0b2f7Stbbdev        );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevvoid test( int num_threads ) {
51c0b2f7Stbbdev    INFO( "Testing limit execution to priority tasks (num_threads=" << num_threads << ") - " );
51c0b2f7Stbbdev
51c0b2f7Stbbdev    tbb::task_arena arena( num_threads );
51c0b2f7Stbbdev	arena.execute(
51c0b2f7Stbbdev        [&]() {
51c0b2f7Stbbdev            const int nodes_num = 100;
51c0b2f7Stbbdev            const int priority_node_position_part = 10;
51c0b2f7Stbbdev            const int pivot = nodes_num / priority_node_position_part;
51c0b2f7Stbbdev            const int nodes_in_lane = 3 * num_threads;
51c0b2f7Stbbdev            const int small_problem_size = 100;
51c0b2f7Stbbdev            const int large_problem_size = 1000;
51c0b2f7Stbbdev
51c0b2f7Stbbdev            graph g;
51c0b2f7Stbbdev            nodes_container_t nodes;
51c0b2f7Stbbdev            create_nodes( nodes, g, pivot, large_problem_size );
51c0b2f7Stbbdev            nodes.push_back(
b15aabb3Stbbdev                std::unique_ptr<continue_node<continue_msg>>(
51c0b2f7Stbbdev                    new continue_node<continue_msg>(
51c0b2f7Stbbdev                        g, CommonBody<PRIORITIZED_WORK>(small_problem_size), node_priority_t(1)
51c0b2f7Stbbdev                    )
b15aabb3Stbbdev                )
51c0b2f7Stbbdev            );
51c0b2f7Stbbdev            create_nodes( nodes, g, nodes_num - pivot - 1, large_problem_size );
51c0b2f7Stbbdev
51c0b2f7Stbbdev            broadcast_node<continue_msg> bn(g);
51c0b2f7Stbbdev            for( int i = 0; i < nodes_num; ++i )
51c0b2f7Stbbdev                if( i % nodes_in_lane == 0 )
51c0b2f7Stbbdev                    make_edge( bn, *nodes[i] );
51c0b2f7Stbbdev                else
51c0b2f7Stbbdev                    make_edge( *nodes[i-1], *nodes[i] );
51c0b2f7Stbbdev            exec_tracker.reset();
51c0b2f7Stbbdev            bn.try_put( continue_msg() );
51c0b2f7Stbbdev            g.wait_for_all();
51c0b2f7Stbbdev        }
51c0b2f7Stbbdev	);
b15aabb3Stbbdev
b15aabb3Stbbdev    INFO( "done\n" );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev} /* namespace LimitingExecutionToPriorityTask */
51c0b2f7Stbbdev
51c0b2f7Stbbdevnamespace NestedCase {
51c0b2f7Stbbdev
51c0b2f7Stbbdevusing tbb::task_arena;
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct InnerBody {
51c0b2f7Stbbdev    continue_msg operator()( const continue_msg& ) const {
51c0b2f7Stbbdev        return continue_msg();
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct OuterBody {
51c0b2f7Stbbdev    int my_max_threads;
b15aabb3Stbbdev    task_arena** my_inner_arena;
b15aabb3Stbbdev    OuterBody( int max_threads, task_arena** inner_arena )
51c0b2f7Stbbdev        : my_max_threads(max_threads), my_inner_arena(inner_arena) {}
51c0b2f7Stbbdev    // copy constructor to please some old compilers
51c0b2f7Stbbdev    OuterBody( const OuterBody& rhs )
51c0b2f7Stbbdev        : my_max_threads(rhs.my_max_threads), my_inner_arena(rhs.my_inner_arena) {}
51c0b2f7Stbbdev    int operator()( const int& ) {
51c0b2f7Stbbdev        graph inner_graph;
51c0b2f7Stbbdev        continue_node<continue_msg> start_node(inner_graph, InnerBody());
51c0b2f7Stbbdev        continue_node<continue_msg> mid_node1(inner_graph, InnerBody(), node_priority_t(5));
51c0b2f7Stbbdev        continue_node<continue_msg> mid_node2(inner_graph, InnerBody());
51c0b2f7Stbbdev        continue_node<continue_msg> end_node(inner_graph, InnerBody(), node_priority_t(15));
51c0b2f7Stbbdev        make_edge( start_node, mid_node1 );
51c0b2f7Stbbdev        make_edge( mid_node1, end_node );
51c0b2f7Stbbdev        make_edge( start_node, mid_node2 );
51c0b2f7Stbbdev        make_edge( mid_node2, end_node );
b15aabb3Stbbdev        (*my_inner_arena)->execute( [&inner_graph]{ inner_graph.reset(); } );
51c0b2f7Stbbdev        start_node.try_put( continue_msg() );
51c0b2f7Stbbdev        inner_graph.wait_for_all();
51c0b2f7Stbbdev        return 13;
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevvoid execute_outer_graph( bool same_arena, task_arena& inner_arena, int max_threads,
51c0b2f7Stbbdev                          graph& outer_graph, function_node<int,int>& start_node ) {
51c0b2f7Stbbdev    if( same_arena ) {
51c0b2f7Stbbdev        start_node.try_put( 42 );
51c0b2f7Stbbdev        outer_graph.wait_for_all();
51c0b2f7Stbbdev        return;
51c0b2f7Stbbdev    }
b15aabb3Stbbdev
b15aabb3Stbbdev    auto threads_range = utils::concurrency_range(max_threads);
b15aabb3Stbbdev    for( auto num_threads : threads_range ) {
55f9b178SIvan Kochin        inner_arena.initialize( static_cast<int>(num_threads) );
51c0b2f7Stbbdev        start_node.try_put( 42 );
51c0b2f7Stbbdev        outer_graph.wait_for_all();
51c0b2f7Stbbdev        inner_arena.terminate();
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
b15aabb3Stbbdevvoid test_in_arena( int max_threads, task_arena& outer_arena, task_arena& inner_arena,
b15aabb3Stbbdev                    graph& outer_graph, function_node<int, int>& start_node ) {
b15aabb3Stbbdev    bool same_arena = &outer_arena == &inner_arena;
b15aabb3Stbbdev    auto threads_range = utils::concurrency_range(max_threads);
b15aabb3Stbbdev    for( auto num_threads : threads_range ) {
b15aabb3Stbbdev        INFO( "Testing nested nodes with specified priority in " << (same_arena? "same" : "different")
b15aabb3Stbbdev              << " arenas, num_threads=" << num_threads << ") - " );
55f9b178SIvan Kochin        outer_arena.initialize( static_cast<int>(num_threads) );
b15aabb3Stbbdev        outer_arena.execute( [&outer_graph]{ outer_graph.reset(); } );
b15aabb3Stbbdev        execute_outer_graph( same_arena, inner_arena, max_threads, outer_graph, start_node );
b15aabb3Stbbdev        outer_arena.terminate();
b15aabb3Stbbdev        INFO( "done\n" );
b15aabb3Stbbdev    }
b15aabb3Stbbdev}
b15aabb3Stbbdev
b15aabb3Stbbdevvoid test( int max_threads ) {
b15aabb3Stbbdev    task_arena outer_arena; task_arena inner_arena;
b15aabb3Stbbdev    task_arena* inner_arena_pointer = &outer_arena; // make it same as outer arena in the beginning
b15aabb3Stbbdev
51c0b2f7Stbbdev    graph outer_graph;
51c0b2f7Stbbdev    const unsigned num_outer_nodes = 10;
51c0b2f7Stbbdev    const size_t concurrency = unlimited;
b15aabb3Stbbdev    std::vector< std::unique_ptr<function_node<int,int>> > outer_nodes;
51c0b2f7Stbbdev    for( unsigned node_index = 0; node_index < num_outer_nodes; ++node_index ) {
51c0b2f7Stbbdev        node_priority_t priority = no_priority;
51c0b2f7Stbbdev        if( node_index == num_outer_nodes / 2 )
51c0b2f7Stbbdev            priority = 10;
51c0b2f7Stbbdev
51c0b2f7Stbbdev        outer_nodes.push_back(
b15aabb3Stbbdev            std::unique_ptr< function_node<int, int> >(
51c0b2f7Stbbdev                new function_node<int,int>(
b15aabb3Stbbdev                    outer_graph, concurrency, OuterBody(max_threads, &inner_arena_pointer), priority
b15aabb3Stbbdev                )
51c0b2f7Stbbdev            )
51c0b2f7Stbbdev        );
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev
51c0b2f7Stbbdev    for( unsigned node_index1 = 0; node_index1 < num_outer_nodes; ++node_index1 )
51c0b2f7Stbbdev        for( unsigned node_index2 = node_index1+1; node_index2 < num_outer_nodes; ++node_index2 )
51c0b2f7Stbbdev            make_edge( *outer_nodes[node_index1], *outer_nodes[node_index2] );
51c0b2f7Stbbdev
b15aabb3Stbbdev    test_in_arena( max_threads, outer_arena, outer_arena, outer_graph, *outer_nodes[0] );
51c0b2f7Stbbdev
b15aabb3Stbbdev    inner_arena_pointer = &inner_arena;
51c0b2f7Stbbdev
b15aabb3Stbbdev    test_in_arena( max_threads, outer_arena, inner_arena, outer_graph, *outer_nodes[0] );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev} // namespace NestedCase
51c0b2f7Stbbdev
51c0b2f7Stbbdev
51c0b2f7Stbbdevnamespace BypassPrioritizedTask {
51c0b2f7Stbbdev
51c0b2f7Stbbdevvoid common_body( int priority ) {
51c0b2f7Stbbdev    int current_task_index = g_task_num++;
51c0b2f7Stbbdev    g_task_info.push_back( TaskInfo( priority, current_task_index ) );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct Body {
51c0b2f7Stbbdev    Body( int priority ) : my_priority( priority ) {}
51c0b2f7Stbbdev    continue_msg operator()(const continue_msg&) {
51c0b2f7Stbbdev        common_body( my_priority );
51c0b2f7Stbbdev        return continue_msg();
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev    int my_priority;
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct InputNodeBody {
51c0b2f7Stbbdev    continue_msg operator()( tbb::flow_control& fc ){
51c0b2f7Stbbdev        static bool is_source_executed = false;
51c0b2f7Stbbdev
51c0b2f7Stbbdev        if( is_source_executed ) {
51c0b2f7Stbbdev            fc.stop();
51c0b2f7Stbbdev            return continue_msg();
51c0b2f7Stbbdev        }
51c0b2f7Stbbdev
51c0b2f7Stbbdev        common_body( 0 );
51c0b2f7Stbbdev        is_source_executed = true;
51c0b2f7Stbbdev
51c0b2f7Stbbdev        return continue_msg();
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<typename StarterNodeType>
51c0b2f7StbbdevStarterNodeType create_starter_node(graph& g) {
51c0b2f7Stbbdev    return continue_node<continue_msg>( g, Body(0) );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<>
51c0b2f7Stbbdevinput_node<continue_msg> create_starter_node<input_node<continue_msg>>(graph& g) {
51c0b2f7Stbbdev    return input_node<continue_msg>( g, InputNodeBody() );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<typename StarterNodeType>
51c0b2f7Stbbdevvoid start_graph( StarterNodeType& starter ) {
51c0b2f7Stbbdev    starter.try_put( continue_msg() );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<>
51c0b2f7Stbbdevvoid start_graph<input_node<continue_msg>>( input_node<continue_msg>& starter ) {
51c0b2f7Stbbdev    starter.activate();
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdevtemplate<typename StarterNodeType>
51c0b2f7Stbbdevvoid test_use_case() {
51c0b2f7Stbbdev    g_task_info.clear();
51c0b2f7Stbbdev    g_task_num = 0;
51c0b2f7Stbbdev    graph g;
51c0b2f7Stbbdev    StarterNodeType starter = create_starter_node<StarterNodeType>(g);
51c0b2f7Stbbdev    continue_node<continue_msg> spawn_successor( g, Body(1), node_priority_t(1) );
51c0b2f7Stbbdev    continue_node<continue_msg> bypass_successor( g, Body(2), node_priority_t(2) );
51c0b2f7Stbbdev
51c0b2f7Stbbdev    make_edge( starter, spawn_successor );
51c0b2f7Stbbdev    make_edge( starter, bypass_successor );
51c0b2f7Stbbdev
51c0b2f7Stbbdev    start_graph<StarterNodeType>( starter );
51c0b2f7Stbbdev    g.wait_for_all();
51c0b2f7Stbbdev
51c0b2f7Stbbdev    CHECK_MESSAGE( g_task_info.size() == 3, "" );
51c0b2f7Stbbdev    CHECK_MESSAGE( g_task_info[0].my_task_index == 0, "" );
51c0b2f7Stbbdev    CHECK_MESSAGE( g_task_info[1].my_task_index == 1, "" );
51c0b2f7Stbbdev    CHECK_MESSAGE( g_task_info[2].my_task_index == 2, "" );
51c0b2f7Stbbdev
51c0b2f7Stbbdev    CHECK_MESSAGE( g_task_info[0].my_priority == 0, "" );
51c0b2f7Stbbdev    CHECK_MESSAGE( g_task_info[1].my_priority == 2, "Bypassed task with higher priority executed in wrong order." );
51c0b2f7Stbbdev    CHECK_MESSAGE( g_task_info[2].my_priority == 1, "" );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! The test checks that the task from the node with higher priority, which task gets bypassed, is
51c0b2f7Stbbdev//! executed first than the one spawned with lower priority.
51c0b2f7Stbbdevvoid test() {
51c0b2f7Stbbdev    test_use_case<continue_node<continue_msg>>();
51c0b2f7Stbbdev    test_use_case<input_node<continue_msg>>();
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev} // namespace BypassPrioritizedTask
51c0b2f7Stbbdev
51c0b2f7Stbbdevnamespace ManySuccessors {
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct no_priority_node_body {
51c0b2f7Stbbdev    void operator()(continue_msg) {
51c0b2f7Stbbdev        CHECK_MESSAGE(
51c0b2f7Stbbdev            barrier == 0, "Non-priority successor has to be executed after all priority successors"
51c0b2f7Stbbdev        );
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev    std::atomic<int>& barrier;
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevstruct priority_node_body {
51c0b2f7Stbbdev    void operator()(continue_msg) {
51c0b2f7Stbbdev        --barrier;
51c0b2f7Stbbdev        while (barrier)
b15aabb3Stbbdev            tbb::detail::d0::yield();
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev    std::atomic<int>& barrier;
51c0b2f7Stbbdev};
51c0b2f7Stbbdev
51c0b2f7Stbbdevvoid test(int num_threads) {
51c0b2f7Stbbdev    tbb::task_arena arena( num_threads );
51c0b2f7Stbbdev    arena.execute(
51c0b2f7Stbbdev        [&]() {
51c0b2f7Stbbdev            graph g;
51c0b2f7Stbbdev            broadcast_node<continue_msg> bn(g);
b15aabb3Stbbdev            std::vector< std::unique_ptr<continue_node<continue_msg>> > nodes;
51c0b2f7Stbbdev            std::atomic<int> barrier;
51c0b2f7Stbbdev            for (int i = 0; i < 2 * num_threads; ++i)
b15aabb3Stbbdev                nodes.push_back(
b15aabb3Stbbdev                    std::unique_ptr<continue_node<continue_msg>>(
b15aabb3Stbbdev                        new continue_node<continue_msg>(g, no_priority_node_body{ barrier })
b15aabb3Stbbdev                    )
b15aabb3Stbbdev                );
51c0b2f7Stbbdev            for (int i = 0; i < num_threads; ++i)
b15aabb3Stbbdev                nodes.push_back(
b15aabb3Stbbdev                    std::unique_ptr<continue_node<continue_msg>>(
b15aabb3Stbbdev                        new continue_node<continue_msg>(g, priority_node_body{ barrier }, /*priority*/1)
b15aabb3Stbbdev                    )
b15aabb3Stbbdev                );
51c0b2f7Stbbdev
51c0b2f7Stbbdev            std::random_device rd;
51c0b2f7Stbbdev            std::mt19937 gen(rd());
51c0b2f7Stbbdev
51c0b2f7Stbbdev            for (int trial = 0; trial < 10; ++trial) {
51c0b2f7Stbbdev                barrier = num_threads;
51c0b2f7Stbbdev                std::shuffle(nodes.begin(), nodes.end(), gen);
b15aabb3Stbbdev                for (auto& n : nodes)
51c0b2f7Stbbdev                    make_edge(bn, *n);
51c0b2f7Stbbdev                bn.try_put(continue_msg());
51c0b2f7Stbbdev                g.wait_for_all();
b15aabb3Stbbdev                for (auto& n : nodes)
51c0b2f7Stbbdev                    remove_edge(bn, *n);
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev        }
51c0b2f7Stbbdev    );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev} // namespace ManySuccessors
51c0b2f7Stbbdev
51c0b2f7Stbbdev#if TBB_USE_EXCEPTIONS
51c0b2f7Stbbdevnamespace Exceptions {
51c0b2f7Stbbdev    void test() {
51c0b2f7Stbbdev        using namespace tbb::flow;
51c0b2f7Stbbdev        graph g;
51c0b2f7Stbbdev        std::srand(42);
49e08aacStbbdev        const unsigned num_messages = 50;
49e08aacStbbdev        std::vector<unsigned> throwing_msgs;
49e08aacStbbdev        std::atomic<unsigned> msg_count(0);
49e08aacStbbdev        continue_node<unsigned> c(g, [&msg_count](continue_msg) {
49e08aacStbbdev            return ++msg_count;
51c0b2f7Stbbdev        }, 2);
49e08aacStbbdev        function_node<unsigned> f(g, unlimited, [&throwing_msgs](unsigned v) {
49e08aacStbbdev            for( auto i : throwing_msgs ) {
49e08aacStbbdev                if( i == v )
51c0b2f7Stbbdev                    throw std::runtime_error("Exception::test");
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev        }, 1);
51c0b2f7Stbbdev        make_edge(c, f);
51c0b2f7Stbbdev        for (int i = 0; i < 10; ++i) {
49e08aacStbbdev            msg_count = 0;
49e08aacStbbdev            g.reset();
49e08aacStbbdev            throwing_msgs.push_back(std::rand() % num_messages);
51c0b2f7Stbbdev            try {
49e08aacStbbdev                for (unsigned j = 0; j < num_messages; ++j) {
51c0b2f7Stbbdev                    c.try_put(continue_msg());
51c0b2f7Stbbdev                }
51c0b2f7Stbbdev                g.wait_for_all();
51c0b2f7Stbbdev                FAIL("Unreachable code. The exception is expected");
51c0b2f7Stbbdev            } catch (std::runtime_error&) {
51c0b2f7Stbbdev                CHECK(g.is_cancelled());
49e08aacStbbdev                CHECK(g.exception_thrown());
51c0b2f7Stbbdev            } catch (...) {
51c0b2f7Stbbdev                FAIL("Unexpected exception");
51c0b2f7Stbbdev            }
51c0b2f7Stbbdev        }
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev} // namespace Exceptions
51c0b2f7Stbbdev#endif
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! Test node prioritization
51c0b2f7Stbbdev//! \brief \ref requirement
51c0b2f7StbbdevTEST_CASE("Priority nodes take precedence"){
8dcbd5b1Stbbdev    for( auto p : utils::concurrency_range() ) {
55f9b178SIvan Kochin        PriorityNodesTakePrecedence::test( static_cast<int>(p) );
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! Test thread eager reaction
51c0b2f7Stbbdev//! \brief \ref error_guessing
51c0b2f7StbbdevTEST_CASE("Thread eager reaction"){
8dcbd5b1Stbbdev    for( auto p : utils::concurrency_range() ) {
55f9b178SIvan Kochin        ThreadsEagerReaction::test( static_cast<int>(p) );
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! Test prioritization under concurrency limits
51c0b2f7Stbbdev//! \brief \ref error_guessing
51c0b2f7StbbdevTEST_CASE("Limiting execution to prioritized work") {
8dcbd5b1Stbbdev    for( auto p : utils::concurrency_range() ) {
55f9b178SIvan Kochin        LimitingExecutionToPriorityTask::test( static_cast<int>(p) );
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! Test nested graphs
51c0b2f7Stbbdev//! \brief \ref error_guessing
51c0b2f7StbbdevTEST_CASE("Nested test case") {
b15aabb3Stbbdev    std::size_t max_threads = utils::get_platform_max_threads();
b15aabb3Stbbdev    // The stepping for the threads is done inside.
55f9b178SIvan Kochin    NestedCase::test( static_cast<int>(max_threads) );
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! Test bypassed task with higher priority
51c0b2f7Stbbdev//! \brief \ref error_guessing
51c0b2f7StbbdevTEST_CASE("Bypass prioritized task"){
8dcbd5b1Stbbdev    tbb::global_control gc( tbb::global_control::max_allowed_parallelism, 1 );
51c0b2f7Stbbdev    BypassPrioritizedTask::test();
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev//! Test mixing prioritized and ordinary successors
51c0b2f7Stbbdev//! \brief \ref error_guessing
51c0b2f7StbbdevTEST_CASE("Many successors") {
8dcbd5b1Stbbdev    for( auto p : utils::concurrency_range() ) {
55f9b178SIvan Kochin        ManySuccessors::test( static_cast<int>(p) );
51c0b2f7Stbbdev    }
51c0b2f7Stbbdev}
51c0b2f7Stbbdev
51c0b2f7Stbbdev#if TBB_USE_EXCEPTIONS
51c0b2f7Stbbdev//! Test for exceptions
51c0b2f7Stbbdev//! \brief \ref error_guessing
51c0b2f7StbbdevTEST_CASE("Exceptions") {
51c0b2f7Stbbdev    Exceptions::test();
51c0b2f7Stbbdev}
51c0b2f7Stbbdev#endif