python/rml/ipc_server.cpp

*51c0b2f7Stbbdev/*
*51c0b2f7Stbbdev    Copyright (c) 2017-2020 Intel Corporation
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    Licensed under the Apache License, Version 2.0 (the "License");
*51c0b2f7Stbbdev    you may not use this file except in compliance with the License.
*51c0b2f7Stbbdev    You may obtain a copy of the License at
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev        http://www.apache.org/licenses/LICENSE-2.0
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    Unless required by applicable law or agreed to in writing, software
*51c0b2f7Stbbdev    distributed under the License is distributed on an "AS IS" BASIS,
*51c0b2f7Stbbdev    WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
*51c0b2f7Stbbdev    See the License for the specific language governing permissions and
*51c0b2f7Stbbdev    limitations under the License.
*51c0b2f7Stbbdev*/
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#include <atomic>
*51c0b2f7Stbbdev#include <cstring>
*51c0b2f7Stbbdev#include <cstdlib>
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#include "../../src/tbb/rml_tbb.h"
*51c0b2f7Stbbdev#include "../../src/tbb/rml_thread_monitor.h"
*51c0b2f7Stbbdev#include "../../src/tbb/scheduler_common.h"
*51c0b2f7Stbbdev#include "../../src/tbb/governor.h"
*51c0b2f7Stbbdev#include "../../src/tbb/misc.h"
*51c0b2f7Stbbdev#include "tbb/cache_aligned_allocator.h"
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#include "ipc_utils.h"
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#include <fcntl.h>
*51c0b2f7Stbbdev#include <stdlib.h>
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevnamespace rml {
*51c0b2f7Stbbdevnamespace internal {
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevstatic const char* IPC_ENABLE_VAR_NAME = "IPC_ENABLE";
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevtypedef versioned_object::version_type version_type;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevextern "C" factory::status_type __RML_open_factory(factory& f, version_type& /*server_version*/, version_type /*client_version*/) {
*51c0b2f7Stbbdev    if( !tbb::internal::rml::get_enable_flag( IPC_ENABLE_VAR_NAME ) ) {
*51c0b2f7Stbbdev        return factory::st_incompatible;
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    // Hack to keep this library from being closed
*51c0b2f7Stbbdev    static std::atomic<bool> one_time_flag{false};
*51c0b2f7Stbbdev    bool expected = false;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    if( one_time_flag.compare_exchange_strong(expected, true) ) {
*51c0b2f7Stbbdev        __TBB_ASSERT( (size_t)f.library_handle!=factory::c_dont_unload, nullptr );
*51c0b2f7Stbbdev#if _WIN32||_WIN64
*51c0b2f7Stbbdev        f.library_handle = reinterpret_cast<HMODULE>(factory::c_dont_unload);
*51c0b2f7Stbbdev#else
*51c0b2f7Stbbdev        f.library_handle = reinterpret_cast<void*>(factory::c_dont_unload);
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    // End of hack
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    return factory::st_success;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevextern "C" void __RML_close_factory(factory& /*f*/) {
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevclass ipc_thread_monitor : public tbb::detail::r1::rml::internal::thread_monitor {
*51c0b2f7Stbbdevpublic:
*51c0b2f7Stbbdev    ipc_thread_monitor() : thread_monitor() {}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#if USE_WINTHREAD
*51c0b2f7Stbbdev#elif USE_PTHREAD
*51c0b2f7Stbbdev    static handle_type launch(thread_routine_type thread_routine, void* arg, size_t stack_size);
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev};
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#if USE_WINTHREAD
*51c0b2f7Stbbdev#elif USE_PTHREAD
*51c0b2f7Stbbdevinline ipc_thread_monitor::handle_type ipc_thread_monitor::launch(void* (*thread_routine)(void*), void* arg, size_t stack_size) {
*51c0b2f7Stbbdev    pthread_attr_t s;
*51c0b2f7Stbbdev    if( pthread_attr_init( &s ) ) return 0;
*51c0b2f7Stbbdev    if( stack_size>0 ) {
*51c0b2f7Stbbdev        if( pthread_attr_setstacksize( &s, stack_size ) ) return 0;
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    pthread_t handle;
*51c0b2f7Stbbdev    if( pthread_create( &handle, &s, thread_routine, arg ) ) return 0;
*51c0b2f7Stbbdev    if( pthread_attr_destroy( &s ) ) return 0;
*51c0b2f7Stbbdev    return handle;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev}} // rml::internal
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevusing rml::internal::ipc_thread_monitor;
*51c0b2f7Stbbdevusing tbb::internal::rml::get_shared_name;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevnamespace tbb {
*51c0b2f7Stbbdevnamespace detail {
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevnamespace r1 {
*51c0b2f7Stbbdevbool terminate_on_exception() {
*51c0b2f7Stbbdev    return false;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevnamespace rml {
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevtypedef ipc_thread_monitor::handle_type thread_handle;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevclass ipc_server;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevstatic const char* IPC_MAX_THREADS_VAR_NAME = "MAX_THREADS";
*51c0b2f7Stbbdevstatic const char* IPC_ACTIVE_SEM_PREFIX = "/__IPC_active";
*51c0b2f7Stbbdevstatic const char* IPC_STOP_SEM_PREFIX = "/__IPC_stop";
*51c0b2f7Stbbdevstatic const char* IPC_ACTIVE_SEM_VAR_NAME = "IPC_ACTIVE_SEMAPHORE";
*51c0b2f7Stbbdevstatic const char* IPC_STOP_SEM_VAR_NAME = "IPC_STOP_SEMAPHORE";
*51c0b2f7Stbbdevstatic const mode_t IPC_SEM_MODE = 0660;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevstatic std::atomic<int> my_global_thread_count;
*51c0b2f7Stbbdevusing tbb_client = tbb::detail::r1::rml::tbb_client;
*51c0b2f7Stbbdevusing tbb_server = tbb::detail::r1::rml::tbb_server;
*51c0b2f7Stbbdevusing tbb_factory = tbb::detail::r1::rml::tbb_factory;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevusing tbb::detail::r1::runtime_warning;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevchar* get_sem_name(const char* name, const char* prefix) {
*51c0b2f7Stbbdev    __TBB_ASSERT(name != nullptr, nullptr);
*51c0b2f7Stbbdev    __TBB_ASSERT(prefix != nullptr, nullptr);
*51c0b2f7Stbbdev    char* value = std::getenv(name);
*51c0b2f7Stbbdev    std::size_t len = value == nullptr ? 0 : std::strlen(value);
*51c0b2f7Stbbdev    if (len > 0) {
*51c0b2f7Stbbdev        // TODO: consider returning the original string instead of the copied string.
*51c0b2f7Stbbdev        char* sem_name = new char[len + 1];
*51c0b2f7Stbbdev        __TBB_ASSERT(sem_name != nullptr, nullptr);
*51c0b2f7Stbbdev        std::strncpy(sem_name, value, len+1);
*51c0b2f7Stbbdev        __TBB_ASSERT(sem_name[len] == 0, nullptr);
*51c0b2f7Stbbdev        return sem_name;
*51c0b2f7Stbbdev    } else {
*51c0b2f7Stbbdev        return get_shared_name(prefix);
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevchar* get_active_sem_name() {
*51c0b2f7Stbbdev    return get_sem_name(IPC_ACTIVE_SEM_VAR_NAME, IPC_ACTIVE_SEM_PREFIX);
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevchar* get_stop_sem_name() {
*51c0b2f7Stbbdev    return get_sem_name(IPC_STOP_SEM_VAR_NAME, IPC_STOP_SEM_PREFIX);
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevstatic void release_thread_sem(sem_t* my_sem) {
*51c0b2f7Stbbdev    int old = my_global_thread_count.load(std::memory_order_relaxed);
*51c0b2f7Stbbdev    do {
*51c0b2f7Stbbdev        if( old<=0 ) return;
*51c0b2f7Stbbdev    } while( !my_global_thread_count.compare_exchange_strong(old, old-1) );
*51c0b2f7Stbbdev    if( old>0 ) {
*51c0b2f7Stbbdev        sem_post( my_sem );
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevvoid set_sem_name(const char* name, const char* prefix) {
*51c0b2f7Stbbdev    __TBB_ASSERT(name != nullptr, nullptr);
*51c0b2f7Stbbdev    __TBB_ASSERT(prefix != nullptr, nullptr);
*51c0b2f7Stbbdev    const char* postfix = "_XXXXXX";
*51c0b2f7Stbbdev    std::size_t plen = std::strlen(prefix);
*51c0b2f7Stbbdev    std::size_t xlen = std::strlen(postfix);
*51c0b2f7Stbbdev    char* templ = new char[plen + xlen + 1];
*51c0b2f7Stbbdev    __TBB_ASSERT(templ != nullptr, nullptr);
*51c0b2f7Stbbdev    strncpy(templ, prefix, plen+1);
*51c0b2f7Stbbdev    __TBB_ASSERT(templ[plen] == 0, nullptr);
*51c0b2f7Stbbdev    strncat(templ, postfix, xlen + 1);
*51c0b2f7Stbbdev    __TBB_ASSERT(std::strlen(templ) == plen + xlen + 1, nullptr);
*51c0b2f7Stbbdev    // TODO: consider using mkstemp instead of mktemp.
*51c0b2f7Stbbdev    char* sem_name = mktemp(templ);
*51c0b2f7Stbbdev    if (sem_name != nullptr) {
*51c0b2f7Stbbdev        int status = setenv(name, sem_name,  /*overwrite*/ 1);
*51c0b2f7Stbbdev        __TBB_ASSERT_EX(status == 0, nullptr);
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    delete[] templ;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevextern "C" void set_active_sem_name() {
*51c0b2f7Stbbdev    set_sem_name(IPC_ACTIVE_SEM_VAR_NAME, IPC_ACTIVE_SEM_PREFIX);
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevextern "C" void set_stop_sem_name() {
*51c0b2f7Stbbdev    set_sem_name(IPC_STOP_SEM_VAR_NAME, IPC_STOP_SEM_PREFIX);
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevextern "C" void release_resources() {
*51c0b2f7Stbbdev    if( my_global_thread_count.load(std::memory_order_acquire)!=0 ) {
*51c0b2f7Stbbdev        char* active_sem_name = get_active_sem_name();
*51c0b2f7Stbbdev        sem_t* my_active_sem = sem_open( active_sem_name, O_CREAT );
*51c0b2f7Stbbdev        __TBB_ASSERT( my_active_sem, "Unable to open active threads semaphore" );
*51c0b2f7Stbbdev        delete[] active_sem_name;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev        do {
*51c0b2f7Stbbdev            release_thread_sem( my_active_sem );
*51c0b2f7Stbbdev        } while( my_global_thread_count.load(std::memory_order_acquire)!=0 );
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevextern "C" void release_semaphores() {
*51c0b2f7Stbbdev    int status = 0;
*51c0b2f7Stbbdev    char* sem_name = nullptr;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    sem_name = get_active_sem_name();
*51c0b2f7Stbbdev    if( sem_name==nullptr ) {
*51c0b2f7Stbbdev        runtime_warning("Can not get RML semaphore name");
*51c0b2f7Stbbdev        return;
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    status = sem_unlink( sem_name );
*51c0b2f7Stbbdev    if( status!=0 ) {
*51c0b2f7Stbbdev        if( errno==ENOENT ) {
*51c0b2f7Stbbdev            /* There is no semaphore with the given name, nothing to do */
*51c0b2f7Stbbdev        } else {
*51c0b2f7Stbbdev            runtime_warning("Can not release RML semaphore");
*51c0b2f7Stbbdev            return;
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    delete[] sem_name;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    sem_name = get_stop_sem_name();
*51c0b2f7Stbbdev    if( sem_name==nullptr ) {
*51c0b2f7Stbbdev        runtime_warning( "Can not get RML semaphore name" );
*51c0b2f7Stbbdev        return;
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    status = sem_unlink( sem_name );
*51c0b2f7Stbbdev    if( status!=0 ) {
*51c0b2f7Stbbdev        if( errno==ENOENT ) {
*51c0b2f7Stbbdev            /* There is no semaphore with the given name, nothing to do */
*51c0b2f7Stbbdev        } else {
*51c0b2f7Stbbdev            runtime_warning("Can not release RML semaphore");
*51c0b2f7Stbbdev            return;
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    delete[] sem_name;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevclass ipc_worker: no_copy {
*51c0b2f7Stbbdevprotected:
*51c0b2f7Stbbdev    //! State in finite-state machine that controls the worker.
*51c0b2f7Stbbdev    /** State diagram:
*51c0b2f7Stbbdev                    /----------stop---\
*51c0b2f7Stbbdev                    |           ^     |
*51c0b2f7Stbbdev                    V           |     |
*51c0b2f7Stbbdev        init --> starting --> normal  |
*51c0b2f7Stbbdev          |         |           |     |
*51c0b2f7Stbbdev          |         V           |     |
*51c0b2f7Stbbdev          \------> quit <-------/<----/
*51c0b2f7Stbbdev      */
*51c0b2f7Stbbdev    enum state_t {
*51c0b2f7Stbbdev        //! *this is initialized
*51c0b2f7Stbbdev        st_init,
*51c0b2f7Stbbdev        //! *this has associated thread that is starting up.
*51c0b2f7Stbbdev        st_starting,
*51c0b2f7Stbbdev        //! Associated thread is doing normal life sequence.
*51c0b2f7Stbbdev        st_normal,
*51c0b2f7Stbbdev        //! Associated thread is stopped but can be started again.
*51c0b2f7Stbbdev        st_stop,
*51c0b2f7Stbbdev        //! Associated thread has ended normal life sequence and promises to never touch *this again.
*51c0b2f7Stbbdev        st_quit
*51c0b2f7Stbbdev    };
*51c0b2f7Stbbdev    std::atomic<state_t> my_state;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Associated server
*51c0b2f7Stbbdev    ipc_server& my_server;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Associated client
*51c0b2f7Stbbdev    tbb_client& my_client;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! index used for avoiding the 64K aliasing problem
*51c0b2f7Stbbdev    const size_t my_index;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Monitor for sleeping when there is no work to do.
*51c0b2f7Stbbdev    /** The invariant that holds for sleeping workers is:
*51c0b2f7Stbbdev        "my_slack<=0 && my_state==st_normal && I am on server's list of asleep threads" */
*51c0b2f7Stbbdev    ipc_thread_monitor my_thread_monitor;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Handle of the OS thread associated with this worker
*51c0b2f7Stbbdev    thread_handle my_handle;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Link for list of workers that are sleeping or have no associated thread.
*51c0b2f7Stbbdev    ipc_worker* my_next;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    friend class ipc_server;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Actions executed by the associated thread
*51c0b2f7Stbbdev    void run();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Wake up associated thread (or launch a thread if there is none)
*51c0b2f7Stbbdev    bool wake_or_launch();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Called by a thread (usually not the associated thread) to commence termination.
*51c0b2f7Stbbdev    void start_shutdown(bool join);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Called by a thread (usually not the associated thread) to commence stopping.
*51c0b2f7Stbbdev    void start_stopping(bool join);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    static __RML_DECL_THREAD_ROUTINE thread_routine(void* arg);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    static void release_handle(thread_handle my_handle, bool join);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevprotected:
*51c0b2f7Stbbdev    ipc_worker(ipc_server& server, tbb_client& client, const size_t i) :
*51c0b2f7Stbbdev        my_server(server),
*51c0b2f7Stbbdev        my_client(client),
*51c0b2f7Stbbdev        my_index(i)
*51c0b2f7Stbbdev    {
*51c0b2f7Stbbdev        my_state = st_init;
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev};
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev//TODO: cannot bind to nfs_size from allocator.cpp since nfs_size is constexpr defined in another translation unit
*51c0b2f7Stbbdevconstexpr static size_t cache_line_sz = 128;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#if _MSC_VER && !defined(__INTEL_COMPILER)
*51c0b2f7Stbbdev    // Suppress overzealous compiler warnings about uninstantiable class
*51c0b2f7Stbbdev    #pragma warning(push)
*51c0b2f7Stbbdev    #pragma warning(disable:4510 4610)
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdevclass padded_ipc_worker: public ipc_worker {
*51c0b2f7Stbbdev    char pad[cache_line_sz - sizeof(ipc_worker)%cache_line_sz];
*51c0b2f7Stbbdevpublic:
*51c0b2f7Stbbdev    padded_ipc_worker(ipc_server& server, tbb_client& client, const size_t i)
*51c0b2f7Stbbdev    : ipc_worker( server,client,i ) { suppress_unused_warning(pad); }
*51c0b2f7Stbbdev};
*51c0b2f7Stbbdev#if _MSC_VER && !defined(__INTEL_COMPILER)
*51c0b2f7Stbbdev    #pragma warning(pop)
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevclass ipc_waker : public padded_ipc_worker {
*51c0b2f7Stbbdevprivate:
*51c0b2f7Stbbdev    static __RML_DECL_THREAD_ROUTINE thread_routine(void* arg);
*51c0b2f7Stbbdev    void run();
*51c0b2f7Stbbdev    bool wake_or_launch();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    friend class ipc_server;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevpublic:
*51c0b2f7Stbbdev    ipc_waker(ipc_server& server, tbb_client& client, const size_t i)
*51c0b2f7Stbbdev    : padded_ipc_worker( server, client, i ) {}
*51c0b2f7Stbbdev};
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevclass ipc_stopper : public padded_ipc_worker {
*51c0b2f7Stbbdevprivate:
*51c0b2f7Stbbdev    static __RML_DECL_THREAD_ROUTINE thread_routine(void* arg);
*51c0b2f7Stbbdev    void run();
*51c0b2f7Stbbdev    bool wake_or_launch();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    friend class ipc_server;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevpublic:
*51c0b2f7Stbbdev    ipc_stopper(ipc_server& server, tbb_client& client, const size_t i)
*51c0b2f7Stbbdev    : padded_ipc_worker( server, client, i ) {}
*51c0b2f7Stbbdev};
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevclass ipc_server: public tbb_server, no_copy {
*51c0b2f7Stbbdevprivate:
*51c0b2f7Stbbdev    tbb_client& my_client;
*51c0b2f7Stbbdev    //! Maximum number of threads to be created.
*51c0b2f7Stbbdev    /** Threads are created lazily, so maximum might not actually be reached. */
*51c0b2f7Stbbdev    tbb_client::size_type my_n_thread;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Stack size for each thread. */
*51c0b2f7Stbbdev    const size_t my_stack_size;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Number of jobs that could use their associated thread minus number of active threads.
*51c0b2f7Stbbdev    /** If negative, indicates oversubscription.
*51c0b2f7Stbbdev        If positive, indicates that more threads should run.
*51c0b2f7Stbbdev        Can be lowered asynchronously, but must be raised only while holding my_asleep_list_mutex,
*51c0b2f7Stbbdev        because raising it impacts the invariant for sleeping threads. */
*51c0b2f7Stbbdev    std::atomic<int> my_slack;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Counter used to determine when to delete this.
*51c0b2f7Stbbdev    std::atomic<int> my_ref_count;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    padded_ipc_worker* my_thread_array;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! List of workers that are asleep or committed to sleeping until notified by another thread.
*51c0b2f7Stbbdev    std::atomic<ipc_worker*> my_asleep_list_root;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Protects my_asleep_list_root
*51c0b2f7Stbbdev    typedef scheduler_mutex_type asleep_list_mutex_type;
*51c0b2f7Stbbdev    asleep_list_mutex_type my_asleep_list_mutex;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Should server wait workers while terminate
*51c0b2f7Stbbdev    const bool my_join_workers;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Service thread for waking of workers
*51c0b2f7Stbbdev    ipc_waker* my_waker;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Service thread to stop threads
*51c0b2f7Stbbdev    ipc_stopper* my_stopper;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Semaphore to account active threads
*51c0b2f7Stbbdev    sem_t* my_active_sem;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Semaphore to account stop threads
*51c0b2f7Stbbdev    sem_t* my_stop_sem;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#if TBB_USE_ASSERT
*51c0b2f7Stbbdev    std::atomic<int> my_net_slack_requests;
*51c0b2f7Stbbdev#endif /* TBB_USE_ASSERT */
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Wake up to two sleeping workers, if there are any sleeping.
*51c0b2f7Stbbdev    /** The call is used to propagate a chain reaction where each thread wakes up two threads,
*51c0b2f7Stbbdev        which in turn each wake up two threads, etc. */
*51c0b2f7Stbbdev    void propagate_chain_reaction() {
*51c0b2f7Stbbdev        // First test of a double-check idiom.  Second test is inside wake_some(0).
*51c0b2f7Stbbdev        if( my_slack.load(std::memory_order_acquire)>0 ) {
*51c0b2f7Stbbdev            int active_threads = 0;
*51c0b2f7Stbbdev            if( try_get_active_thread() ) {
*51c0b2f7Stbbdev                ++active_threads;
*51c0b2f7Stbbdev                if( try_get_active_thread() ) {
*51c0b2f7Stbbdev                    ++active_threads;
*51c0b2f7Stbbdev                }
*51c0b2f7Stbbdev                wake_some( 0, active_threads );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Try to add t to list of sleeping workers
*51c0b2f7Stbbdev    bool try_insert_in_asleep_list(ipc_worker& t);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Try to add t to list of sleeping workers even if there is some work to do
*51c0b2f7Stbbdev    bool try_insert_in_asleep_list_forced(ipc_worker& t);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Equivalent of adding additional_slack to my_slack and waking up to 2 threads if my_slack permits.
*51c0b2f7Stbbdev    void wake_some(int additional_slack, int active_threads);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Equivalent of adding additional_slack to my_slack and waking up to 1 thread if my_slack permits.
*51c0b2f7Stbbdev    void wake_one_forced(int additional_slack);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Stop one thread from asleep list
*51c0b2f7Stbbdev    bool stop_one();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Wait for active thread
*51c0b2f7Stbbdev    bool wait_active_thread();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Try to get active thread
*51c0b2f7Stbbdev    bool try_get_active_thread();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Release active thread
*51c0b2f7Stbbdev    void release_active_thread();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Wait for thread to stop
*51c0b2f7Stbbdev    bool wait_stop_thread();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    //! Add thread to stop list
*51c0b2f7Stbbdev    void add_stop_thread();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    void remove_server_ref() {
*51c0b2f7Stbbdev        if( --my_ref_count==0 ) {
*51c0b2f7Stbbdev            my_client.acknowledge_close_connection();
*51c0b2f7Stbbdev            this->~ipc_server();
*51c0b2f7Stbbdev            tbb::cache_aligned_allocator<ipc_server>().deallocate( this, 1 );
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    friend class ipc_worker;
*51c0b2f7Stbbdev    friend class ipc_waker;
*51c0b2f7Stbbdev    friend class ipc_stopper;
*51c0b2f7Stbbdevpublic:
*51c0b2f7Stbbdev    ipc_server(tbb_client& client);
*51c0b2f7Stbbdev    virtual ~ipc_server();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    version_type version() const override {
*51c0b2f7Stbbdev        return 0;
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    void request_close_connection(bool /*exiting*/) override {
*51c0b2f7Stbbdev        my_waker->start_shutdown(false);
*51c0b2f7Stbbdev        my_stopper->start_shutdown(false);
*51c0b2f7Stbbdev        for( size_t i=0; i<my_n_thread; ++i )
*51c0b2f7Stbbdev            my_thread_array[i].start_shutdown( my_join_workers );
*51c0b2f7Stbbdev        remove_server_ref();
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    void yield() override {d0::yield();}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    void independent_thread_number_changed(int) override { __TBB_ASSERT( false, nullptr ); }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    unsigned default_concurrency() const override { return my_n_thread - 1; }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    void adjust_job_count_estimate(int delta) override;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#if _WIN32||_WIN64
*51c0b2f7Stbbdev    void register_master(::rml::server::execution_resource_t&) override {}
*51c0b2f7Stbbdev    void unregister_master(::rml::server::execution_resource_t) override {}
*51c0b2f7Stbbdev#endif /* _WIN32||_WIN64 */
*51c0b2f7Stbbdev};
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev//------------------------------------------------------------------------
*51c0b2f7Stbbdev// Methods of ipc_worker
*51c0b2f7Stbbdev//------------------------------------------------------------------------
*51c0b2f7Stbbdev#if _MSC_VER && !defined(__INTEL_COMPILER)
*51c0b2f7Stbbdev    // Suppress overzealous compiler warnings about an initialized variable 'sink_for_alloca' not referenced
*51c0b2f7Stbbdev    #pragma warning(push)
*51c0b2f7Stbbdev    #pragma warning(disable:4189)
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev#if __MINGW32__ && __GNUC__==4 &&__GNUC_MINOR__>=2 && !__MINGW64__
*51c0b2f7Stbbdev// ensure that stack is properly aligned
*51c0b2f7Stbbdev__attribute__((force_align_arg_pointer))
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev__RML_DECL_THREAD_ROUTINE ipc_worker::thread_routine(void* arg) {
*51c0b2f7Stbbdev    ipc_worker* self = static_cast<ipc_worker*>(arg);
*51c0b2f7Stbbdev    AVOID_64K_ALIASING( self->my_index );
*51c0b2f7Stbbdev    self->run();
*51c0b2f7Stbbdev    return 0;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev#if _MSC_VER && !defined(__INTEL_COMPILER)
*51c0b2f7Stbbdev    #pragma warning(pop)
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevvoid ipc_worker::release_handle(thread_handle handle, bool join) {
*51c0b2f7Stbbdev    if( join )
*51c0b2f7Stbbdev        ipc_thread_monitor::join( handle );
*51c0b2f7Stbbdev    else
*51c0b2f7Stbbdev        ipc_thread_monitor::detach_thread( handle );
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevvoid ipc_worker::start_shutdown(bool join) {
*51c0b2f7Stbbdev    state_t s = my_state.load(std::memory_order_relaxed);;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    do {
*51c0b2f7Stbbdev        __TBB_ASSERT( s!=st_quit, nullptr );
*51c0b2f7Stbbdev    } while( !my_state.compare_exchange_strong( s, st_quit ) );
*51c0b2f7Stbbdev    if( s==st_normal || s==st_starting ) {
*51c0b2f7Stbbdev        // May have invalidated invariant for sleeping, so wake up the thread.
*51c0b2f7Stbbdev        // Note that the notify() here occurs without maintaining invariants for my_slack.
*51c0b2f7Stbbdev        // It does not matter, because my_state==st_quit overrides checking of my_slack.
*51c0b2f7Stbbdev        my_thread_monitor.notify();
*51c0b2f7Stbbdev        // Do not need release handle in st_init state,
*51c0b2f7Stbbdev        // because in this case the thread wasn't started yet.
*51c0b2f7Stbbdev        // For st_starting release is done at launch site.
*51c0b2f7Stbbdev        if( s==st_normal )
*51c0b2f7Stbbdev            release_handle( my_handle, join );
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevvoid ipc_worker::start_stopping(bool join) {
*51c0b2f7Stbbdev    state_t s = my_state.load(std::memory_order_relaxed);;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    while( !my_state.compare_exchange_strong( s, st_quit ) ) {};
*51c0b2f7Stbbdev    if( s==st_normal || s==st_starting ) {
*51c0b2f7Stbbdev        // May have invalidated invariant for sleeping, so wake up the thread.
*51c0b2f7Stbbdev        // Note that the notify() here occurs without maintaining invariants for my_slack.
*51c0b2f7Stbbdev        // It does not matter, because my_state==st_quit overrides checking of my_slack.
*51c0b2f7Stbbdev        my_thread_monitor.notify();
*51c0b2f7Stbbdev        // Do not need release handle in st_init state,
*51c0b2f7Stbbdev        // because in this case the thread wasn't started yet.
*51c0b2f7Stbbdev        // For st_starting release is done at launch site.
*51c0b2f7Stbbdev        if( s==st_normal )
*51c0b2f7Stbbdev            release_handle( my_handle, join );
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevvoid ipc_worker::run() {
*51c0b2f7Stbbdev    my_server.propagate_chain_reaction();
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    // Transiting to st_normal here would require setting my_handle,
*51c0b2f7Stbbdev    // which would create race with the launching thread and
*51c0b2f7Stbbdev    // complications in handle management on Windows.
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    ::rml::job& j = *my_client.create_one_job();
*51c0b2f7Stbbdev    state_t state = my_state.load(std::memory_order_acquire);
*51c0b2f7Stbbdev    while( state!=st_quit && state!=st_stop ) {
*51c0b2f7Stbbdev        if( my_server.my_slack>=0 ) {
*51c0b2f7Stbbdev            my_client.process(j);
*51c0b2f7Stbbdev        } else {
*51c0b2f7Stbbdev            ipc_thread_monitor::cookie c;
*51c0b2f7Stbbdev            // Prepare to wait
*51c0b2f7Stbbdev            my_thread_monitor.prepare_wait(c);
*51c0b2f7Stbbdev            // Check/set the invariant for sleeping
*51c0b2f7Stbbdev            state = my_state.load(std::memory_order_acquire);
*51c0b2f7Stbbdev            if( state!=st_quit && state!=st_stop && my_server.try_insert_in_asleep_list(*this) ) {
*51c0b2f7Stbbdev                if( my_server.my_n_thread > 1 ) my_server.release_active_thread();
*51c0b2f7Stbbdev                my_thread_monitor.commit_wait(c);
*51c0b2f7Stbbdev                my_server.propagate_chain_reaction();
*51c0b2f7Stbbdev            } else {
*51c0b2f7Stbbdev                // Invariant broken
*51c0b2f7Stbbdev                my_thread_monitor.cancel_wait();
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev        state = my_state.load(std::memory_order_acquire);
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    my_client.cleanup(j);
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    my_server.remove_server_ref();
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevinline bool ipc_worker::wake_or_launch() {
*51c0b2f7Stbbdev    state_t excepted_stop = st_stop, expected_init = st_init;
*51c0b2f7Stbbdev    if( ( my_state.load(std::memory_order_acquire)==st_init && my_state.compare_exchange_strong( expected_init, st_starting ) ) ||
*51c0b2f7Stbbdev        ( my_state.load(std::memory_order_acquire)==st_stop && my_state.compare_exchange_strong( excepted_stop, st_starting ) ) ) {
*51c0b2f7Stbbdev        // after this point, remove_server_ref() must be done by created thread
*51c0b2f7Stbbdev#if USE_WINTHREAD
*51c0b2f7Stbbdev        my_handle = ipc_thread_monitor::launch( thread_routine, this, my_server.my_stack_size, &this->my_index );
*51c0b2f7Stbbdev#elif USE_PTHREAD
*51c0b2f7Stbbdev        {
*51c0b2f7Stbbdev        affinity_helper fpa;
*51c0b2f7Stbbdev        fpa.protect_affinity_mask( /*restore_process_mask=*/true );
*51c0b2f7Stbbdev        my_handle = ipc_thread_monitor::launch( thread_routine, this, my_server.my_stack_size );
*51c0b2f7Stbbdev        if( my_handle == 0 ) {
*51c0b2f7Stbbdev            // Unable to create new thread for process
*51c0b2f7Stbbdev            // However, this is expected situation for the use cases of this coordination server
*51c0b2f7Stbbdev            state_t s = st_starting;
*51c0b2f7Stbbdev            my_state.compare_exchange_strong( s, st_init );
*51c0b2f7Stbbdev            if (st_starting != s) {
*51c0b2f7Stbbdev                // Do shutdown during startup. my_handle can't be released
*51c0b2f7Stbbdev                // by start_shutdown, because my_handle value might be not set yet
*51c0b2f7Stbbdev                // at time of transition from st_starting to st_quit.
*51c0b2f7Stbbdev                __TBB_ASSERT( s==st_quit, nullptr );
*51c0b2f7Stbbdev                release_handle( my_handle, my_server.my_join_workers );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev            return false;
*51c0b2f7Stbbdev        } else {
*51c0b2f7Stbbdev            my_server.my_ref_count++;
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev        // Implicit destruction of fpa resets original affinity mask.
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev#endif /* USE_PTHREAD */
*51c0b2f7Stbbdev        state_t s = st_starting;
*51c0b2f7Stbbdev        my_state.compare_exchange_strong( s, st_normal );
*51c0b2f7Stbbdev        if( st_starting!=s ) {
*51c0b2f7Stbbdev            // Do shutdown during startup. my_handle can't be released
*51c0b2f7Stbbdev            // by start_shutdown, because my_handle value might be not set yet
*51c0b2f7Stbbdev            // at time of transition from st_starting to st_quit.
*51c0b2f7Stbbdev            __TBB_ASSERT( s==st_quit, nullptr );
*51c0b2f7Stbbdev            release_handle( my_handle, my_server.my_join_workers );
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    else {
*51c0b2f7Stbbdev        my_thread_monitor.notify();
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    return true;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev//------------------------------------------------------------------------
*51c0b2f7Stbbdev// Methods of ipc_waker
*51c0b2f7Stbbdev//------------------------------------------------------------------------
*51c0b2f7Stbbdev#if _MSC_VER && !defined(__INTEL_COMPILER)
*51c0b2f7Stbbdev    // Suppress overzealous compiler warnings about an initialized variable 'sink_for_alloca' not referenced
*51c0b2f7Stbbdev    #pragma warning(push)
*51c0b2f7Stbbdev    #pragma warning(disable:4189)
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev#if __MINGW32__ && __GNUC__==4 &&__GNUC_MINOR__>=2 && !__MINGW64__
*51c0b2f7Stbbdev// ensure that stack is properly aligned
*51c0b2f7Stbbdev__attribute__((force_align_arg_pointer))
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev__RML_DECL_THREAD_ROUTINE ipc_waker::thread_routine(void* arg) {
*51c0b2f7Stbbdev    ipc_waker* self = static_cast<ipc_waker*>(arg);
*51c0b2f7Stbbdev    AVOID_64K_ALIASING( self->my_index );
*51c0b2f7Stbbdev    self->run();
*51c0b2f7Stbbdev    return 0;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev#if _MSC_VER && !defined(__INTEL_COMPILER)
*51c0b2f7Stbbdev    #pragma warning(pop)
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevvoid ipc_waker::run() {
*51c0b2f7Stbbdev    // Transiting to st_normal here would require setting my_handle,
*51c0b2f7Stbbdev    // which would create race with the launching thread and
*51c0b2f7Stbbdev    // complications in handle management on Windows.
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    while( my_state.load(std::memory_order_acquire)!=st_quit ) {
*51c0b2f7Stbbdev        bool have_to_sleep = false;
*51c0b2f7Stbbdev        if( my_server.my_slack.load(std::memory_order_acquire)>0 ) {
*51c0b2f7Stbbdev            if( my_server.wait_active_thread() ) {
*51c0b2f7Stbbdev                if( my_server.my_slack.load(std::memory_order_acquire)>0 ) {
*51c0b2f7Stbbdev                    my_server.wake_some( 0, 1 );
*51c0b2f7Stbbdev                } else {
*51c0b2f7Stbbdev                    my_server.release_active_thread();
*51c0b2f7Stbbdev                    have_to_sleep = true;
*51c0b2f7Stbbdev                }
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev        } else {
*51c0b2f7Stbbdev            have_to_sleep = true;
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev        if( have_to_sleep ) {
*51c0b2f7Stbbdev            ipc_thread_monitor::cookie c;
*51c0b2f7Stbbdev            // Prepare to wait
*51c0b2f7Stbbdev            my_thread_monitor.prepare_wait(c);
*51c0b2f7Stbbdev            // Check/set the invariant for sleeping
*51c0b2f7Stbbdev            if( my_state.load(std::memory_order_acquire)!=st_quit && my_server.my_slack.load(std::memory_order_acquire)<0 ) {
*51c0b2f7Stbbdev                my_thread_monitor.commit_wait(c);
*51c0b2f7Stbbdev            } else {
*51c0b2f7Stbbdev                // Invariant broken
*51c0b2f7Stbbdev                my_thread_monitor.cancel_wait();
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    my_server.remove_server_ref();
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevinline bool ipc_waker::wake_or_launch() {
*51c0b2f7Stbbdev    state_t excepted = st_init;
*51c0b2f7Stbbdev    if( ( my_state.load(std::memory_order_acquire)==st_init && my_state.compare_exchange_strong( excepted, st_starting ) ) ) {
*51c0b2f7Stbbdev        // after this point, remove_server_ref() must be done by created thread
*51c0b2f7Stbbdev#if USE_WINTHREAD
*51c0b2f7Stbbdev        my_handle = ipc_thread_monitor::launch( thread_routine, this, my_server.my_stack_size, &this->my_index );
*51c0b2f7Stbbdev#elif USE_PTHREAD
*51c0b2f7Stbbdev        {
*51c0b2f7Stbbdev        affinity_helper fpa;
*51c0b2f7Stbbdev        fpa.protect_affinity_mask( /*restore_process_mask=*/true );
*51c0b2f7Stbbdev        my_handle = ipc_thread_monitor::launch( thread_routine, this, my_server.my_stack_size );
*51c0b2f7Stbbdev        if( my_handle == 0 ) {
*51c0b2f7Stbbdev            runtime_warning( "Unable to create new thread for process %d", getpid() );
*51c0b2f7Stbbdev            state_t s = st_starting;
*51c0b2f7Stbbdev            my_state.compare_exchange_strong(s, st_init);
*51c0b2f7Stbbdev            if (st_starting != s) {
*51c0b2f7Stbbdev                // Do shutdown during startup. my_handle can't be released
*51c0b2f7Stbbdev                // by start_shutdown, because my_handle value might be not set yet
*51c0b2f7Stbbdev                // at time of transition from st_starting to st_quit.
*51c0b2f7Stbbdev                __TBB_ASSERT( s==st_quit, nullptr );
*51c0b2f7Stbbdev                release_handle( my_handle, my_server.my_join_workers );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev            return false;
*51c0b2f7Stbbdev        } else {
*51c0b2f7Stbbdev            my_server.my_ref_count++;
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev        // Implicit destruction of fpa resets original affinity mask.
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev#endif /* USE_PTHREAD */
*51c0b2f7Stbbdev        state_t s = st_starting;
*51c0b2f7Stbbdev        my_state.compare_exchange_strong(s, st_normal);
*51c0b2f7Stbbdev        if( st_starting!=s ) {
*51c0b2f7Stbbdev            // Do shutdown during startup. my_handle can't be released
*51c0b2f7Stbbdev            // by start_shutdown, because my_handle value might be not set yet
*51c0b2f7Stbbdev            // at time of transition from st_starting to st_quit.
*51c0b2f7Stbbdev            __TBB_ASSERT( s==st_quit, nullptr );
*51c0b2f7Stbbdev            release_handle( my_handle, my_server.my_join_workers );
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    else {
*51c0b2f7Stbbdev        my_thread_monitor.notify();
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    return true;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev//------------------------------------------------------------------------
*51c0b2f7Stbbdev// Methods of ipc_stopper
*51c0b2f7Stbbdev//------------------------------------------------------------------------
*51c0b2f7Stbbdev#if _MSC_VER && !defined(__INTEL_COMPILER)
*51c0b2f7Stbbdev    // Suppress overzealous compiler warnings about an initialized variable 'sink_for_alloca' not referenced
*51c0b2f7Stbbdev    #pragma warning(push)
*51c0b2f7Stbbdev    #pragma warning(disable:4189)
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev#if __MINGW32__ && __GNUC__==4 &&__GNUC_MINOR__>=2 && !__MINGW64__
*51c0b2f7Stbbdev// ensure that stack is properly aligned
*51c0b2f7Stbbdev__attribute__((force_align_arg_pointer))
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev__RML_DECL_THREAD_ROUTINE ipc_stopper::thread_routine(void* arg) {
*51c0b2f7Stbbdev    ipc_stopper* self = static_cast<ipc_stopper*>(arg);
*51c0b2f7Stbbdev    AVOID_64K_ALIASING( self->my_index );
*51c0b2f7Stbbdev    self->run();
*51c0b2f7Stbbdev    return 0;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev#if _MSC_VER && !defined(__INTEL_COMPILER)
*51c0b2f7Stbbdev    #pragma warning(pop)
*51c0b2f7Stbbdev#endif
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevvoid ipc_stopper::run() {
*51c0b2f7Stbbdev    // Transiting to st_normal here would require setting my_handle,
*51c0b2f7Stbbdev    // which would create race with the launching thread and
*51c0b2f7Stbbdev    // complications in handle management on Windows.
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    while( my_state.load(std::memory_order_acquire)!=st_quit ) {
*51c0b2f7Stbbdev        if( my_server.wait_stop_thread() ) {
*51c0b2f7Stbbdev            if( my_state.load(std::memory_order_acquire)!=st_quit ) {
*51c0b2f7Stbbdev                if( !my_server.stop_one() ) {
*51c0b2f7Stbbdev                    my_server.add_stop_thread();
*51c0b2f7Stbbdev                    tbb::detail::r1::prolonged_pause();
*51c0b2f7Stbbdev                }
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    my_server.remove_server_ref();
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevinline bool ipc_stopper::wake_or_launch() {
*51c0b2f7Stbbdev    state_t excepted = st_init;
*51c0b2f7Stbbdev    if( ( my_state.load(std::memory_order_acquire)==st_init && my_state.compare_exchange_strong( excepted, st_starting ) ) ) {
*51c0b2f7Stbbdev        // after this point, remove_server_ref() must be done by created thread
*51c0b2f7Stbbdev#if USE_WINTHREAD
*51c0b2f7Stbbdev        my_handle = ipc_thread_monitor::launch( thread_routine, this, my_server.my_stack_size, &this->my_index );
*51c0b2f7Stbbdev#elif USE_PTHREAD
*51c0b2f7Stbbdev        {
*51c0b2f7Stbbdev        affinity_helper fpa;
*51c0b2f7Stbbdev        fpa.protect_affinity_mask( /*restore_process_mask=*/true );
*51c0b2f7Stbbdev        my_handle = ipc_thread_monitor::launch( thread_routine, this, my_server.my_stack_size );
*51c0b2f7Stbbdev        if( my_handle == 0 ) {
*51c0b2f7Stbbdev            runtime_warning( "Unable to create new thread for process %d", getpid() );
*51c0b2f7Stbbdev            state_t s = st_starting;
*51c0b2f7Stbbdev            my_state.compare_exchange_strong(s, st_init);
*51c0b2f7Stbbdev            if (st_starting != s) {
*51c0b2f7Stbbdev                // Do shutdown during startup. my_handle can't be released
*51c0b2f7Stbbdev                // by start_shutdown, because my_handle value might be not set yet
*51c0b2f7Stbbdev                // at time of transition from st_starting to st_quit.
*51c0b2f7Stbbdev                __TBB_ASSERT( s==st_quit, nullptr );
*51c0b2f7Stbbdev                release_handle( my_handle, my_server.my_join_workers );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev            return false;
*51c0b2f7Stbbdev        } else {
*51c0b2f7Stbbdev            my_server.my_ref_count++;
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev        // Implicit destruction of fpa resets original affinity mask.
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev#endif /* USE_PTHREAD */
*51c0b2f7Stbbdev        state_t s = st_starting;
*51c0b2f7Stbbdev        my_state.compare_exchange_strong(s, st_normal);
*51c0b2f7Stbbdev        if( st_starting!=s ) {
*51c0b2f7Stbbdev            // Do shutdown during startup. my_handle can't be released
*51c0b2f7Stbbdev            // by start_shutdown, because my_handle value might be not set yet
*51c0b2f7Stbbdev            // at time of transition from st_starting to st_quit.
*51c0b2f7Stbbdev            __TBB_ASSERT( s==st_quit, nullptr );
*51c0b2f7Stbbdev            release_handle( my_handle, my_server.my_join_workers );
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    else {
*51c0b2f7Stbbdev        my_thread_monitor.notify();
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    return true;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev//------------------------------------------------------------------------
*51c0b2f7Stbbdev// Methods of ipc_server
*51c0b2f7Stbbdev//------------------------------------------------------------------------
*51c0b2f7Stbbdevipc_server::ipc_server(tbb_client& client) :
*51c0b2f7Stbbdev    my_client( client ),
*51c0b2f7Stbbdev    my_stack_size( client.min_stack_size() ),
*51c0b2f7Stbbdev    my_thread_array(nullptr),
*51c0b2f7Stbbdev    my_join_workers(false),
*51c0b2f7Stbbdev    my_waker(nullptr),
*51c0b2f7Stbbdev    my_stopper(nullptr)
*51c0b2f7Stbbdev{
*51c0b2f7Stbbdev    my_ref_count = 1;
*51c0b2f7Stbbdev    my_slack = 0;
*51c0b2f7Stbbdev#if TBB_USE_ASSERT
*51c0b2f7Stbbdev    my_net_slack_requests = 0;
*51c0b2f7Stbbdev#endif /* TBB_USE_ASSERT */
*51c0b2f7Stbbdev    my_n_thread = tbb::internal::rml::get_num_threads(IPC_MAX_THREADS_VAR_NAME);
*51c0b2f7Stbbdev    if( my_n_thread==0 ) {
*51c0b2f7Stbbdev        my_n_thread = tbb::detail::r1::AvailableHwConcurrency();
*51c0b2f7Stbbdev        __TBB_ASSERT( my_n_thread>0, nullptr );
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    my_asleep_list_root = nullptr;
*51c0b2f7Stbbdev    my_thread_array = tbb::cache_aligned_allocator<padded_ipc_worker>().allocate( my_n_thread );
*51c0b2f7Stbbdev    for( size_t i=0; i<my_n_thread; ++i ) {
*51c0b2f7Stbbdev        ipc_worker* t = new( &my_thread_array[i] ) padded_ipc_worker( *this, client, i );
*51c0b2f7Stbbdev        t->my_next = my_asleep_list_root;
*51c0b2f7Stbbdev        my_asleep_list_root = t;
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    my_waker = tbb::cache_aligned_allocator<ipc_waker>().allocate(1);
*51c0b2f7Stbbdev    new( my_waker ) ipc_waker( *this, client, my_n_thread );
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    my_stopper = tbb::cache_aligned_allocator<ipc_stopper>().allocate(1);
*51c0b2f7Stbbdev    new( my_stopper ) ipc_stopper( *this, client, my_n_thread + 1 );
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    char* active_sem_name = get_active_sem_name();
*51c0b2f7Stbbdev    my_active_sem = sem_open( active_sem_name, O_CREAT, IPC_SEM_MODE, my_n_thread - 1 );
*51c0b2f7Stbbdev    __TBB_ASSERT( my_active_sem, "Unable to open active threads semaphore" );
*51c0b2f7Stbbdev    delete[] active_sem_name;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    char* stop_sem_name = get_stop_sem_name();
*51c0b2f7Stbbdev    my_stop_sem = sem_open( stop_sem_name, O_CREAT, IPC_SEM_MODE, 0 );
*51c0b2f7Stbbdev    __TBB_ASSERT( my_stop_sem, "Unable to open stop threads semaphore" );
*51c0b2f7Stbbdev    delete[] stop_sem_name;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevipc_server::~ipc_server() {
*51c0b2f7Stbbdev    __TBB_ASSERT( my_net_slack_requests.load(std::memory_order_relaxed)==0, nullptr );
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    for( size_t i=my_n_thread; i--; )
*51c0b2f7Stbbdev        my_thread_array[i].~padded_ipc_worker();
*51c0b2f7Stbbdev    tbb::cache_aligned_allocator<padded_ipc_worker>().deallocate( my_thread_array, my_n_thread );
*51c0b2f7Stbbdev    tbb::detail::d0::poison_pointer( my_thread_array );
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    my_waker->~ipc_waker();
*51c0b2f7Stbbdev    tbb::cache_aligned_allocator<ipc_waker>().deallocate( my_waker, 1 );
*51c0b2f7Stbbdev    tbb::detail::d0::poison_pointer( my_waker );
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    my_stopper->~ipc_stopper();
*51c0b2f7Stbbdev    tbb::cache_aligned_allocator<ipc_stopper>().deallocate( my_stopper, 1 );
*51c0b2f7Stbbdev    tbb::detail::d0::poison_pointer( my_stopper );
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev    sem_close( my_active_sem );
*51c0b2f7Stbbdev    sem_close( my_stop_sem );
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevinline bool ipc_server::try_insert_in_asleep_list(ipc_worker& t) {
*51c0b2f7Stbbdev    asleep_list_mutex_type::scoped_lock lock;
*51c0b2f7Stbbdev    if( !lock.try_acquire( my_asleep_list_mutex ) )
*51c0b2f7Stbbdev        return false;
*51c0b2f7Stbbdev    // Contribute to slack under lock so that if another takes that unit of slack,
*51c0b2f7Stbbdev    // it sees us sleeping on the list and wakes us up.
*51c0b2f7Stbbdev    int k = ++my_slack;
*51c0b2f7Stbbdev    if( k<=0 ) {
*51c0b2f7Stbbdev        t.my_next = my_asleep_list_root.load(std::memory_order_relaxed);
*51c0b2f7Stbbdev        my_asleep_list_root.store(&t, std::memory_order_relaxed);
*51c0b2f7Stbbdev        return true;
*51c0b2f7Stbbdev    } else {
*51c0b2f7Stbbdev        --my_slack;
*51c0b2f7Stbbdev        return false;
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevinline bool ipc_server::try_insert_in_asleep_list_forced(ipc_worker& t) {
*51c0b2f7Stbbdev    asleep_list_mutex_type::scoped_lock lock;
*51c0b2f7Stbbdev    if( !lock.try_acquire( my_asleep_list_mutex ) )
*51c0b2f7Stbbdev        return false;
*51c0b2f7Stbbdev    // Contribute to slack under lock so that if another takes that unit of slack,
*51c0b2f7Stbbdev    // it sees us sleeping on the list and wakes us up.
*51c0b2f7Stbbdev    ++my_slack;
*51c0b2f7Stbbdev    t.my_next = my_asleep_list_root.load(std::memory_order_relaxed);
*51c0b2f7Stbbdev    my_asleep_list_root.store(&t, std::memory_order_relaxed);
*51c0b2f7Stbbdev    return true;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevinline bool ipc_server::wait_active_thread() {
*51c0b2f7Stbbdev    if( sem_wait( my_active_sem ) == 0 ) {
*51c0b2f7Stbbdev        ++my_global_thread_count;
*51c0b2f7Stbbdev        return true;
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    return false;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevinline bool ipc_server::try_get_active_thread() {
*51c0b2f7Stbbdev    if( sem_trywait( my_active_sem ) == 0 ) {
*51c0b2f7Stbbdev        ++my_global_thread_count;
*51c0b2f7Stbbdev        return true;
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    return false;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevinline void ipc_server::release_active_thread() {
*51c0b2f7Stbbdev    release_thread_sem( my_active_sem );
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevinline bool ipc_server::wait_stop_thread() {
*51c0b2f7Stbbdev    struct timespec ts;
*51c0b2f7Stbbdev    if( clock_gettime( CLOCK_REALTIME, &ts )==0 ) {
*51c0b2f7Stbbdev        ts.tv_sec++;
*51c0b2f7Stbbdev        if( sem_timedwait( my_stop_sem, &ts )==0 ) {
*51c0b2f7Stbbdev            return true;
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    return false;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevinline void ipc_server::add_stop_thread() {
*51c0b2f7Stbbdev    sem_post( my_stop_sem );
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevvoid ipc_server::wake_some( int additional_slack, int active_threads ) {
*51c0b2f7Stbbdev    __TBB_ASSERT( additional_slack>=0, nullptr );
*51c0b2f7Stbbdev    ipc_worker* wakee[2];
*51c0b2f7Stbbdev    ipc_worker **w = wakee;
*51c0b2f7Stbbdev    {
*51c0b2f7Stbbdev        asleep_list_mutex_type::scoped_lock lock(my_asleep_list_mutex);
*51c0b2f7Stbbdev        while( active_threads>0 && my_asleep_list_root.load(std::memory_order_relaxed) && w<wakee+2 ) {
*51c0b2f7Stbbdev            if( additional_slack>0 ) {
*51c0b2f7Stbbdev                if( additional_slack+my_slack.load(std::memory_order_acquire)<=0 ) // additional demand does not exceed surplus supply
*51c0b2f7Stbbdev                    break;
*51c0b2f7Stbbdev                --additional_slack;
*51c0b2f7Stbbdev            } else {
*51c0b2f7Stbbdev                // Chain reaction; Try to claim unit of slack
*51c0b2f7Stbbdev                int old;
*51c0b2f7Stbbdev                do {
*51c0b2f7Stbbdev                    old = my_slack.load(std::memory_order_relaxed);
*51c0b2f7Stbbdev                    if( old<=0 ) goto done;
*51c0b2f7Stbbdev                } while( !my_slack.compare_exchange_strong( old, old-1 ) );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev            // Pop sleeping worker to combine with claimed unit of slack
*51c0b2f7Stbbdev            my_asleep_list_root.store(
*51c0b2f7Stbbdev                (*w++ = my_asleep_list_root.load(std::memory_order_relaxed))->my_next,
*51c0b2f7Stbbdev                std::memory_order_relaxed
*51c0b2f7Stbbdev            );
*51c0b2f7Stbbdev            --active_threads;
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev        if( additional_slack ) {
*51c0b2f7Stbbdev            // Contribute our unused slack to my_slack.
*51c0b2f7Stbbdev            my_slack += additional_slack;
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdevdone:
*51c0b2f7Stbbdev    while( w>wakee ) {
*51c0b2f7Stbbdev        if( !(*--w)->wake_or_launch() ) {
*51c0b2f7Stbbdev            add_stop_thread();
*51c0b2f7Stbbdev            do {
*51c0b2f7Stbbdev            } while( !try_insert_in_asleep_list_forced(**w) );
*51c0b2f7Stbbdev            release_active_thread();
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    while( active_threads ) {
*51c0b2f7Stbbdev        release_active_thread();
*51c0b2f7Stbbdev        --active_threads;
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevvoid ipc_server::wake_one_forced( int additional_slack ) {
*51c0b2f7Stbbdev    __TBB_ASSERT( additional_slack>=0, nullptr );
*51c0b2f7Stbbdev    ipc_worker* wakee[1];
*51c0b2f7Stbbdev    ipc_worker **w = wakee;
*51c0b2f7Stbbdev    {
*51c0b2f7Stbbdev        asleep_list_mutex_type::scoped_lock lock(my_asleep_list_mutex);
*51c0b2f7Stbbdev        while( my_asleep_list_root.load(std::memory_order_relaxed) && w<wakee+1 ) {
*51c0b2f7Stbbdev            if( additional_slack>0 ) {
*51c0b2f7Stbbdev                if( additional_slack+my_slack.load(std::memory_order_acquire)<=0 ) // additional demand does not exceed surplus supply
*51c0b2f7Stbbdev                    break;
*51c0b2f7Stbbdev                --additional_slack;
*51c0b2f7Stbbdev            } else {
*51c0b2f7Stbbdev                // Chain reaction; Try to claim unit of slack
*51c0b2f7Stbbdev                int old;
*51c0b2f7Stbbdev                do {
*51c0b2f7Stbbdev                    old = my_slack.load(std::memory_order_relaxed);
*51c0b2f7Stbbdev                    if( old<=0 ) goto done;
*51c0b2f7Stbbdev                } while( !my_slack.compare_exchange_strong( old, old-1 ) );
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev            // Pop sleeping worker to combine with claimed unit of slack
*51c0b2f7Stbbdev            my_asleep_list_root.store(
*51c0b2f7Stbbdev                (*w++ = my_asleep_list_root.load(std::memory_order_relaxed))->my_next,
*51c0b2f7Stbbdev                std::memory_order_relaxed);
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev        if( additional_slack ) {
*51c0b2f7Stbbdev            // Contribute our unused slack to my_slack.
*51c0b2f7Stbbdev            my_slack += additional_slack;
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdevdone:
*51c0b2f7Stbbdev    while( w>wakee ) {
*51c0b2f7Stbbdev        if( !(*--w)->wake_or_launch() ) {
*51c0b2f7Stbbdev            add_stop_thread();
*51c0b2f7Stbbdev            do {
*51c0b2f7Stbbdev            } while( !try_insert_in_asleep_list_forced(**w) );
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevbool ipc_server::stop_one() {
*51c0b2f7Stbbdev    ipc_worker* current = nullptr;
*51c0b2f7Stbbdev    ipc_worker* next = nullptr;
*51c0b2f7Stbbdev    {
*51c0b2f7Stbbdev        asleep_list_mutex_type::scoped_lock lock(my_asleep_list_mutex);
*51c0b2f7Stbbdev        if( my_asleep_list_root.load(std::memory_order_relaxed) ) {
*51c0b2f7Stbbdev            current = my_asleep_list_root.load(std::memory_order_relaxed);
*51c0b2f7Stbbdev            if( current->my_state.load(std::memory_order_relaxed)==ipc_worker::st_normal ) {
*51c0b2f7Stbbdev                next = current->my_next;
*51c0b2f7Stbbdev                while( next!= nullptr && next->my_state.load(std::memory_order_relaxed)==ipc_worker::st_normal ) {
*51c0b2f7Stbbdev                    current = next;
*51c0b2f7Stbbdev                    next = current->my_next;
*51c0b2f7Stbbdev                }
*51c0b2f7Stbbdev                current->start_stopping( my_join_workers );
*51c0b2f7Stbbdev                return true;
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    return false;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevvoid ipc_server::adjust_job_count_estimate( int delta ) {
*51c0b2f7Stbbdev#if TBB_USE_ASSERT
*51c0b2f7Stbbdev    my_net_slack_requests+=delta;
*51c0b2f7Stbbdev#endif /* TBB_USE_ASSERT */
*51c0b2f7Stbbdev    if( my_n_thread > 1 ) {
*51c0b2f7Stbbdev        if( delta<0 ) {
*51c0b2f7Stbbdev            my_slack+=delta;
*51c0b2f7Stbbdev        } else if( delta>0 ) {
*51c0b2f7Stbbdev            int active_threads = 0;
*51c0b2f7Stbbdev            if( try_get_active_thread() ) {
*51c0b2f7Stbbdev                ++active_threads;
*51c0b2f7Stbbdev                if( try_get_active_thread() ) {
*51c0b2f7Stbbdev                    ++active_threads;
*51c0b2f7Stbbdev                }
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev            wake_some( delta, active_threads );
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev            if( !my_waker->wake_or_launch() ) {
*51c0b2f7Stbbdev                add_stop_thread();
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev            if( !my_stopper->wake_or_launch() ) {
*51c0b2f7Stbbdev                add_stop_thread();
*51c0b2f7Stbbdev            }
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    } else { // Corner case when RML shouldn't provide any worker thread but client has to have at least one
*51c0b2f7Stbbdev        if( delta<0 ) {
*51c0b2f7Stbbdev            my_slack += delta;
*51c0b2f7Stbbdev        } else {
*51c0b2f7Stbbdev            wake_one_forced( delta );
*51c0b2f7Stbbdev        }
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev//------------------------------------------------------------------------
*51c0b2f7Stbbdev// RML factory methods
*51c0b2f7Stbbdev//------------------------------------------------------------------------
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#if USE_PTHREAD
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevstatic tbb_client* my_global_client = nullptr;
*51c0b2f7Stbbdevstatic tbb_server* my_global_server = nullptr;
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevvoid rml_atexit() {
*51c0b2f7Stbbdev    release_resources();
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevvoid rml_atfork_child() {
*51c0b2f7Stbbdev    if( my_global_server!=nullptr && my_global_client!=nullptr ) {
*51c0b2f7Stbbdev        ipc_server* server = static_cast<ipc_server*>( my_global_server );
*51c0b2f7Stbbdev        server->~ipc_server();
*51c0b2f7Stbbdev        // memset( server, 0, sizeof(ipc_server) );
*51c0b2f7Stbbdev        new( server ) ipc_server( *my_global_client );
*51c0b2f7Stbbdev        pthread_atfork( nullptr, nullptr, rml_atfork_child );
*51c0b2f7Stbbdev        atexit( rml_atexit );
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev#endif /* USE_PTHREAD */
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevextern "C" tbb_factory::status_type __TBB_make_rml_server(tbb_factory& /*f*/, tbb_server*& server, tbb_client& client) {
*51c0b2f7Stbbdev    server = new( tbb::cache_aligned_allocator<ipc_server>().allocate(1) ) ipc_server(client);
*51c0b2f7Stbbdev#if USE_PTHREAD
*51c0b2f7Stbbdev    my_global_client = &client;
*51c0b2f7Stbbdev    my_global_server = server;
*51c0b2f7Stbbdev    pthread_atfork( nullptr, nullptr, rml_atfork_child );
*51c0b2f7Stbbdev    atexit( rml_atexit );
*51c0b2f7Stbbdev#endif /* USE_PTHREAD */
*51c0b2f7Stbbdev    if( getenv( "RML_DEBUG" ) ) {
*51c0b2f7Stbbdev        runtime_warning("IPC server is started");
*51c0b2f7Stbbdev    }
*51c0b2f7Stbbdev    return tbb_factory::st_success;
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdevextern "C" void __TBB_call_with_my_server_info(::rml::server_info_callback_t /*cb*/, void* /*arg*/) {
*51c0b2f7Stbbdev}
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev} // namespace rml
*51c0b2f7Stbbdev} // namespace detail
*51c0b2f7Stbbdev
*51c0b2f7Stbbdev} // namespace tbb