test/offloading/parallel_offloading_map.cpp

*f5eebc25SShilei Tian// RUN: %libomptarget-compilexx-run-and-check-aarch64-unknown-linux-gnu
*f5eebc25SShilei Tian// RUN: %libomptarget-compilexx-run-and-check-powerpc64-ibm-linux-gnu
*f5eebc25SShilei Tian// RUN: %libomptarget-compilexx-run-and-check-powerpc64le-ibm-linux-gnu
*f5eebc25SShilei Tian// RUN: %libomptarget-compilexx-run-and-check-x86_64-pc-linux-gnu
*f5eebc25SShilei Tian// RUN: %libomptarget-compilexx-run-and-check-nvptx64-nvidia-cuda
*f5eebc25SShilei Tian
*f5eebc25SShilei Tian#include <cassert>
*f5eebc25SShilei Tian#include <iostream>
*f5eebc25SShilei Tian
*f5eebc25SShilei Tianint main(int argc, char *argv[]) {
*f5eebc25SShilei Tian  constexpr const int num_threads = 64, N = 128;
*f5eebc25SShilei Tian  int array[num_threads] = {0};
*f5eebc25SShilei Tian
*f5eebc25SShilei Tian#pragma omp parallel for
*f5eebc25SShilei Tian  for (int i = 0; i < num_threads; ++i) {
*f5eebc25SShilei Tian    int tmp[N];
*f5eebc25SShilei Tian
*f5eebc25SShilei Tian    for (int j = 0; j < N; ++j) {
*f5eebc25SShilei Tian      tmp[j] = i;
*f5eebc25SShilei Tian    }
*f5eebc25SShilei Tian
*f5eebc25SShilei Tian#pragma omp target teams distribute parallel for map(tofrom : tmp)
*f5eebc25SShilei Tian    for (int j = 0; j < N; ++j) {
*f5eebc25SShilei Tian      tmp[j] += j;
*f5eebc25SShilei Tian    }
*f5eebc25SShilei Tian
*f5eebc25SShilei Tian    for (int j = 0; j < N; ++j) {
*f5eebc25SShilei Tian      array[i] += tmp[j];
*f5eebc25SShilei Tian    }
*f5eebc25SShilei Tian  }
*f5eebc25SShilei Tian
*f5eebc25SShilei Tian  // Verify
*f5eebc25SShilei Tian  for (int i = 0; i < num_threads; ++i) {
*f5eebc25SShilei Tian    const int ref = (0 + N - 1) * N / 2 + i * N;
*f5eebc25SShilei Tian    assert(array[i] == ref);
*f5eebc25SShilei Tian  }
*f5eebc25SShilei Tian
*f5eebc25SShilei Tian  std::cout << "PASS\n";
*f5eebc25SShilei Tian
*f5eebc25SShilei Tian  return 0;
*f5eebc25SShilei Tian}
*f5eebc25SShilei Tian
*f5eebc25SShilei Tian// CHECK: PASS