1 // RUN: %clang_cc1 -DCHECK -verify -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm %s -o - | FileCheck %s --check-prefix CHECK --check-prefix CHECK-64 2 // RUN: %clang_cc1 -DCHECK -fopenmp -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-pch -o %t %s 3 // RUN: %clang_cc1 -DCHECK -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck %s --check-prefix CHECK --check-prefix CHECK-64 4 // RUN: %clang_cc1 -DCHECK -verify -fopenmp -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-llvm %s -o - | FileCheck %s --check-prefix CHECK --check-prefix CHECK-32 5 // RUN: %clang_cc1 -DCHECK -fopenmp -x c++ -std=c++11 -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-pch -o %t %s 6 // RUN: %clang_cc1 -DCHECK -fopenmp -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck %s --check-prefix CHECK --check-prefix CHECK-32 7 8 // RUN: %clang_cc1 -DCHECK -verify -fopenmp-simd -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm %s -o - | FileCheck --check-prefix SIMD-ONLY0 %s 9 // RUN: %clang_cc1 -DCHECK -fopenmp-simd -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-pch -o %t %s 10 // RUN: %clang_cc1 -DCHECK -fopenmp-simd -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck --check-prefix SIMD-ONLY0 %s 11 // RUN: %clang_cc1 -DCHECK -verify -fopenmp-simd -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-llvm %s -o - | FileCheck --check-prefix SIMD-ONLY0 %s 12 // RUN: %clang_cc1 -DCHECK -fopenmp-simd -x c++ -std=c++11 -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-pch -o %t %s 13 // RUN: %clang_cc1 -DCHECK -fopenmp-simd -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck --check-prefix SIMD-ONLY0 %s 14 // SIMD-ONLY0-NOT: {{__kmpc|__tgt}} 15 16 // RUN: %clang_cc1 -DLAMBDA -verify -fopenmp -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm %s -o - | FileCheck %s --check-prefix LAMBDA --check-prefix LAMBDA-64 17 // RUN: %clang_cc1 -DLAMBDA -fopenmp -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-pch -o %t %s 18 // RUN: %clang_cc1 -DLAMBDA -fopenmp -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck %s --check-prefix LAMBDA --check-prefix LAMBDA-64 19 20 // RUN: %clang_cc1 -DLAMBDA -verify -fopenmp-simd -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm %s -o - | FileCheck --check-prefix SIMD-ONLY1 %s 21 // RUN: %clang_cc1 -DLAMBDA -fopenmp-simd -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-pch -o %t %s 22 // RUN: %clang_cc1 -DLAMBDA -fopenmp-simd -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck --check-prefix SIMD-ONLY1 %s 23 // SIMD-ONLY1-NOT: {{__kmpc|__tgt}} 24 25 // expected-no-diagnostics 26 #ifndef HEADER 27 #define HEADER 28 29 template <typename T> 30 T tmain() { 31 T t_var = T(); 32 T vec[] = {1, 2}; 33 #pragma omp target teams distribute simd reduction(+: t_var) 34 for (int i = 0; i < 2; ++i) { 35 t_var += (T) i; 36 } 37 return T(); 38 } 39 40 int main() { 41 static int sivar; 42 #ifdef LAMBDA 43 // LAMBDA: [[RED_VAR:@.+]] = common global [8 x {{.+}}] zeroinitializer 44 45 // LAMBDA-LABEL: @main 46 // LAMBDA: call void [[OUTER_LAMBDA:@.+]]( 47 [&]() { 48 // LAMBDA: define{{.*}} internal{{.*}} void [[OUTER_LAMBDA]]( 49 // LAMBDA: call i32 @__tgt_target_teams_mapper(i64 -1, i8* @{{[^,]+}}, i32 1, i8** %{{[^,]+}}, i8** %{{[^,]+}}, i{{64|32}}* {{.+}}@{{[^,]+}}, i32 0, i32 0), i64* {{.+}}@{{[^,]+}}, i32 0, i32 0), i8** null, i32 0, i32 1) 50 // LAMBDA: call void @[[LOFFL1:.+]]( 51 // LAMBDA: ret 52 #pragma omp target teams distribute simd reduction(+: sivar) 53 for (int i = 0; i < 2; ++i) { 54 // LAMBDA: define{{.*}} internal{{.*}} void @[[LOFFL1]](i32*{{.+}} [[SIVAR_ARG:%.+]]) 55 // LAMBDA: [[SIVAR_ADDR:%.+]] = alloca i{{.+}}*, 56 // LAMBDA: store{{.+}} [[SIVAR_ARG]], {{.+}} [[SIVAR_ADDR]], 57 // LAMBDA: [[SIVAR:%.+]] = load i32*, i32** [[SIVAR_ADDR]], 58 // LAMBDA: call void {{.+}} @__kmpc_fork_teams({{.+}}, i32 1, {{.+}} @[[LOUTL1:.+]] to {{.+}}, {{.+}} [[SIVAR]]) 59 // LAMBDA: ret void 60 61 // LAMBDA: define internal void @[[LOUTL1]]({{.+}}, {{.+}}, {{.+}}*{{.+}} [[SIVAR_ARG:%.+]]) 62 // Skip global and bound tid vars 63 // LAMBDA: {{.+}} = alloca i32*, 64 // LAMBDA: {{.+}} = alloca i32*, 65 // LAMBDA: [[SIVAR_ADDR:%.+]] = alloca i{{.+}}*, 66 // LAMBDA: [[SIVAR_PRIV:%.+]] = alloca i{{.+}}, 67 // LAMBDA: [[RED_LIST:%.+]] = alloca [1 x {{.+}}], 68 // LAMBDA: store{{.+}} [[SIVAR_ARG]], {{.+}} [[SIVAR_ADDR]], 69 // LAMBDA: [[SIVAR_REF:%.+]] = load {{.+}}, {{.+}} [[SIVAR_ADDR]], 70 // LAMBDA: store{{.+}} 0, {{.+}} [[SIVAR_PRIV]], 71 72 // LAMBDA: call void @__kmpc_for_static_init_4( 73 // LAMBDA: store{{.+}}, {{.+}} [[SIVAR_PRIV]], 74 // LAMBDA: call void [[INNER_LAMBDA:@.+]]( 75 // LAMBDA: call void @__kmpc_for_static_fini( 76 // LAMBDA: [[RED_LIST_GEP:%.+]] = getelementptr{{.+}} [[RED_LIST]], 77 // LAMBDA: [[SIVAR_PRIV_CAST:%.+]] = bitcast{{.+}} [[SIVAR_PRIV]] to 78 // LAMBDA: store{{.+}} [[SIVAR_PRIV_CAST]], {{.+}} [[RED_LIST_GEP]], 79 // LAMBDA: [[RED_LIST_BCAST:%.+]] = bitcast{{.+}} [[RED_LIST]] to 80 // LAMBDA: [[K_RED_RET:%.+]] = call{{.+}} @__kmpc_reduce({{.+}}, {{.+}}, {{.+}}, {{.+}}, {{.+}} [[RED_LIST_BCAST]], {{.+}} [[RED_FUN:@.+]], {{.+}} [[RED_VAR]]) 81 // LAMBDA: switch{{.+}} [[K_RED_RET]], label{{.+}} [ 82 // LAMBDA: {{.+}}, label %[[CASE1:.+]] 83 // LAMBDA: {{.+}}, label %[[CASE2:.+]] 84 // LAMBDA: ] 85 // LAMBDA: [[CASE1]]: 86 // LAMBDA-DAG: [[SIVAR_VAL:%.+]] = load{{.+}}, {{.+}} [[SIVAR_REF]], 87 // LAMBDA-DAG: [[SIVAR_PRIV_VAL:%.+]] = load{{.+}}, {{.+}} [[SIVAR_PRIV]], 88 // LAMBDA-DAG: [[SIVAR_INC:%.+]] = add{{.+}} [[SIVAR_VAL]], [[SIVAR_PRIV_VAL]] 89 // LAMBDA: store{{.+}} [[SIVAR_INC]], {{.+}} [[SIVAR_REF]], 90 // LAMBDA: call void @__kmpc_end_reduce({{.+}}, {{.+}}, {{.+}} [[RED_VAR]]) 91 // LAMBDA: br 92 // LAMBDA: [[CASE2]]: 93 // LAMBDA-DAG: [[SIVAR_PRIV_VAL:%.+]] = load{{.+}}, {{.+}} [[SIVAR_PRIV]], 94 // LAMBDA-DAG: [[ATOMIC_RES:%.+]] = atomicrmw add{{.+}} [[SIVAR_REF]], {{.+}} [[SIVAR_PRIV_VAL]] 95 // LAMBDA: call void @__kmpc_end_reduce({{.+}}, {{.+}}, {{.+}} [[RED_VAR]]) 96 // LAMBDA: br 97 sivar += i; 98 99 [&]() { 100 // LAMBDA: define {{.+}} void [[INNER_LAMBDA]](%{{.+}}* [[ARG_PTR:%.+]]) 101 // LAMBDA: store %{{.+}}* [[ARG_PTR]], %{{.+}}** [[ARG_PTR_REF:%.+]], 102 103 sivar += 4; 104 // LAMBDA: [[ARG_PTR:%.+]] = load %{{.+}}*, %{{.+}}** [[ARG_PTR_REF]] 105 106 // LAMBDA: [[SIVAR_PTR_REF:%.+]] = getelementptr inbounds %{{.+}}, %{{.+}}* [[ARG_PTR]], i{{[0-9]+}} 0, i{{[0-9]+}} 0 107 // LAMBDA: [[SIVAR_REF:%.+]] = load i{{[0-9]+}}*, i{{[0-9]+}}** [[SIVAR_PTR_REF]] 108 // LAMBDA: [[SIVAR_VAL:%.+]] = load i{{[0-9]+}}, i{{[0-9]+}}* [[SIVAR_REF]] 109 // LAMBDA: [[SIVAR_INC:%.+]] = add{{.+}} [[SIVAR_VAL]], 4 110 // LAMBDA: store i{{[0-9]+}} [[SIVAR_INC]], i{{[0-9]+}}* [[SIVAR_REF]] 111 }(); 112 } 113 }(); 114 return 0; 115 #else 116 #pragma omp target teams distribute simd reduction(+: sivar) 117 for (int i = 0; i < 2; ++i) { 118 sivar += i; 119 } 120 return tmain<int>(); 121 #endif 122 } 123 124 // CHECK: [[RED_VAR:@.+]] = common global [8 x {{.+}}] zeroinitializer 125 126 // CHECK: define {{.*}}i{{[0-9]+}} @main() 127 // CHECK: call i32 @__tgt_target_teams_mapper(i64 -1, i8* @{{[^,]+}}, i32 1, i8** %{{[^,]+}}, i8** %{{[^,]+}}, i{{64|32}}* {{.+}}@{{[^,]+}}, i32 0, i32 0), i64* {{.+}}@{{[^,]+}}, i32 0, i32 0), i8** null, i32 0, i32 1) 128 // CHECK: call void @[[OFFL1:.+]](i32* {{.+}}) 129 // CHECK: [[RES:%.+]] = call{{.*}} i32 @[[TMAIN_INT:[^(]+]]() 130 // CHECK: ret i32 [[RES]] 131 132 // CHECK: define{{.*}} void @[[OFFL1]](i32*{{.+}} [[SIVAR_ARG:%.+]]) 133 // CHECK: [[SIVAR_ADDR:%.+]] = alloca i{{.+}}*, 134 // CHECK: store{{.+}} [[SIVAR_ARG]], {{.+}}** [[SIVAR_ADDR]], 135 // CHECK: [[SIVAR_LOAD:%.+]] = load i32*, i32** [[SIVAR_ADDR]], 136 // CHECK: call void {{.+}} @__kmpc_fork_teams({{.+}}, i32 1, {{.+}} @[[OUTL1:.+]] to {{.+}}, {{.+}} [[SIVAR_LOAD]]) 137 // CHECK: ret void 138 139 // CHECK: define internal void @[[OUTL1]]({{.+}}, {{.+}}, i32*{{.+}} [[SIVAR_ARG:%.+]]) 140 // Skip global and bound tid vars 141 // CHECK: {{.+}} = alloca i32*, 142 // CHECK: {{.+}} = alloca i32*, 143 // CHECK: [[SIVAR_ADDR:%.+]] = alloca i{{.+}}*, 144 // CHECK: [[SIVAR_PRIV:%.+]] = alloca i32, 145 // CHECK: [[RED_LIST:%.+]] = alloca [1 x {{.+}}], 146 // CHECK: store{{.+}} [[SIVAR_ARG]], {{.+}} [[SIVAR_ADDR]], 147 // CHECK: [[SIVAR_REF:%.+]] = load i32*, i32** [[SIVAR_ADDR]], 148 // CHECK: store{{.+}} 0, {{.+}} [[SIVAR_PRIV]], 149 150 // CHECK: call void @__kmpc_for_static_init_4( 151 // CHECK: store{{.+}}, {{.+}} [[SIVAR_PRIV]], 152 // CHECK: call void @__kmpc_for_static_fini( 153 // CHECK: [[RED_LIST_GEP:%.+]] = getelementptr{{.+}} [[RED_LIST]], 154 // CHECK: [[SIVAR_PRIV_CAST:%.+]] = bitcast{{.+}} [[SIVAR_PRIV]] to 155 // CHECK: store{{.+}} [[SIVAR_PRIV_CAST]], {{.+}} [[RED_LIST_GEP]], 156 // CHECK: [[RED_LIST_BCAST:%.+]] = bitcast{{.+}} [[RED_LIST]] to 157 // CHECK: [[K_RED_RET:%.+]] = call{{.+}} @__kmpc_reduce({{.+}}, {{.+}}, {{.+}}, {{.+}}, {{.+}} [[RED_LIST_BCAST]], {{.+}} [[RED_FUN:@.+]], {{.+}} [[RED_VAR]]) 158 // CHECK: switch{{.+}} [[K_RED_RET]], label{{.+}} [ 159 // CHECK: {{.+}}, label %[[CASE1:.+]] 160 // CHECK: {{.+}}, label %[[CASE2:.+]] 161 // CHECK: ] 162 // CHECK: [[CASE1]]: 163 // CHECK-DAG: [[SIVAR_VAL:%.+]] = load{{.+}}, {{.+}} [[SIVAR_REF]], 164 // CHECK-DAG: [[SIVAR_PRIV_VAL:%.+]] = load{{.+}}, {{.+}} [[SIVAR_PRIV]], 165 // CHECK-DAG: [[SIVAR_INC:%.+]] = add{{.+}} [[SIVAR_VAL]], [[SIVAR_PRIV_VAL]] 166 // CHECK: store{{.+}} [[SIVAR_INC]], {{.+}} [[SIVAR_REF]], 167 // CHECK: call void @__kmpc_end_reduce({{.+}}, {{.+}}, {{.+}} [[RED_VAR]]) 168 // CHECK: br 169 // CHECK: [[CASE2]]: 170 // CHECK-DAG: [[SIVAR_PRIV_VAL:%.+]] = load{{.+}}, {{.+}} [[SIVAR_PRIV]], 171 // CHECK-DAG: [[ATOMIC_RES:%.+]] = atomicrmw add{{.+}} [[SIVAR_REF]], {{.+}} [[SIVAR_PRIV_VAL]] 172 // CHECK: call void @__kmpc_end_reduce({{.+}}, {{.+}}, {{.+}} [[RED_VAR]]) 173 // CHECK: br 174 175 176 // CHECK: define{{.*}} i{{[0-9]+}} @[[TMAIN_INT]]() 177 // CHECK: call i32 @__tgt_target_teams_mapper(i64 -1, i8* @{{[^,]+}}, i32 1, 178 // CHECK: call void @[[TOFFL1:.+]]({{.+}}* {{.+}}) 179 // CHECK: ret 180 181 // CHECK: define{{.*}} void @[[TOFFL1]](i32*{{.+}} [[TVAR_ARG:%.+]]) 182 // CHECK: [[TVAR_ADDR:%.+]] = alloca i{{.+}}*, 183 // CHECK: store{{.+}} [[TVAR_ARG]], {{.+}} [[TVAR_ADDR]], 184 // CHECK: [[TVAR:%.+]] = load i32*, i32** [[TVAR_ADDR]], 185 // CHECK: call void {{.+}} @__kmpc_fork_teams({{.+}}, i32 1, {{.+}} @[[TOUTL1:.+]] to {{.+}}, {{.+}} [[TVAR]]) 186 // CHECK: ret void 187 188 // CHECK: define internal void @[[TOUTL1]]({{.+}}, {{.+}}, {{.+}}*{{.+}} [[TVAR_ARG:%.+]]) 189 // Skip global and bound tid vars 190 // CHECK: {{.+}} = alloca i32*, 191 // CHECK: {{.+}} = alloca i32*, 192 // CHECK: [[TVAR_ADDR:%.+]] = alloca i{{.+}}*, 193 // CHECK: [[TVAR_PRIV:%.+]] = alloca i{{.+}}, 194 // CHECK: [[RED_LIST:%.+]] = alloca [1 x {{.+}}], 195 // CHECK: store{{.+}} [[TVAR_ARG]], {{.+}} [[TVAR_ADDR]], 196 // CHECK: [[TVAR_REF:%.+]] = load i32*, i32** [[TVAR_ADDR]], 197 // CHECK: store{{.+}} 0, {{.+}} [[TVAR_PRIV]], 198 199 // CHECK: call void @__kmpc_for_static_init_4( 200 // CHECK: store{{.+}}, {{.+}} [[TVAR_PRIV]], 201 // CHECK: call void @__kmpc_for_static_fini( 202 // CHECK: [[RED_LIST_GEP:%.+]] = getelementptr{{.+}} [[RED_LIST]], 203 // CHECK: [[TVAR_PRIV_CAST:%.+]] = bitcast{{.+}} [[TVAR_PRIV]] to 204 // CHECK: store{{.+}} [[TVAR_PRIV_CAST]], {{.+}} [[RED_LIST_GEP]], 205 // CHECK: [[RED_LIST_BCAST:%.+]] = bitcast{{.+}} [[RED_LIST]] to 206 // CHECK: [[K_RED_RET:%.+]] = call{{.+}} @__kmpc_reduce({{.+}}, {{.+}}, {{.+}}, {{.+}}, {{.+}} [[RED_LIST_BCAST]], {{.+}} [[RED_FUN:@.+]], {{.+}} [[RED_VAR]]) 207 // CHECK: switch{{.+}} [[K_RED_RET]], label{{.+}} [ 208 // CHECK: {{.+}}, label %[[CASE1:.+]] 209 // CHECK: {{.+}}, label %[[CASE2:.+]] 210 // CHECK: ] 211 // CHECK: [[CASE1]]: 212 // CHECK-DAG: [[TVAR_VAL:%.+]] = load{{.+}}, {{.+}} [[TVAR_REF]], 213 // CHECK-DAG: [[TVAR_PRIV_VAL:%.+]] = load{{.+}}, {{.+}} [[TVAR_PRIV]], 214 // CHECK-DAG: [[TVAR_INC:%.+]] = add{{.+}} [[TVAR_VAL]], [[TVAR_PRIV_VAL]] 215 // CHECK: store{{.+}} [[TVAR_INC]], {{.+}} [[TVAR_REF]], 216 // CHECK: call void @__kmpc_end_reduce({{.+}}, {{.+}}, {{.+}} [[RED_VAR]]) 217 // CHECK: br 218 // CHECK: [[CASE2]]: 219 // CHECK-DAG: [[TVAR_PRIV_VAL:%.+]] = load{{.+}}, {{.+}} [[TVAR_PRIV]], 220 // CHECK-DAG: [[ATOMIC_RES:%.+]] = atomicrmw add{{.+}} [[TVAR_REF]], {{.+}} [[TVAR_PRIV_VAL]] 221 // CHECK: call void @__kmpc_end_reduce({{.+}}, {{.+}}, {{.+}} [[RED_VAR]]) 222 // CHECK: br 223 224 #endif 225