1 // RUN: %clang_cc1 -DCHECK -verify -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm %s -o - | FileCheck %s --check-prefix CHECK --check-prefix CHECK-64 2 // RUN: %clang_cc1 -DCHECK -fopenmp -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-pch -o %t %s 3 // RUN: %clang_cc1 -DCHECK -fopenmp -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck %s --check-prefix CHECK --check-prefix CHECK-64 4 // RUN: %clang_cc1 -DCHECK -verify -fopenmp -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-llvm %s -o - | FileCheck %s --check-prefix CHECK --check-prefix CHECK-32 5 // RUN: %clang_cc1 -DCHECK -fopenmp -x c++ -std=c++11 -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-pch -o %t %s 6 // RUN: %clang_cc1 -DCHECK -fopenmp -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck %s --check-prefix CHECK --check-prefix CHECK-32 7 8 // RUN: %clang_cc1 -DCHECK -verify -fopenmp-simd -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm %s -o - | FileCheck --check-prefix SIMD-ONLY0 %s 9 // RUN: %clang_cc1 -DCHECK -fopenmp-simd -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-pch -o %t %s 10 // RUN: %clang_cc1 -DCHECK -fopenmp-simd -x c++ -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck --check-prefix SIMD-ONLY0 %s 11 // RUN: %clang_cc1 -DCHECK -verify -fopenmp-simd -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-llvm %s -o - | FileCheck --check-prefix SIMD-ONLY0 %s 12 // RUN: %clang_cc1 -DCHECK -fopenmp-simd -x c++ -std=c++11 -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -emit-pch -o %t %s 13 // RUN: %clang_cc1 -DCHECK -fopenmp-simd -x c++ -triple i386-unknown-unknown -fopenmp-targets=i386-pc-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck --check-prefix SIMD-ONLY0 %s 14 // SIMD-ONLY0-NOT: {{__kmpc|__tgt}} 15 16 // RUN: %clang_cc1 -DLAMBDA -verify -fopenmp -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm %s -o - | FileCheck %s --check-prefix LAMBDA --check-prefix LAMBDA-64 17 // RUN: %clang_cc1 -DLAMBDA -fopenmp -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-pch -o %t %s 18 // RUN: %clang_cc1 -DLAMBDA -fopenmp -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck %s --check-prefix LAMBDA --check-prefix LAMBDA-64 19 20 // RUN: %clang_cc1 -DLAMBDA -verify -fopenmp-simd -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-llvm %s -o - | FileCheck --check-prefix SIMD-ONLY1 %s 21 // RUN: %clang_cc1 -DLAMBDA -fopenmp-simd -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -emit-pch -o %t %s 22 // RUN: %clang_cc1 -DLAMBDA -fopenmp-simd -x c++ -std=c++11 -triple powerpc64le-unknown-unknown -fopenmp-targets=powerpc64le-ibm-linux-gnu -std=c++11 -include-pch %t -verify %s -emit-llvm -o - | FileCheck --check-prefix SIMD-ONLY1 %s 23 // SIMD-ONLY1-NOT: {{__kmpc|__tgt}} 24 25 // expected-no-diagnostics 26 #ifndef HEADER 27 #define HEADER 28 29 template <typename T> 30 T tmain() { 31 T t_var = T(); 32 T vec[] = {1, 2}; 33 #pragma omp target 34 #pragma omp teams 35 #pragma omp distribute simd reduction(+: t_var) 36 for (int i = 0; i < 2; ++i) { 37 t_var += (T) i; 38 } 39 return T(); 40 } 41 42 int main() { 43 static int sivar; 44 #ifdef LAMBDA 45 // LAMBDA-LABEL: @main 46 // LAMBDA: call void [[OUTER_LAMBDA:@.+]]( 47 [&]() { 48 // LAMBDA: define{{.*}} internal{{.*}} void [[OUTER_LAMBDA]]( 49 // LAMBDA: call i32 @__tgt_target_teams_mapper(i64 -1, i8* @{{[^,]+}}, i32 1, i8** %{{[^,]+}}, i8** %{{[^,]+}}, i{{64|32}}* {{.+}}@{{[^,]+}}, i32 0, i32 0), i64* {{.+}}@{{[^,]+}}, i32 0, i32 0), i8** null, i32 0, i32 1) 50 // LAMBDA: call void @[[LOFFL1:.+]]( 51 // LAMBDA: ret 52 #pragma omp target 53 #pragma omp teams 54 #pragma omp distribute simd reduction(+: sivar) 55 for (int i = 0; i < 2; ++i) { 56 // LAMBDA: define{{.*}} internal{{.*}} void @[[LOFFL1]](i{{64|32}} [[SIVAR_ARG:%.+]]) 57 // LAMBDA: [[SIVAR_ADDR:%.+]] = alloca i{{.+}}, 58 // LAMBDA: store{{.+}} [[SIVAR_ARG]], {{.+}} [[SIVAR_ADDR]], 59 // LAMBDA: [[SIVAR_CONV:%.+]] = bitcast{{.+}} [[SIVAR_ADDR]] to 60 // LAMBDA: call void {{.+}} @__kmpc_fork_teams({{.+}}, i32 1, {{.+}} @[[LOUTL1:.+]] to {{.+}}, {{.+}} [[SIVAR_CONV]]) 61 // LAMBDA: ret void 62 63 // LAMBDA: define internal void @[[LOUTL1]]({{.+}}, {{.+}}, {{.+}} [[SIVAR_ARG:%.+]]) 64 // Skip global and bound tid vars 65 // LAMBDA: {{.+}} = alloca i32*, 66 // LAMBDA: {{.+}} = alloca i32*, 67 // LAMBDA: [[SIVAR_ADDR:%.+]] = alloca i{{.+}}*, 68 // LAMBDA: alloca i{{.+}}, 69 // LAMBDA: alloca i{{.+}}, 70 // LAMBDA: alloca i{{.+}}, 71 // LAMBDA: alloca i{{.+}}, 72 // LAMBDA: alloca i{{.+}}, 73 // LAMBDA: alloca i{{.+}}, 74 // LAMBDA: [[SIVAR_PRIV:%.+]] = alloca i{{.+}}, 75 // LAMBDA: store{{.+}} [[SIVAR_ARG]], {{.+}} [[SIVAR_ADDR]], 76 // LAMBDA: [[SIVAR_REF:%.+]] = load{{.+}}, {{.+}} [[SIVAR_ADDR]] 77 // LAMBDA: store{{.+}} 0, {{.+}} [[SIVAR_PRIV]], 78 79 // LAMBDA: call void @__kmpc_for_static_init_4( 80 // LAMBDA: store{{.+}}, {{.+}} [[SIVAR_PRIV]], 81 // LAMBDA: call void [[INNER_LAMBDA:@.+]]( 82 // LAMBDA: call void @__kmpc_for_static_fini( 83 // LAMBDA: [[LAST_ITER:%.+]] = load i32, i32* % 84 // LAMBDA: [[IS_LAST:%.+]] = icmp ne i32 [[LAST_ITER]], 0 85 // LAMBDA: br i1 [[IS_LAST]], label %[[THEN:.+]], label %[[DONE:.+]] 86 // LAMBDA: [[THEN]] 87 // LAMBDA: store i32 2, i32* % 88 // LAMBDA: br label %[[DONE]] 89 // LAMBDA: [[DONE]] 90 // LAMBDA: [[SIVAR_ORIG_VAL:%.+]] = load i32, i32* [[SIVAR_REF]], 91 // LAMBDA: [[SIVAR_PRIV_VAL:%.+]] = load i32, i32* [[SIVAR_PRIV]], 92 // LAMBDA: [[ADD:%.+]] = add nsw i32 [[SIVAR_ORIG_VAL]], [[SIVAR_PRIV_VAL]] 93 // LAMBDA: store i32 [[ADD]], i32* [[SIVAR_REF]], 94 // LAMBDA: ret void 95 96 sivar += i; 97 98 [&]() { 99 // LAMBDA: define {{.+}} void [[INNER_LAMBDA]](%{{.+}}* [[ARG_PTR:%.+]]) 100 // LAMBDA: store %{{.+}}* [[ARG_PTR]], %{{.+}}** [[ARG_PTR_REF:%.+]], 101 102 sivar += 4; 103 // LAMBDA: [[ARG_PTR:%.+]] = load %{{.+}}*, %{{.+}}** [[ARG_PTR_REF]] 104 105 // LAMBDA: [[SIVAR_PTR_REF:%.+]] = getelementptr inbounds %{{.+}}, %{{.+}}* [[ARG_PTR]], i{{[0-9]+}} 0, i{{[0-9]+}} 0 106 // LAMBDA: [[SIVAR_REF:%.+]] = load i{{[0-9]+}}*, i{{[0-9]+}}** [[SIVAR_PTR_REF]] 107 // LAMBDA: [[SIVAR_VAL:%.+]] = load i{{[0-9]+}}, i{{[0-9]+}}* [[SIVAR_REF]] 108 // LAMBDA: [[SIVAR_INC:%.+]] = add{{.+}} [[SIVAR_VAL]], 4 109 // LAMBDA: store i{{[0-9]+}} [[SIVAR_INC]], i{{[0-9]+}}* [[SIVAR_REF]] 110 }(); 111 } 112 }(); 113 return 0; 114 #else 115 #pragma omp target 116 #pragma omp teams 117 #pragma omp distribute simd reduction(+: sivar) 118 for (int i = 0; i < 2; ++i) { 119 sivar += i; 120 } 121 return tmain<int>(); 122 #endif 123 } 124 125 // CHECK: define {{.*}}i{{[0-9]+}} @main() 126 // CHECK: call i32 @__tgt_target_teams_mapper(i64 -1, i8* @{{[^,]+}}, i32 1, i8** %{{[^,]+}}, i8** %{{[^,]+}}, i{{64|32}}* {{.+}}@{{[^,]+}}, i32 0, i32 0), i64* {{.+}}@{{[^,]+}}, i32 0, i32 0), i8** null, i32 0, i32 1) 127 // CHECK: call void @[[OFFL1:.+]](i{{64|32}} %{{.+}}) 128 // CHECK: {{%.+}} = call{{.*}} i32 @[[TMAIN_INT:.+]]() 129 // CHECK: ret 130 131 // CHECK: define{{.*}} void @[[OFFL1]](i{{64|32}} [[SIVAR_ARG:%.+]]) 132 // CHECK: [[SIVAR_ADDR:%.+]] = alloca i{{.+}}, 133 // CHECK: store{{.+}} [[SIVAR_ARG]], {{.+}} [[SIVAR_ADDR]], 134 // CHECK-64: [[SIVAR_CONV:%.+]] = bitcast{{.+}} [[SIVAR_ADDR]] to 135 // CHECK-64: call void {{.+}} @__kmpc_fork_teams({{.+}}, i32 1, {{.+}} @[[OUTL1:.+]] to {{.+}}, {{.+}} [[SIVAR_CONV]]) 136 // CHECK-32: call void {{.+}} @__kmpc_fork_teams({{.+}}, i32 1, {{.+}} @[[OUTL1:.+]] to {{.+}}, {{.+}} [[SIVAR_ADDR]]) 137 // CHECK: ret void 138 139 // CHECK: define internal void @[[OUTL1]]({{.+}}, {{.+}}, {{.+}} [[SIVAR_ARG:%.+]]) 140 // Skip global and bound tid vars 141 // CHECK: {{.+}} = alloca i32*, 142 // CHECK: {{.+}} = alloca i32*, 143 // CHECK: [[SIVAR_ADDR:%.+]] = alloca i{{.+}}*, 144 // CHECK: alloca i{{.+}}, 145 // CHECK: alloca i{{.+}}, 146 // CHECK: alloca i{{.+}}, 147 // CHECK: alloca i{{.+}}, 148 // CHECK: alloca i{{.+}}, 149 // CHECK: alloca i{{.+}}, 150 // CHECK: [[SIVAR_PRIV:%.+]] = alloca i{{.+}}, 151 // CHECK: store{{.+}} [[SIVAR_ARG]], {{.+}} [[SIVAR_ADDR]], 152 // CHECK: [[SIVAR_REF:%.+]] = load{{.+}}, {{.+}} [[SIVAR_ADDR]] 153 // CHECK: store{{.+}} 0, {{.+}} [[SIVAR_PRIV]], 154 155 // CHECK: call void @__kmpc_for_static_init_4( 156 // CHECK: store{{.+}}, {{.+}} [[SIVAR_PRIV]], 157 // CHECK: call void @__kmpc_for_static_fini( 158 // CHECK: [[LAST_ITER:%.+]] = load i32, i32* % 159 // CHECK: [[IS_LAST:%.+]] = icmp ne i32 [[LAST_ITER]], 0 160 // CHECK: br i1 [[IS_LAST]], label %[[THEN:.+]], label %[[DONE:.+]] 161 // CHECK: [[THEN]] 162 // CHECK: store i32 2, i32* % 163 // CHECK: br label %[[DONE]] 164 // CHECK: [[DONE]] 165 // CHECK: [[SIVAR_ORIG_VAL:%.+]] = load i32, i32* [[SIVAR_REF]], 166 // CHECK: [[SIVAR_PRIV_VAL:%.+]] = load i32, i32* [[SIVAR_PRIV]], 167 // CHECK: [[ADD:%.+]] = add nsw i32 [[SIVAR_ORIG_VAL]], [[SIVAR_PRIV_VAL]] 168 // CHECK: store i32 [[ADD]], i32* [[SIVAR_REF]], 169 // CHECK: ret void 170 171 // CHECK: define{{.*}} i{{[0-9]+}} @[[TMAIN_INT]]() 172 // CHECK: call i32 @__tgt_target_teams_mapper(i64 -1, i8* @{{[^,]+}}, i32 1, 173 // CHECK: call void @[[TOFFL1:.+]]({{.+}}) 174 // CHECK: ret 175 176 // CHECK: define{{.*}} void @[[TOFFL1]](i{{64|32}} [[TVAR_ARG:%.+]]) 177 // CHECK: [[TVAR_ADDR:%.+]] = alloca i{{.+}}, 178 // CHECK: store{{.+}} [[TVAR_ARG]], {{.+}} [[TVAR_ADDR]], 179 // CHECK-64: [[TVAR_CONV:%.+]] = bitcast{{.+}} [[TVAR_ADDR]] to 180 // CHECK-64: call void {{.+}} @__kmpc_fork_teams({{.+}}, i32 1, {{.+}} @[[TOUTL1:.+]] to {{.+}}, {{.+}} [[TVAR_CONV]]) 181 // CHECK-32: call void {{.+}} @__kmpc_fork_teams({{.+}}, i32 1, {{.+}} @[[TOUTL1:.+]] to {{.+}}, {{.+}} [[TVAR_ADDR]]) 182 // CHECK: ret void 183 184 // CHECK: define internal void @[[TOUTL1]]({{.+}}, {{.+}}, {{.+}} [[TVAR_ARG:%.+]]) 185 // Skip global and bound tid vars 186 // CHECK: {{.+}} = alloca i32*, 187 // CHECK: {{.+}} = alloca i32*, 188 // CHECK: [[TVAR_ADDR:%.+]] = alloca i{{.+}}*, 189 // CHECK: alloca i{{.+}}, 190 // CHECK: alloca i{{.+}}, 191 // CHECK: alloca i{{.+}}, 192 // CHECK: alloca i{{.+}}, 193 // CHECK: alloca i{{.+}}, 194 // CHECK: alloca i{{.+}}, 195 // CHECK: [[TVAR_PRIV:%.+]] = alloca i{{.+}}, 196 // CHECK: store{{.+}} [[TVAR_ARG]], {{.+}} [[TVAR_ADDR]], 197 // CHECK: [[TVAR_REF:%.+]] = load{{.+}}, {{.+}} [[TVAR_ADDR]] 198 // CHECK: store{{.+}} 0, {{.+}} [[TVAR_PRIV]], 199 200 // CHECK: call void @__kmpc_for_static_init_4( 201 // CHECK: store{{.+}}, {{.+}} [[TVAR_PRIV]], 202 // CHECK: call void @__kmpc_for_static_fini( 203 // CHECK: [[LAST_ITER:%.+]] = load i32, i32* % 204 // CHECK: [[IS_LAST:%.+]] = icmp ne i32 [[LAST_ITER]], 0 205 // CHECK: br i1 [[IS_LAST]], label %[[THEN:.+]], label %[[DONE:.+]] 206 // CHECK: [[THEN]] 207 // CHECK: store i32 2, i32* % 208 // CHECK: br label %[[DONE]] 209 // CHECK: [[DONE]] 210 // CHECK: [[TVAR_ORIG_VAL:%.+]] = load i32, i32* [[TVAR_REF]], 211 // CHECK: [[TVAR_PRIV_VAL:%.+]] = load i32, i32* [[TVAR_PRIV]], 212 // CHECK: [[ADD:%.+]] = add nsw i32 [[TVAR_ORIG_VAL]], [[TVAR_PRIV_VAL]] 213 // CHECK: store i32 [[ADD]], i32* [[TVAR_REF]], 214 // CHECK: ret void 215 216 // CHECK: !{!"llvm.loop.vectorize.enable", i1 true} 217 #endif 218