@@ -786,7 +786,7 @@ llvm.func @simd_simple(%lb : i64, %ub : i64, %step : i64, %arg0: !llvm.ptr) {
786
786
// CHECK-LABEL: @simd_simple_multiple
787
787
llvm.func @simd_simple_multiple (%lb1 : i64 , %ub1 : i64 , %step1 : i64 , %lb2 : i64 , %ub2 : i64 , %step2 : i64 , %arg0: !llvm.ptr , %arg1: !llvm.ptr ) {
788
788
omp.simd {
789
- omp.loop_nest (%iv1 , %iv2 ) : i64 = (%lb1 , %lb2 ) to (%ub1 , %ub2 ) inclusive step (%step1 , %step2 ) {
789
+ omp.loop_nest (%iv1 , %iv2 ) : i64 = (%lb1 , %lb2 ) to (%ub1 , %ub2 ) inclusive step (%step1 , %step2 ) collapse ( 2 ) {
790
790
%3 = llvm.mlir.constant (2.000000e+00 : f32 ) : f32
791
791
// The form of the emitted IR is controlled by OpenMPIRBuilder and
792
792
// tested there. Just check that the right metadata is added and collapsed
@@ -824,7 +824,7 @@ llvm.func @simd_simple_multiple(%lb1 : i64, %ub1 : i64, %step1 : i64, %lb2 : i64
824
824
// CHECK-LABEL: @simd_simple_multiple_simdlen
825
825
llvm.func @simd_simple_multiple_simdlen (%lb1 : i64 , %ub1 : i64 , %step1 : i64 , %lb2 : i64 , %ub2 : i64 , %step2 : i64 , %arg0: !llvm.ptr , %arg1: !llvm.ptr ) {
826
826
omp.simd simdlen (2 ) {
827
- omp.loop_nest (%iv1 , %iv2 ) : i64 = (%lb1 , %lb2 ) to (%ub1 , %ub2 ) step (%step1 , %step2 ) {
827
+ omp.loop_nest (%iv1 , %iv2 ) : i64 = (%lb1 , %lb2 ) to (%ub1 , %ub2 ) step (%step1 , %step2 ) collapse ( 2 ) {
828
828
%3 = llvm.mlir.constant (2.000000e+00 : f32 ) : f32
829
829
// The form of the emitted IR is controlled by OpenMPIRBuilder and
830
830
// tested there. Just check that the right metadata is added.
@@ -848,7 +848,7 @@ llvm.func @simd_simple_multiple_simdlen(%lb1 : i64, %ub1 : i64, %step1 : i64, %l
848
848
// CHECK-LABEL: @simd_simple_multiple_safelen
849
849
llvm.func @simd_simple_multiple_safelen (%lb1 : i64 , %ub1 : i64 , %step1 : i64 , %lb2 : i64 , %ub2 : i64 , %step2 : i64 , %arg0: !llvm.ptr , %arg1: !llvm.ptr ) {
850
850
omp.simd safelen (2 ) {
851
- omp.loop_nest (%iv1 , %iv2 ) : i64 = (%lb1 , %lb2 ) to (%ub1 , %ub2 ) step (%step1 , %step2 ) {
851
+ omp.loop_nest (%iv1 , %iv2 ) : i64 = (%lb1 , %lb2 ) to (%ub1 , %ub2 ) step (%step1 , %step2 ) collapse ( 2 ) {
852
852
%3 = llvm.mlir.constant (2.000000e+00 : f32 ) : f32
853
853
%4 = llvm.getelementptr %arg0 [%iv1 ] : (!llvm.ptr , i64 ) -> !llvm.ptr , f32
854
854
%5 = llvm.getelementptr %arg1 [%iv2 ] : (!llvm.ptr , i64 ) -> !llvm.ptr , f32
@@ -867,7 +867,7 @@ llvm.func @simd_simple_multiple_safelen(%lb1 : i64, %ub1 : i64, %step1 : i64, %l
867
867
// CHECK-LABEL: @simd_simple_multiple_simdlen_safelen
868
868
llvm.func @simd_simple_multiple_simdlen_safelen (%lb1 : i64 , %ub1 : i64 , %step1 : i64 , %lb2 : i64 , %ub2 : i64 , %step2 : i64 , %arg0: !llvm.ptr , %arg1: !llvm.ptr ) {
869
869
omp.simd simdlen (1 ) safelen (2 ) {
870
- omp.loop_nest (%iv1 , %iv2 ) : i64 = (%lb1 , %lb2 ) to (%ub1 , %ub2 ) step (%step1 , %step2 ) {
870
+ omp.loop_nest (%iv1 , %iv2 ) : i64 = (%lb1 , %lb2 ) to (%ub1 , %ub2 ) step (%step1 , %step2 ) collapse ( 2 ) {
871
871
%3 = llvm.mlir.constant (2.000000e+00 : f32 ) : f32
872
872
%4 = llvm.getelementptr %arg0 [%iv1 ] : (!llvm.ptr , i64 ) -> !llvm.ptr , f32
873
873
%5 = llvm.getelementptr %arg1 [%iv2 ] : (!llvm.ptr , i64 ) -> !llvm.ptr , f32
@@ -1267,7 +1267,7 @@ llvm.func @collapse_wsloop(
1267
1267
// CHECK: store i32 %[[TOTAL_SUB_1]], ptr
1268
1268
// CHECK: call void @__kmpc_for_static_init_4u
1269
1269
omp.wsloop {
1270
- omp.loop_nest (%arg0 , %arg1 , %arg2 ) : i32 = (%0 , %1 , %2 ) to (%3 , %4 , %5 ) step (%6 , %7 , %8 ) {
1270
+ omp.loop_nest (%arg0 , %arg1 , %arg2 ) : i32 = (%0 , %1 , %2 ) to (%3 , %4 , %5 ) step (%6 , %7 , %8 ) collapse ( 3 ) {
1271
1271
%31 = llvm.load %20 : !llvm.ptr -> i32
1272
1272
%32 = llvm.add %31 , %arg0 : i32
1273
1273
%33 = llvm.add %32 , %arg1 : i32
@@ -1329,7 +1329,7 @@ llvm.func @collapse_wsloop_dynamic(
1329
1329
// CHECK: store i32 %[[TOTAL]], ptr
1330
1330
// CHECK: call void @__kmpc_dispatch_init_4u
1331
1331
omp.wsloop schedule (dynamic ) {
1332
- omp.loop_nest (%arg0 , %arg1 , %arg2 ) : i32 = (%0 , %1 , %2 ) to (%3 , %4 , %5 ) step (%6 , %7 , %8 ) {
1332
+ omp.loop_nest (%arg0 , %arg1 , %arg2 ) : i32 = (%0 , %1 , %2 ) to (%3 , %4 , %5 ) step (%6 , %7 , %8 ) collapse ( 3 ) {
1333
1333
%31 = llvm.load %20 : !llvm.ptr -> i32
1334
1334
%32 = llvm.add %31 , %arg0 : i32
1335
1335
%33 = llvm.add %32 , %arg1 : i32
0 commit comments