[NVPTX] update tests for mov.b32 canonicalization

Prince781 · Prince781 · commit 5a289eb329a8 · 2025-05-12T20:33:42.000-07:00
diff --git a/llvm/test/CodeGen/NVPTX/ldg-invariant.ll b/llvm/test/CodeGen/NVPTX/ldg-invariant.ll
@@ -130,14 +130,14 @@ define half @ld_global_v8f16(ptr addrspace(1) %ptr) {
 define float @ld_global_v2f32(ptr addrspace(1) %ptr) {
 ; CHECK-LABEL: ld_global_v2f32(
 ; CHECK:       {
-; CHECK-NEXT:    .reg .f32 %f<4>;
+; CHECK-NEXT:    .reg .b32 %f<4>;
 ; CHECK-NEXT:    .reg .b64 %rd<2>;
 ; CHECK-EMPTY:
 ; CHECK-NEXT:  // %bb.0:
-; CHECK-NEXT:    ld.param.u64 %rd1, [ld_global_v2f32_param_0];
-; CHECK-NEXT:    ld.global.nc.v2.f32 {%f1, %f2}, [%rd1];
+; CHECK-NEXT:    ld.param.b64 %rd1, [ld_global_v2f32_param_0];
+; CHECK-NEXT:    ld.global.nc.v2.b32 {%f1, %f2}, [%rd1];
 ; CHECK-NEXT:    add.rn.f32 %f3, %f1, %f2;
-; CHECK-NEXT:    st.param.f32 [func_retval0], %f3;
+; CHECK-NEXT:    st.param.b32 [func_retval0], %f3;
 ; CHECK-NEXT:    ret;
   %a = load <2 x float>, ptr addrspace(1) %ptr, !invariant.load !0
   %v1 = extractelement <2 x float> %a, i32 0
@@ -149,16 +149,16 @@ define float @ld_global_v2f32(ptr addrspace(1) %ptr) {
 define float @ld_global_v4f32(ptr addrspace(1) %ptr) {
 ; CHECK-LABEL: ld_global_v4f32(
 ; CHECK:       {
-; CHECK-NEXT:    .reg .f32 %f<8>;
+; CHECK-NEXT:    .reg .b32 %f<8>;
 ; CHECK-NEXT:    .reg .b64 %rd<2>;
 ; CHECK-EMPTY:
 ; CHECK-NEXT:  // %bb.0:
-; CHECK-NEXT:    ld.param.u64 %rd1, [ld_global_v4f32_param_0];
-; CHECK-NEXT:    ld.global.nc.v4.f32 {%f1, %f2, %f3, %f4}, [%rd1];
+; CHECK-NEXT:    ld.param.b64 %rd1, [ld_global_v4f32_param_0];
+; CHECK-NEXT:    ld.global.nc.v4.b32 {%f1, %f2, %f3, %f4}, [%rd1];
 ; CHECK-NEXT:    add.rn.f32 %f5, %f1, %f2;
 ; CHECK-NEXT:    add.rn.f32 %f6, %f3, %f4;
 ; CHECK-NEXT:    add.rn.f32 %f7, %f5, %f6;
-; CHECK-NEXT:    st.param.f32 [func_retval0], %f7;
+; CHECK-NEXT:    st.param.b32 [func_retval0], %f7;
 ; CHECK-NEXT:    ret;
   %a = load <4 x float>, ptr addrspace(1) %ptr, !invariant.load !0
   %v1 = extractelement <4 x float> %a, i32 0
@@ -174,17 +174,17 @@ define float @ld_global_v4f32(ptr addrspace(1) %ptr) {
 define float @ld_global_v8f32(ptr addrspace(1) %ptr) {
 ; CHECK-LABEL: ld_global_v8f32(
 ; CHECK:       {
-; CHECK-NEXT:    .reg .f32 %f<12>;
+; CHECK-NEXT:    .reg .b32 %f<12>;
 ; CHECK-NEXT:    .reg .b64 %rd<2>;
 ; CHECK-EMPTY:
 ; CHECK-NEXT:  // %bb.0:
-; CHECK-NEXT:    ld.param.u64 %rd1, [ld_global_v8f32_param_0];
-; CHECK-NEXT:    ld.global.nc.v4.f32 {%f1, %f2, %f3, %f4}, [%rd1+16];
-; CHECK-NEXT:    ld.global.nc.v4.f32 {%f5, %f6, %f7, %f8}, [%rd1];
+; CHECK-NEXT:    ld.param.b64 %rd1, [ld_global_v8f32_param_0];
+; CHECK-NEXT:    ld.global.nc.v4.b32 {%f1, %f2, %f3, %f4}, [%rd1+16];
+; CHECK-NEXT:    ld.global.nc.v4.b32 {%f5, %f6, %f7, %f8}, [%rd1];
 ; CHECK-NEXT:    add.rn.f32 %f9, %f5, %f7;
 ; CHECK-NEXT:    add.rn.f32 %f10, %f1, %f3;
 ; CHECK-NEXT:    add.rn.f32 %f11, %f9, %f10;
-; CHECK-NEXT:    st.param.f32 [func_retval0], %f11;
+; CHECK-NEXT:    st.param.b32 [func_retval0], %f11;
 ; CHECK-NEXT:    ret;
   %a = load <8 x float>, ptr addrspace(1) %ptr, !invariant.load !0
   %v1 = extractelement <8 x float> %a, i32 0