@@ -128,14 +128,14 @@ define half @ld_global_v8f16(ptr addrspace(1) %ptr) {
128
128
define float @ld_global_v2f32 (ptr addrspace (1 ) %ptr ) {
129
129
; CHECK-LABEL: ld_global_v2f32(
130
130
; CHECK: {
131
- ; CHECK-NEXT: .reg .b32 %f <4>;
131
+ ; CHECK-NEXT: .reg .b32 %r <4>;
132
132
; CHECK-NEXT: .reg .b64 %rd<2>;
133
133
; CHECK-EMPTY:
134
134
; CHECK-NEXT: // %bb.0:
135
135
; CHECK-NEXT: ld.param.b64 %rd1, [ld_global_v2f32_param_0];
136
- ; CHECK-NEXT: ld.global.nc.v2.b32 {%f1 , %f2 }, [%rd1];
137
- ; CHECK-NEXT: add.rn.f32 %f3 , %f1 , %f2 ;
138
- ; CHECK-NEXT: st.param.b32 [func_retval0], %f3 ;
136
+ ; CHECK-NEXT: ld.global.nc.v2.b32 {%r1 , %r2 }, [%rd1];
137
+ ; CHECK-NEXT: add.rn.f32 %r3 , %r1 , %r2 ;
138
+ ; CHECK-NEXT: st.param.b32 [func_retval0], %r3 ;
139
139
; CHECK-NEXT: ret;
140
140
%a = load <2 x float >, ptr addrspace (1 ) %ptr , !invariant.load !0
141
141
%v1 = extractelement <2 x float > %a , i32 0
@@ -147,16 +147,16 @@ define float @ld_global_v2f32(ptr addrspace(1) %ptr) {
147
147
define float @ld_global_v4f32 (ptr addrspace (1 ) %ptr ) {
148
148
; CHECK-LABEL: ld_global_v4f32(
149
149
; CHECK: {
150
- ; CHECK-NEXT: .reg .b32 %f <8>;
150
+ ; CHECK-NEXT: .reg .b32 %r <8>;
151
151
; CHECK-NEXT: .reg .b64 %rd<2>;
152
152
; CHECK-EMPTY:
153
153
; CHECK-NEXT: // %bb.0:
154
154
; CHECK-NEXT: ld.param.b64 %rd1, [ld_global_v4f32_param_0];
155
- ; CHECK-NEXT: ld.global.nc.v4.b32 {%f1 , %f2 , %f3 , %f4 }, [%rd1];
156
- ; CHECK-NEXT: add.rn.f32 %f5 , %f1 , %f2 ;
157
- ; CHECK-NEXT: add.rn.f32 %f6 , %f3 , %f4 ;
158
- ; CHECK-NEXT: add.rn.f32 %f7 , %f5 , %f6 ;
159
- ; CHECK-NEXT: st.param.b32 [func_retval0], %f7 ;
155
+ ; CHECK-NEXT: ld.global.nc.v4.b32 {%r1 , %r2 , %r3 , %r4 }, [%rd1];
156
+ ; CHECK-NEXT: add.rn.f32 %r5 , %r1 , %r2 ;
157
+ ; CHECK-NEXT: add.rn.f32 %r6 , %r3 , %r4 ;
158
+ ; CHECK-NEXT: add.rn.f32 %r7 , %r5 , %r6 ;
159
+ ; CHECK-NEXT: st.param.b32 [func_retval0], %r7 ;
160
160
; CHECK-NEXT: ret;
161
161
%a = load <4 x float >, ptr addrspace (1 ) %ptr , !invariant.load !0
162
162
%v1 = extractelement <4 x float > %a , i32 0
@@ -172,17 +172,17 @@ define float @ld_global_v4f32(ptr addrspace(1) %ptr) {
172
172
define float @ld_global_v8f32 (ptr addrspace (1 ) %ptr ) {
173
173
; CHECK-LABEL: ld_global_v8f32(
174
174
; CHECK: {
175
- ; CHECK-NEXT: .reg .b32 %f <12>;
175
+ ; CHECK-NEXT: .reg .b32 %r <12>;
176
176
; CHECK-NEXT: .reg .b64 %rd<2>;
177
177
; CHECK-EMPTY:
178
178
; CHECK-NEXT: // %bb.0:
179
179
; CHECK-NEXT: ld.param.b64 %rd1, [ld_global_v8f32_param_0];
180
- ; CHECK-NEXT: ld.global.nc.v4.b32 {%f1 , %f2 , %f3 , %f4 }, [%rd1+16];
181
- ; CHECK-NEXT: ld.global.nc.v4.b32 {%f5 , %f6 , %f7 , %f8 }, [%rd1];
182
- ; CHECK-NEXT: add.rn.f32 %f9 , %f5 , %f7 ;
183
- ; CHECK-NEXT: add.rn.f32 %f10 , %f1 , %f3 ;
184
- ; CHECK-NEXT: add.rn.f32 %f11 , %f9 , %f10 ;
185
- ; CHECK-NEXT: st.param.b32 [func_retval0], %f11 ;
180
+ ; CHECK-NEXT: ld.global.nc.v4.b32 {%r1 , %r2 , %r3 , %r4 }, [%rd1+16];
181
+ ; CHECK-NEXT: ld.global.nc.v4.b32 {%r5 , %r6 , %r7 , %r8 }, [%rd1];
182
+ ; CHECK-NEXT: add.rn.f32 %r9 , %r5 , %r7 ;
183
+ ; CHECK-NEXT: add.rn.f32 %r10 , %r1 , %r3 ;
184
+ ; CHECK-NEXT: add.rn.f32 %r11 , %r9 , %r10 ;
185
+ ; CHECK-NEXT: st.param.b32 [func_retval0], %r11 ;
186
186
; CHECK-NEXT: ret;
187
187
%a = load <8 x float >, ptr addrspace (1 ) %ptr , !invariant.load !0
188
188
%v1 = extractelement <8 x float > %a , i32 0
0 commit comments