llvm
diff --git a/‎llvm/lib/Target/AMDGPU/SIRegisterInfo.td
Lines changed: 9 additions & 4 deletions b/‎llvm/lib/Target/AMDGPU/SIRegisterInfo.td
Lines changed: 9 additions & 4 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/buffer-fat-pointer-atomicrmw-fadd.ll
Lines changed: 86 additions & 78 deletions b/‎llvm/test/CodeGen/AMDGPU/buffer-fat-pointer-atomicrmw-fadd.ll
Lines changed: 86 additions & 78 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/buffer-fat-pointer-atomicrmw-fmax.ll
Lines changed: 84 additions & 82 deletions b/‎llvm/test/CodeGen/AMDGPU/buffer-fat-pointer-atomicrmw-fmax.ll
Lines changed: 84 additions & 82 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/buffer-fat-pointer-atomicrmw-fmin.ll
Lines changed: 84 additions & 82 deletions b/‎llvm/test/CodeGen/AMDGPU/buffer-fat-pointer-atomicrmw-fmin.ll
Lines changed: 84 additions & 82 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/chain-hi-to-lo.ll
Lines changed: 4 additions & 3 deletions b/‎llvm/test/CodeGen/AMDGPU/chain-hi-to-lo.ll
Lines changed: 4 additions & 3 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/flat-atomicrmw-fadd.ll
Lines changed: 114 additions & 104 deletions b/‎llvm/test/CodeGen/AMDGPU/flat-atomicrmw-fadd.ll
Lines changed: 114 additions & 104 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/flat-atomicrmw-fmax.ll
Lines changed: 240 additions & 261 deletions b/‎llvm/test/CodeGen/AMDGPU/flat-atomicrmw-fmax.ll
Lines changed: 240 additions & 261 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/flat-atomicrmw-fmin.ll
Lines changed: 240 additions & 261 deletions b/‎llvm/test/CodeGen/AMDGPU/flat-atomicrmw-fmin.ll
Lines changed: 240 additions & 261 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/flat-atomicrmw-fsub.ll
Lines changed: 114 additions & 104 deletions b/‎llvm/test/CodeGen/AMDGPU/flat-atomicrmw-fsub.ll
Lines changed: 114 additions & 104 deletions
diff --git a/‎llvm/test/CodeGen/AMDGPU/flat_atomics.ll
Lines changed: 62 additions & 71 deletions b/‎llvm/test/CodeGen/AMDGPU/flat_atomics.ll
Lines changed: 62 additions & 71 deletions
@@ -109,6 +109,10 @@ class SIRegisterClass <string n, list<ValueType> rTypes, int Align, dag rList>
   let TSFlags{2} = HasVGPR;
   let TSFlags{3} = HasAGPR;
   let TSFlags{4} = HasSGPR;
+
+  // RegisterClass (e.g. AGPR / VGPR) priority for allocation
+  field int RegClassPriority = 1;
+
 }
 
 multiclass SIRegLoHi16 <string n, bits<8> regIdx, bit ArtificialHigh = 1,
@@ -940,14 +944,15 @@ class VRegClassBase<int numRegs, list<ValueType> regTypes, dag regList> :
 
   // Requires n v_mov_b32 to copy
   let CopyCost = numRegs;
-  let AllocationPriority = !sub(numRegs, 1);
+  defvar SizePrioriity = !if(!le(numRegs, 14), !sub(numRegs, 1), !if(!le(numRegs, 16), 14, 15));
+  let AllocationPriority = !add(SizePrioriity, !mul(RegClassPriority, 16));
   let Weight = numRegs;
 }
 
 // Define a register tuple class, along with one requiring an even
 // aligned base register.
 multiclass VRegClass<int numRegs, list<ValueType> regTypes, dag regList> {
-  let HasVGPR = 1 in {
+  let HasVGPR = 1, RegClassPriority = 1 in {
     // Define the regular class.
     def "" : VRegClassBase<numRegs, regTypes, regList> {
       let BaseClassOrder = !mul(numRegs, 32);
@@ -981,7 +986,7 @@ defm VReg_1024 : VRegClass<32, Reg1024Types.types, (add VGPR_1024)>;
 }
 
 multiclass ARegClass<int numRegs, list<ValueType> regTypes, dag regList> {
-  let CopyCost = !add(numRegs, numRegs, 1), HasAGPR = 1 in {
+  let CopyCost = !add(numRegs, numRegs, 1), HasAGPR = 1, RegClassPriority = 1 in {
     // Define the regular class.
     def "" : VRegClassBase<numRegs, regTypes, regList> {
       let BaseClassOrder = !mul(numRegs, 32);
@@ -1074,7 +1079,7 @@ def AV_32 : SIRegisterClass<"AMDGPU", VGPR_32.RegTypes, 32, (add VGPR_32, AGPR_3
 // aligned base register.
 multiclass AVRegClass<int numRegs, list<ValueType> regTypes,
                       dag vregList,  dag aregList> {
-  let HasVGPR = 1, HasAGPR = 1 in {
+  let HasVGPR = 1, HasAGPR = 1, RegClassPriority = 0 in {
     // Define the regular class.
     def "" : VRegClassBase<numRegs, regTypes, (add vregList, aregList)>;
 
 
@@ -463,12 +463,13 @@ define <2 x half> @chain_hi_to_lo_flat(ptr inreg %ptr) {
 ; GFX11-TRUE16:       ; %bb.0: ; %bb
 ; GFX11-TRUE16-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
 ; GFX11-TRUE16-NEXT:    v_dual_mov_b32 v0, s0 :: v_dual_mov_b32 v1, s1
-; GFX11-TRUE16-NEXT:    flat_load_d16_b16 v0, v[0:1] offset:2
+; GFX11-TRUE16-NEXT:    flat_load_d16_b16 v2, v[0:1] offset:2
+; GFX11-TRUE16-NEXT:    v_mov_b32_e32 v0, 0
 ; GFX11-TRUE16-NEXT:    v_mov_b32_e32 v1, 0
-; GFX11-TRUE16-NEXT:    v_mov_b32_e32 v2, 0
 ; GFX11-TRUE16-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
-; GFX11-TRUE16-NEXT:    flat_load_d16_hi_b16 v0, v[1:2]
+; GFX11-TRUE16-NEXT:    flat_load_d16_hi_b16 v2, v[0:1]
 ; GFX11-TRUE16-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
+; GFX11-TRUE16-NEXT:    v_mov_b32_e32 v0, v2
 ; GFX11-TRUE16-NEXT:    s_setpc_b64 s[30:31]
 ;
 ; GFX11-FAKE16-LABEL: chain_hi_to_lo_flat: