Skip to content

Commit 5963de7

Browse files
committed
update testcase change for amd and systemz
1 parent a32e690 commit 5963de7

12 files changed

+974
-974
lines changed

llvm/test/CodeGen/AMDGPU/fcanonicalize-elimination.ll

Lines changed: 23 additions & 13 deletions
Original file line numberDiff line numberDiff line change
@@ -690,19 +690,22 @@ define amdgpu_kernel void @test_fold_canonicalize_fpround_value_v2f16_v2f32(ptr
690690
; VI: ; %bb.0:
691691
; VI-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x24
692692
; VI-NEXT: v_lshlrev_b32_e32 v1, 3, v0
693+
; VI-NEXT: v_mov_b32_e32 v3, 0x3c00
693694
; VI-NEXT: v_lshlrev_b32_e32 v0, 2, v0
694695
; VI-NEXT: s_waitcnt lgkmcnt(0)
695696
; VI-NEXT: v_mov_b32_e32 v2, s1
696697
; VI-NEXT: v_add_u32_e32 v1, vcc, s0, v1
697698
; VI-NEXT: v_addc_u32_e32 v2, vcc, 0, v2, vcc
698699
; VI-NEXT: flat_load_dwordx2 v[1:2], v[1:2]
699-
; VI-NEXT: v_mov_b32_e32 v3, s3
700+
; VI-NEXT: v_mov_b32_e32 v4, s3
700701
; VI-NEXT: v_add_u32_e32 v0, vcc, s2, v0
701702
; VI-NEXT: s_waitcnt vmcnt(0)
702703
; VI-NEXT: v_cvt_f16_f32_e32 v1, v1
703-
; VI-NEXT: v_cvt_f16_f32_sdwa v2, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD
704+
; VI-NEXT: v_cvt_f16_f32_e32 v2, v2
705+
; VI-NEXT: v_mul_f16_e32 v1, 1.0, v1
706+
; VI-NEXT: v_mul_f16_sdwa v2, v2, v3 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
704707
; VI-NEXT: v_or_b32_e32 v2, v1, v2
705-
; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v3, vcc
708+
; VI-NEXT: v_addc_u32_e32 v1, vcc, 0, v4, vcc
706709
; VI-NEXT: flat_store_dword v[0:1], v2
707710
; VI-NEXT: s_endpgm
708711
;
@@ -1666,8 +1669,10 @@ define <2 x half> @v_test_canonicalize_build_vector_v2f16(<2 x half> %vec) {
16661669
; VI-LABEL: v_test_canonicalize_build_vector_v2f16:
16671670
; VI: ; %bb.0:
16681671
; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
1669-
; VI-NEXT: v_mov_b32_e32 v2, 0x4400
16701672
; VI-NEXT: v_add_f16_e32 v1, 1.0, v0
1673+
; VI-NEXT: v_mul_f16_e32 v0, 4.0, v0
1674+
; VI-NEXT: v_mov_b32_e32 v2, 0x3c00
1675+
; VI-NEXT: v_mul_f16_e32 v1, 1.0, v1
16711676
; VI-NEXT: v_mul_f16_sdwa v0, v0, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
16721677
; VI-NEXT: v_or_b32_e32 v0, v1, v0
16731678
; VI-NEXT: s_setpc_b64 s[30:31]
@@ -1694,7 +1699,9 @@ define <2 x half> @v_test_canonicalize_build_vector_noncanon1_v2f16(<2 x half> %
16941699
; VI: ; %bb.0:
16951700
; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
16961701
; VI-NEXT: v_add_f16_e32 v1, 1.0, v0
1697-
; VI-NEXT: v_max_f16_sdwa v0, v0, v0 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:WORD_1
1702+
; VI-NEXT: v_mov_b32_e32 v2, 0x3c00
1703+
; VI-NEXT: v_mul_f16_e32 v1, 1.0, v1
1704+
; VI-NEXT: v_mul_f16_sdwa v0, v0, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
16981705
; VI-NEXT: v_or_b32_e32 v0, v1, v0
16991706
; VI-NEXT: s_setpc_b64 s[30:31]
17001707
;
@@ -1718,8 +1725,9 @@ define <2 x half> @v_test_canonicalize_build_vector_noncanon0_v2f16(<2 x half> %
17181725
; VI: ; %bb.0:
17191726
; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
17201727
; VI-NEXT: v_mov_b32_e32 v1, 0x3c00
1721-
; VI-NEXT: v_add_f16_sdwa v1, v0, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
1722-
; VI-NEXT: v_max_f16_e32 v0, v0, v0
1728+
; VI-NEXT: v_add_f16_sdwa v2, v0, v1 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
1729+
; VI-NEXT: v_mul_f16_e32 v0, 1.0, v0
1730+
; VI-NEXT: v_mul_f16_sdwa v1, v2, v1 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD src1_sel:DWORD
17231731
; VI-NEXT: v_or_b32_e32 v0, v0, v1
17241732
; VI-NEXT: s_setpc_b64 s[30:31]
17251733
;
@@ -1770,9 +1778,10 @@ define <2 x half> @v_test_canonicalize_insertelement_noncanon_vec_v2f16(<2 x hal
17701778
; VI-NEXT: v_or_b32_e32 v1, v1, v3
17711779
; VI-NEXT: v_lshlrev_b32_e64 v2, v2, s4
17721780
; VI-NEXT: v_bfi_b32 v0, v2, v1, v0
1773-
; VI-NEXT: v_max_f16_sdwa v1, v0, v0 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:WORD_1
1774-
; VI-NEXT: v_max_f16_e32 v0, v0, v0
1775-
; VI-NEXT: v_or_b32_e32 v0, v0, v1
1781+
; VI-NEXT: v_mov_b32_e32 v2, 0x3c00
1782+
; VI-NEXT: v_mul_f16_e32 v1, 1.0, v0
1783+
; VI-NEXT: v_mul_f16_sdwa v0, v0, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
1784+
; VI-NEXT: v_or_b32_e32 v0, v1, v0
17761785
; VI-NEXT: s_setpc_b64 s[30:31]
17771786
;
17781787
; GFX9-LABEL: v_test_canonicalize_insertelement_noncanon_vec_v2f16:
@@ -1807,9 +1816,10 @@ define <2 x half> @v_test_canonicalize_insertelement_noncanon_insval_v2f16(<2 x
18071816
; VI-NEXT: v_or_b32_sdwa v1, v1, v3 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_0 src1_sel:DWORD
18081817
; VI-NEXT: v_lshlrev_b32_e64 v2, v2, s4
18091818
; VI-NEXT: v_bfi_b32 v0, v2, v1, v0
1810-
; VI-NEXT: v_max_f16_sdwa v1, v0, v0 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:WORD_1
1811-
; VI-NEXT: v_max_f16_e32 v0, v0, v0
1812-
; VI-NEXT: v_or_b32_e32 v0, v0, v1
1819+
; VI-NEXT: v_mov_b32_e32 v2, 0x3c00
1820+
; VI-NEXT: v_mul_f16_e32 v1, 1.0, v0
1821+
; VI-NEXT: v_mul_f16_sdwa v0, v0, v2 dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:WORD_1 src1_sel:DWORD
1822+
; VI-NEXT: v_or_b32_e32 v0, v1, v0
18131823
; VI-NEXT: s_setpc_b64 s[30:31]
18141824
;
18151825
; GFX9-LABEL: v_test_canonicalize_insertelement_noncanon_insval_v2f16:

0 commit comments

Comments
 (0)