simplify tablegen defs for packed f32 insns

Prince781 · Prince781 · commit f676be0691a2 · 2025-02-07T21:05:55.000-08:00
diff --git a/llvm/lib/Target/NVPTX/NVPTXIntrinsics.td b/llvm/lib/Target/NVPTX/NVPTXIntrinsics.td
@@ -1582,49 +1582,34 @@ def INT_NVVM_ADD_RP_D : F_MATH_2<"add.rp.f64 \t$dst, $src0, $src1;",
   Float64Regs, Float64Regs, Float64Regs, int_nvvm_add_rp_d>;
 
 // packed f32 ops (sm_100+)
-class F32x2Op2<string OpcStr, Predicate Pred>
+
+def fadd32x2_nvptx : SDNode<"NVPTXISD::FADD_F32X2", SDTIntBinOp>;
+def fsub32x2_nvptx : SDNode<"NVPTXISD::FSUB_F32X2", SDTIntBinOp>;
+def fmul32x2_nvptx : SDNode<"NVPTXISD::FMUL_F32X2", SDTIntBinOp>;
+def fma32x2_nvptx  : SDNode<"NVPTXISD::FMA_F32X2", SDTIntTernaryOp>;
+
+class F32x2Op2<string OpcStr, SDNode Op, Predicate Pred>
 : NVPTXInst<(outs Int64Regs:$res),
             (ins Int64Regs:$a, Int64Regs:$b),
-            OpcStr # ".f32x2 \t$res, $a, $b;", []>,
+            OpcStr # ".f32x2 \t$res, $a, $b;",
+            [(set i64:$res, (Op i64:$a, i64:$b))]>,
   Requires<[hasF32x2Instructions, Pred]>;
-class F32x2Op3<string OpcStr, Predicate Pred>
+class F32x2Op3<string OpcStr, SDNode Op, Predicate Pred>
 : NVPTXInst<(outs Int64Regs:$res),
             (ins Int64Regs:$a, Int64Regs:$b, Int64Regs:$c),
-            OpcStr # ".f32x2 \t$res, $a, $b, $c;", []>,
+            OpcStr # ".f32x2 \t$res, $a, $b, $c;",
+            [(set i64:$res, (Op i64:$a, i64:$b, i64:$c))]>,
   Requires<[hasF32x2Instructions, Pred]>;
 
-def fadd32x2_nvptx : SDNode<"NVPTXISD::FADD_F32X2", SDTIntBinOp>;
-def fsub32x2_nvptx : SDNode<"NVPTXISD::FSUB_F32X2", SDTIntBinOp>;
-def fmul32x2_nvptx : SDNode<"NVPTXISD::FMUL_F32X2", SDTIntBinOp>;
-def fma32x2_nvptx  : SDNode<"NVPTXISD::FMA_F32X2", SDTIntTernaryOp>;
+def FADD32x2     : F32x2Op2<"add.rn", fadd32x2_nvptx, doNoF32FTZ>;
+def FSUB32x2     : F32x2Op2<"sub.rn", fsub32x2_nvptx, doNoF32FTZ>;
+def FMUL32x2     : F32x2Op2<"mul.rn", fmul32x2_nvptx, doNoF32FTZ>;
+def FMA32x2      : F32x2Op3<"fma.rn", fma32x2_nvptx,  doNoF32FTZ>;
 
-def FADD32x2     : F32x2Op2<"add.rn", doNoF32FTZ>;
-def FSUB32x2     : F32x2Op2<"sub.rn", doNoF32FTZ>;
-def FMUL32x2     : F32x2Op2<"mul.rn", doNoF32FTZ>;
-def FMA32x2      : F32x2Op3<"fma.rn", doNoF32FTZ>;
-
-def : Pat<(fadd32x2_nvptx i64:$a, i64:$b),
-          (FADD32x2 $a, $b)>, Requires<[doNoF32FTZ]>;
-def : Pat<(fsub32x2_nvptx i64:$a, i64:$b),
-          (FSUB32x2 $a, $b)>, Requires<[doNoF32FTZ]>;
-def : Pat<(fmul32x2_nvptx i64:$a, i64:$b),
-          (FMUL32x2 $a, $b)>, Requires<[doNoF32FTZ]>;
-def : Pat<(fma32x2_nvptx i64:$a, i64:$b, i64:$c),
-          (FMA32x2 $a, $b, $c)>, Requires<[doNoF32FTZ]>;
-
-def FADD32x2_ftz : F32x2Op2<"add.rn.ftz", doF32FTZ>;
-def FSUB32x2_ftz : F32x2Op2<"sub.rn.ftz", doF32FTZ>;
-def FMUL32x2_ftz : F32x2Op2<"mul.rn.ftz", doF32FTZ>;
-def FMA32x2_ftz  : F32x2Op3<"fma.rn.ftz", doF32FTZ>;
-
-def : Pat<(fadd32x2_nvptx i64:$a, i64:$b),
-          (FADD32x2_ftz $a, $b)>, Requires<[doF32FTZ]>;
-def : Pat<(fsub32x2_nvptx i64:$a, i64:$b),
-          (FSUB32x2_ftz $a, $b)>, Requires<[doF32FTZ]>;
-def : Pat<(fmul32x2_nvptx i64:$a, i64:$b),
-          (FMUL32x2_ftz $a, $b)>, Requires<[doF32FTZ]>;
-def : Pat<(fma32x2_nvptx i64:$a, i64:$b, i64:$c),
-          (FMA32x2_ftz $a, $b, $c)>, Requires<[doF32FTZ]>;
+def FADD32x2_ftz : F32x2Op2<"add.rn.ftz", fadd32x2_nvptx, doF32FTZ>;
+def FSUB32x2_ftz : F32x2Op2<"sub.rn.ftz", fsub32x2_nvptx, doF32FTZ>;
+def FMUL32x2_ftz : F32x2Op2<"mul.rn.ftz", fmul32x2_nvptx, doF32FTZ>;
+def FMA32x2_ftz  : F32x2Op3<"fma.rn.ftz", fma32x2_nvptx,  doF32FTZ>;
 
 //
 // BFIND