Merge pull request #841 from Devsh-Graphics-Programming/new_tgmath

Przemog1 · web-flow · commit ae281be816a3 · 2025-02-25T12:52:17.000+01:00
New tgmath
diff --git a/examples_tests b/examples_tests
@@ -1 +1 @@
-Subproject commit ff95b3bd8f58190aea2e1f961f414c7d195f6c4d
+Subproject commit e2e8ed0874f94fdb2850ec7756b5976d6a284cc8
diff --git a/include/nbl/builtin/hlsl/cpp_compat/impl/intrinsics_impl.hlsl b/include/nbl/builtin/hlsl/cpp_compat/impl/intrinsics_impl.hlsl
@@ -23,6 +23,22 @@ namespace hlsl
 namespace cpp_compat_intrinsics_impl
 {
 
+template<typename UnsignedInteger NBL_FUNC_REQUIRES(hlsl::is_integral_v<UnsignedInteger>&& hlsl::is_unsigned_v<UnsignedInteger>)
+inline bool isnan_uint_impl(UnsignedInteger val)
+{
+	using AsFloat = typename float_of_size<sizeof(UnsignedInteger)>::type;
+	NBL_CONSTEXPR UnsignedInteger Mask = (UnsignedInteger(0) - 1) >> 1;
+	UnsignedInteger absVal = val & Mask;
+	return absVal > (ieee754::traits<AsFloat>::specialValueExp << ieee754::traits<AsFloat>::mantissaBitCnt);
+}
+
+template<typename UnsignedInteger NBL_FUNC_REQUIRES(hlsl::is_integral_v<UnsignedInteger>&& hlsl::is_unsigned_v<UnsignedInteger>)
+inline bool isinf_uint_impl(UnsignedInteger val)
+{
+	using AsFloat = typename float_of_size<sizeof(UnsignedInteger)>::type;
+	return (val & (~ieee754::traits<AsFloat>::signMask)) == ieee754::traits<AsFloat>::inf;
+}
+
 template<typename T NBL_STRUCT_CONSTRAINABLE>
 struct dot_helper;
 template<typename T NBL_STRUCT_CONSTRAINABLE>
@@ -252,22 +268,6 @@ struct cross_helper<T NBL_PARTIAL_REQ_BOT(concepts::FloatingPointVector<T> && (v
 
 #else // C++ only specializations
 
-template<typename UnsignedInteger NBL_FUNC_REQUIRES(hlsl::is_integral_v<UnsignedInteger>&& hlsl::is_unsigned_v<UnsignedInteger>)
-inline bool isnan_uint_impl(UnsignedInteger val)
-{
-	using AsFloat = typename float_of_size<sizeof(UnsignedInteger)>::type;
-	constexpr UnsignedInteger Mask = (static_cast<UnsignedInteger>(0) - 1) >> 1;
-	UnsignedInteger absVal = val & Mask;
-	return absVal > (ieee754::traits<AsFloat>::specialValueExp << ieee754::traits<AsFloat>::mantissaBitCnt);
-}
-
-template<typename UnsignedInteger NBL_FUNC_REQUIRES(hlsl::is_integral_v<UnsignedInteger>&& hlsl::is_unsigned_v<UnsignedInteger>)
-inline bool isinf_uint_impl(UnsignedInteger val)
-{
-	using AsFloat = typename float_of_size<sizeof(UnsignedInteger)>::type;
-	return (val & (~ieee754::traits<AsFloat>::signMask)) == ieee754::traits<AsFloat>::inf;
-}
-
 #define DECL_ARG(r,data,i,_T) BOOST_PP_COMMA_IF(BOOST_PP_NOT_EQUAL(i,0)) const _T arg##i
 #define WRAP(r,data,i,_T) BOOST_PP_COMMA_IF(BOOST_PP_NOT_EQUAL(i,0)) _T
 #define ARG(r,data,i,_T) BOOST_PP_COMMA_IF(BOOST_PP_NOT_EQUAL(i,0)) arg##i
diff --git a/include/nbl/builtin/hlsl/emulated/float64_t.hlsl b/include/nbl/builtin/hlsl/emulated/float64_t.hlsl
@@ -97,8 +97,8 @@ namespace hlsl
             {
                 if(!FastMath)
                 {
-                    const bool isRhsInf = tgmath_impl::isinf_uint_impl(rhs.data);
-                    if (tgmath_impl::isinf_uint_impl(data))
+                    const bool isRhsInf = cpp_compat_intrinsics_impl::isinf_uint_impl(rhs.data);
+                    if (cpp_compat_intrinsics_impl::isinf_uint_impl(data))
                     {
                         if (isRhsInf && ((data ^ rhs.data) & ieee754::traits<float64_t>::signMask))
                             return bit_cast<this_t>(ieee754::traits<float64_t>::quietNaN | ieee754::traits<float64_t>::signMask);
@@ -116,7 +116,7 @@ namespace hlsl
                  
                 if(!FastMath)
                 {
-                    if (tgmath_impl::isinf_uint_impl(data))
+                    if (cpp_compat_intrinsics_impl::isinf_uint_impl(data))
                         return bit_cast<this_t>(ieee754::traits<float64_t>::inf | ieee754::extractSignPreserveBitPattern(max(data, rhs.data)));
                 }
 
@@ -226,9 +226,9 @@ namespace hlsl
                 uint64_t sign = (data ^ rhs.data) & ieee754::traits<float64_t>::signMask;
                 if (!FastMath)
                 {
-                    if (tgmath_impl::isnan_uint_impl(data) || tgmath_impl::isnan_uint_impl(rhs.data))
+                    if (cpp_compat_intrinsics_impl::isnan_uint_impl(data) || cpp_compat_intrinsics_impl::isnan_uint_impl(rhs.data))
                         return bit_cast<this_t>(ieee754::traits<float64_t>::quietNaN | sign);
-                    if (tgmath_impl::isinf_uint_impl(data) || tgmath_impl::isinf_uint_impl(rhs.data))
+                    if (cpp_compat_intrinsics_impl::isinf_uint_impl(data) || cpp_compat_intrinsics_impl::isinf_uint_impl(rhs.data))
                         return bit_cast<this_t>(ieee754::traits<float64_t>::inf | sign);
                     if (emulated_float64_t_impl::isZero(data) || emulated_float64_t_impl::isZero(rhs.data))
                         return bit_cast<this_t>(sign);
@@ -289,17 +289,17 @@ namespace hlsl
 
                 if(!FastMath)
                 {
-                    if (tgmath_impl::isnan_uint_impl<uint64_t>(data) || tgmath_impl::isnan_uint_impl<uint64_t>(rhs.data))
+                    if (cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(data) || cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(rhs.data))
                         return bit_cast<this_t>(ieee754::traits<float64_t>::quietNaN);
                     if (emulated_float64_t_impl::areBothZero(data, rhs.data))
                         return bit_cast<this_t>(ieee754::traits<float64_t>::quietNaN | sign);
                     if (emulated_float64_t_impl::isZero(rhs.data))
                         return bit_cast<this_t>(ieee754::traits<float64_t>::inf | sign);
                     if (emulated_float64_t_impl::areBothInfinity(data, rhs.data))
                         return bit_cast<this_t>(ieee754::traits<float64_t>::quietNaN | ieee754::traits<float64_t>::signMask);
-                    if (tgmath_impl::isinf_uint_impl(data))
+                    if (cpp_compat_intrinsics_impl::isinf_uint_impl(data))
                         return bit_cast<this_t>(ieee754::traits<float64_t>::inf | sign);
-                    if (tgmath_impl::isinf_uint_impl(rhs.data))
+                    if (cpp_compat_intrinsics_impl::isinf_uint_impl(rhs.data))
                         return bit_cast<this_t>(sign);
                 }
 
@@ -346,7 +346,7 @@ namespace hlsl
         {
             if (!FastMath)
             {
-                if (tgmath_impl::isnan_uint_impl<uint64_t>(data) || tgmath_impl::isnan_uint_impl<uint64_t>(rhs.data))
+                if (cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(data) || cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(rhs.data))
                     return false;
                 if (emulated_float64_t_impl::areBothZero(data, rhs.data))
                     return true;
@@ -356,7 +356,7 @@ namespace hlsl
         }
         bool operator!=(this_t rhs) NBL_CONST_MEMBER_FUNC
         {
-            if (!FastMath && (tgmath_impl::isnan_uint_impl<uint64_t>(data) || tgmath_impl::isnan_uint_impl<uint64_t>(rhs.data)))
+            if (!FastMath && (cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(data) || cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(rhs.data)))
                 return false;
 
             return !(bit_cast<this_t>(data) == rhs);
@@ -371,14 +371,14 @@ namespace hlsl
         }
         bool operator<=(this_t rhs) NBL_CONST_MEMBER_FUNC 
         { 
-            if (!FastMath && (tgmath_impl::isnan_uint_impl<uint64_t>(data) || tgmath_impl::isnan_uint_impl<uint64_t>(rhs.data)))
+            if (!FastMath && (cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(data) || cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(rhs.data)))
                 return false;
 
             return !(bit_cast<this_t>(data) > bit_cast<this_t>(rhs.data));
         }
         bool operator>=(this_t rhs)
         {
-            if (!FastMath && (tgmath_impl::isnan_uint_impl<uint64_t>(data) || tgmath_impl::isnan_uint_impl<uint64_t>(rhs.data)))
+            if (!FastMath && (cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(data) || cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(rhs.data)))
                 return false;
 
             return !(bit_cast<this_t>(data) < bit_cast<this_t>(rhs.data));
@@ -498,7 +498,7 @@ struct static_cast_helper<To,emulated_float64_t<FastMath,FlushDenormToZero>,void
                     return bit_cast<To>(ieee754::traits<ToAsFloat>::inf);
                 if (exponent < ieee754::traits<ToAsFloat>::exponentMin)
                     return bit_cast<To>(-ieee754::traits<ToAsFloat>::inf);
-                if (tgmath_impl::isnan_uint_impl(v.data))
+                if (cpp_compat_intrinsics_impl::isinf_uint_impl(v.data))
                     return bit_cast<To>(ieee754::traits<ToAsFloat>::quietNaN);
             }
 
diff --git a/include/nbl/builtin/hlsl/emulated/float64_t_impl.hlsl b/include/nbl/builtin/hlsl/emulated/float64_t_impl.hlsl
@@ -171,7 +171,7 @@ NBL_CONSTEXPR_INLINE_FUNC bool operatorLessAndGreaterCommonImplementation(uint64
 {
     if (!FastMath)
     {
-        if (tgmath_impl::isnan_uint_impl<uint64_t>(lhs) || tgmath_impl::isnan_uint_impl<uint64_t>(rhs))
+        if (cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(lhs) || cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(rhs))
             return false;
         if (emulated_float64_t_impl::areBothZero(lhs, rhs))
             return false;
diff --git a/include/nbl/builtin/hlsl/workgroup/fft.hlsl b/include/nbl/builtin/hlsl/workgroup/fft.hlsl
@@ -129,14 +129,14 @@ struct FFTIndexingUtils
     // This is because Cooley-Tukey + subgroup operations end up spewing out the outputs in a weird order
     static uint32_t getDFTIndex(uint32_t outputIdx)
     {
-        return impl::circularBitShiftRightHigher<FFTSizeLog2, FFTSizeLog2 - ElementsPerInvocationLog2 + 1>(hlsl::bitReverseAs<uint32_t, FFTSizeLog2>(outputIdx));
+        return impl::circularBitShiftRightHigher<FFTSizeLog2, FFTSizeLog2 - ElementsPerInvocationLog2 + 1>(hlsl::bitReverseAs<uint32_t>(outputIdx, FFTSizeLog2));
     }
 
     // This function maps the index `freqIdx` in the DFT to the index `idx` in the output array of a Nabla FFT such that `DFT[freqIdx] = NablaFFT[idx]`
     // It is essentially the inverse of `getDFTIndex`
     static uint32_t getNablaIndex(uint32_t freqIdx)
     {
-        return hlsl::bitReverseAs<uint32_t, FFTSizeLog2>(impl::circularBitShiftLeftHigher<FFTSizeLog2, FFTSizeLog2 - ElementsPerInvocationLog2 + 1>(freqIdx));
+        return hlsl::bitReverseAs<uint32_t>(impl::circularBitShiftLeftHigher<FFTSizeLog2, FFTSizeLog2 - ElementsPerInvocationLog2 + 1>(freqIdx), FFTSizeLog2);
     }
 
     // Mirrors an index about the Nyquist frequency in the DFT order

Original file line number	Diff line number	Diff line change
`@@ -97,8 +97,8 @@ namespace hlsl`
`97`	`97`	`{`
`98`	`98`	`if(!FastMath)`
`99`	`99`	`{`
`100`		`- const bool isRhsInf = tgmath_impl::isinf_uint_impl(rhs.data);`
`101`		`- if (tgmath_impl::isinf_uint_impl(data))`
	`100`	`+ const bool isRhsInf = cpp_compat_intrinsics_impl::isinf_uint_impl(rhs.data);`
	`101`	`+ if (cpp_compat_intrinsics_impl::isinf_uint_impl(data))`
`102`	`102`	`{`
`103`	`103`	`if (isRhsInf && ((data ^ rhs.data) & ieee754::traits<float64_t>::signMask))`
`104`	`104`	`return bit_cast<this_t>(ieee754::traits<float64_t>::quietNaN \| ieee754::traits<float64_t>::signMask);`
`@@ -116,7 +116,7 @@ namespace hlsl`
`116`	`116`
`117`	`117`	`if(!FastMath)`
`118`	`118`	`{`
`119`		`- if (tgmath_impl::isinf_uint_impl(data))`
	`119`	`+ if (cpp_compat_intrinsics_impl::isinf_uint_impl(data))`
`120`	`120`	`return bit_cast<this_t>(ieee754::traits<float64_t>::inf \| ieee754::extractSignPreserveBitPattern(max(data, rhs.data)));`
`121`	`121`	`}`
`122`	`122`
`@@ -226,9 +226,9 @@ namespace hlsl`
`226`	`226`	`uint64_t sign = (data ^ rhs.data) & ieee754::traits<float64_t>::signMask;`
`227`	`227`	`if (!FastMath)`
`228`	`228`	`{`
`229`		`- if (tgmath_impl::isnan_uint_impl(data) \|\| tgmath_impl::isnan_uint_impl(rhs.data))`
	`229`	`+ if (cpp_compat_intrinsics_impl::isnan_uint_impl(data) \|\| cpp_compat_intrinsics_impl::isnan_uint_impl(rhs.data))`
`230`	`230`	`return bit_cast<this_t>(ieee754::traits<float64_t>::quietNaN \| sign);`
`231`		`- if (tgmath_impl::isinf_uint_impl(data) \|\| tgmath_impl::isinf_uint_impl(rhs.data))`
	`231`	`+ if (cpp_compat_intrinsics_impl::isinf_uint_impl(data) \|\| cpp_compat_intrinsics_impl::isinf_uint_impl(rhs.data))`
`232`	`232`	`return bit_cast<this_t>(ieee754::traits<float64_t>::inf \| sign);`
`233`	`233`	`if (emulated_float64_t_impl::isZero(data) \|\| emulated_float64_t_impl::isZero(rhs.data))`
`234`	`234`	`return bit_cast<this_t>(sign);`
`@@ -289,17 +289,17 @@ namespace hlsl`
`289`	`289`
`290`	`290`	`if(!FastMath)`
`291`	`291`	`{`
`292`		`- if (tgmath_impl::isnan_uint_impl<uint64_t>(data) \|\| tgmath_impl::isnan_uint_impl<uint64_t>(rhs.data))`
	`292`	`+ if (cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(data) \|\| cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(rhs.data))`
`293`	`293`	`return bit_cast<this_t>(ieee754::traits<float64_t>::quietNaN);`
`294`	`294`	`if (emulated_float64_t_impl::areBothZero(data, rhs.data))`
`295`	`295`	`return bit_cast<this_t>(ieee754::traits<float64_t>::quietNaN \| sign);`
`296`	`296`	`if (emulated_float64_t_impl::isZero(rhs.data))`
`297`	`297`	`return bit_cast<this_t>(ieee754::traits<float64_t>::inf \| sign);`
`298`	`298`	`if (emulated_float64_t_impl::areBothInfinity(data, rhs.data))`
`299`	`299`	`return bit_cast<this_t>(ieee754::traits<float64_t>::quietNaN \| ieee754::traits<float64_t>::signMask);`
`300`		`- if (tgmath_impl::isinf_uint_impl(data))`
	`300`	`+ if (cpp_compat_intrinsics_impl::isinf_uint_impl(data))`
`301`	`301`	`return bit_cast<this_t>(ieee754::traits<float64_t>::inf \| sign);`
`302`		`- if (tgmath_impl::isinf_uint_impl(rhs.data))`
	`302`	`+ if (cpp_compat_intrinsics_impl::isinf_uint_impl(rhs.data))`
`303`	`303`	`return bit_cast<this_t>(sign);`
`304`	`304`	`}`
`305`	`305`
`@@ -346,7 +346,7 @@ namespace hlsl`
`346`	`346`	`{`
`347`	`347`	`if (!FastMath)`
`348`	`348`	`{`
`349`		`- if (tgmath_impl::isnan_uint_impl<uint64_t>(data) \|\| tgmath_impl::isnan_uint_impl<uint64_t>(rhs.data))`
	`349`	`+ if (cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(data) \|\| cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(rhs.data))`
`350`	`350`	`return false;`
`351`	`351`	`if (emulated_float64_t_impl::areBothZero(data, rhs.data))`
`352`	`352`	`return true;`
`@@ -356,7 +356,7 @@ namespace hlsl`
`356`	`356`	`}`
`357`	`357`	`bool operator!=(this_t rhs) NBL_CONST_MEMBER_FUNC`
`358`	`358`	`{`
`359`		`- if (!FastMath && (tgmath_impl::isnan_uint_impl<uint64_t>(data) \|\| tgmath_impl::isnan_uint_impl<uint64_t>(rhs.data)))`
	`359`	`+ if (!FastMath && (cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(data) \|\| cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(rhs.data)))`
`360`	`360`	`return false;`
`361`	`361`
`362`	`362`	`return !(bit_cast<this_t>(data) == rhs);`
`@@ -371,14 +371,14 @@ namespace hlsl`
`371`	`371`	`}`
`372`	`372`	`bool operator<=(this_t rhs) NBL_CONST_MEMBER_FUNC`
`373`	`373`	`{`
`374`		`- if (!FastMath && (tgmath_impl::isnan_uint_impl<uint64_t>(data) \|\| tgmath_impl::isnan_uint_impl<uint64_t>(rhs.data)))`
	`374`	`+ if (!FastMath && (cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(data) \|\| cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(rhs.data)))`
`375`	`375`	`return false;`
`376`	`376`
`377`	`377`	`return !(bit_cast<this_t>(data) > bit_cast<this_t>(rhs.data));`
`378`	`378`	`}`
`379`	`379`	`bool operator>=(this_t rhs)`
`380`	`380`	`{`
`381`		`- if (!FastMath && (tgmath_impl::isnan_uint_impl<uint64_t>(data) \|\| tgmath_impl::isnan_uint_impl<uint64_t>(rhs.data)))`
	`381`	`+ if (!FastMath && (cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(data) \|\| cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(rhs.data)))`
`382`	`382`	`return false;`
`383`	`383`
`384`	`384`	`return !(bit_cast<this_t>(data) < bit_cast<this_t>(rhs.data));`
`@@ -498,7 +498,7 @@ struct static_cast_helper<To,emulated_float64_t<FastMath,FlushDenormToZero>,void`
`498`	`498`	`return bit_cast<To>(ieee754::traits<ToAsFloat>::inf);`
`499`	`499`	`if (exponent < ieee754::traits<ToAsFloat>::exponentMin)`
`500`	`500`	`return bit_cast<To>(-ieee754::traits<ToAsFloat>::inf);`
`501`		`- if (tgmath_impl::isnan_uint_impl(v.data))`
	`501`	`+ if (cpp_compat_intrinsics_impl::isinf_uint_impl(v.data))`
`502`	`502`	`return bit_cast<To>(ieee754::traits<ToAsFloat>::quietNaN);`
`503`	`503`	`}`
`504`	`504`
Original file line number	Diff line number	Diff line change
`@@ -171,7 +171,7 @@ NBL_CONSTEXPR_INLINE_FUNC bool operatorLessAndGreaterCommonImplementation(uint64`
`171`	`171`	`{`
`172`	`172`	`if (!FastMath)`
`173`	`173`	`{`
`174`		`- if (tgmath_impl::isnan_uint_impl<uint64_t>(lhs) \|\| tgmath_impl::isnan_uint_impl<uint64_t>(rhs))`
	`174`	`+ if (cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(lhs) \|\| cpp_compat_intrinsics_impl::isnan_uint_impl<uint64_t>(rhs))`
`175`	`175`	`return false;`
`176`	`176`	`if (emulated_float64_t_impl::areBothZero(lhs, rhs))`
`177`	`177`	`return false;`
Original file line number	Diff line number	Diff line change
`@@ -129,14 +129,14 @@ struct FFTIndexingUtils`
`129`	`129`	`// This is because Cooley-Tukey + subgroup operations end up spewing out the outputs in a weird order`
`130`	`130`	`static uint32_t getDFTIndex(uint32_t outputIdx)`
`131`	`131`	`{`
`132`		`- return impl::circularBitShiftRightHigher<FFTSizeLog2, FFTSizeLog2 - ElementsPerInvocationLog2 + 1>(hlsl::bitReverseAs<uint32_t, FFTSizeLog2>(outputIdx));`
	`132`	`+ return impl::circularBitShiftRightHigher<FFTSizeLog2, FFTSizeLog2 - ElementsPerInvocationLog2 + 1>(hlsl::bitReverseAs<uint32_t>(outputIdx, FFTSizeLog2));`
`133`	`133`	`}`
`134`	`134`
`135`	`135`	// This function maps the index `freqIdx` in the DFT to the index `idx` in the output array of a Nabla FFT such that `DFT[freqIdx] = NablaFFT[idx]`
`136`	`136`	// It is essentially the inverse of `getDFTIndex`
`137`	`137`	`static uint32_t getNablaIndex(uint32_t freqIdx)`
`138`	`138`	`{`
`139`		`- return hlsl::bitReverseAs<uint32_t, FFTSizeLog2>(impl::circularBitShiftLeftHigher<FFTSizeLog2, FFTSizeLog2 - ElementsPerInvocationLog2 + 1>(freqIdx));`
	`139`	`+ return hlsl::bitReverseAs<uint32_t>(impl::circularBitShiftLeftHigher<FFTSizeLog2, FFTSizeLog2 - ElementsPerInvocationLog2 + 1>(freqIdx), FFTSizeLog2);`
`140`	`140`	`}`
`141`	`141`
`142`	`142`	`// Mirrors an index about the Nyquist frequency in the DFT order`