Added more tgmath functions

Przemog1 · Przemog1 · commit 2f781b863c8f · 2025-01-30T15:16:12.000+01:00
diff --git a/examples_tests b/examples_tests
@@ -1 +1 @@
-Subproject commit 086987d59770a2c9ef1802c84aa51e1fba52d8ce
+Subproject commit 06ed5335fa96482264412eeb4445220396608310
diff --git a/include/nbl/builtin/hlsl/cpp_compat/impl/intrinsics_impl.hlsl b/include/nbl/builtin/hlsl/cpp_compat/impl/intrinsics_impl.hlsl
@@ -59,6 +59,8 @@ template<typename T, uint16_t Bits NBL_STRUCT_CONSTRAINABLE>
 struct bitReverseAs_helper;
 template<typename T NBL_STRUCT_CONSTRAINABLE>
 struct frac_helper;
+template<typename T, typename U NBL_STRUCT_CONSTRAINABLE>
+struct mix_helper;
 
 #ifdef __HLSL_VERSION // HLSL only specializations
 
@@ -197,6 +199,16 @@ struct inverse_helper<SquareMatrix NBL_PARTIAL_REQ_BOT(concepts::Matrix<SquareMa
 	}
 };
 
+template<typename T, typename U> NBL_PARTIAL_REQ_TOP(always_true<decltype(spirv::fMix<T>(experimental::declval<T>(), experimental::declval<T>(), experimental::declval<U>()))>)
+struct mix_helper<T, U NBL_PARTIAL_REQ_BOT(always_true<decltype(spirv::fMix<T>(experimental::declval<T>(), experimental::declval<T>(), experimental::declval<U>()))>) >
+{
+	using return_t = conditional_t<is_vector_v<T>, vector<typename vector_traits<T>::scalar_type, vector_traits<T>::Dimension>, T>;
+	static inline return_t __call(const T x, const T y, const U a)
+	{
+		return spirv::fMix<T>(x, y, a);
+	}
+};
+
 #else // C++ only specializations
 
 template<typename T>
@@ -365,6 +377,17 @@ struct bitCount_helper<EnumT>
 	}
 };
 
+template<typename T, typename U>
+requires concepts::FloatingPoint<T> && (concepts::FloatingPoint<T> || concepts::Boolean<T>)
+struct mix_helper<T, U>
+{
+	using return_t = T;
+	static inline return_t __call(const T x, const T y, const U a)
+	{
+		return glm::mix(x, y, a);
+	}
+};
+
 #endif // C++ only specializations
 
 // C++ and HLSL specializations
@@ -487,21 +510,21 @@ struct max_helper<T NBL_PARTIAL_REQ_BOT(VECTOR_SPECIALIZATION_CONCEPT) >
 };
 
 template<typename LhsT, typename RhsT>
-NBL_PARTIAL_REQ_TOP(concepts::Matrix<LhsT> && concepts::Vector<RhsT>)
-struct mul_helper<LhsT, RhsT NBL_PARTIAL_REQ_BOT(concepts::Matricial<LhsT>&& concepts::Vectorial<RhsT>) >
+NBL_PARTIAL_REQ_TOP(concepts::Matrix<LhsT> && concepts::Vector<RhsT> && (matrix_traits<LhsT>::ColumnCount == vector_traits<RhsT>::Dimension))
+struct mul_helper<LhsT, RhsT NBL_PARTIAL_REQ_BOT(concepts::Matricial<LhsT> && concepts::Vectorial<RhsT> && (matrix_traits<LhsT>::column_count == vector_traits<RhsT>::Dimension)) >
 {
 	using lhs_traits = matrix_traits<LhsT>;
 	using rhs_traits = vector_traits<RhsT>;
-	using return_t = matrix<typename lhs_traits::scalar_type, lhs_traits::RowCount, rhs_traits::Dimension>;
+	using return_t = vector<typename lhs_traits::scalar_type, lhs_traits::RowCount>;
 	static inline return_t __call(LhsT lhs, RhsT rhs)
 	{
 		return mul(lhs, rhs);
 	}
 };
 
 template<typename LhsT, typename RhsT>
-NBL_PARTIAL_REQ_TOP(concepts::Matrix<LhsT>&& concepts::Matrix<RhsT>)
-struct mul_helper<LhsT, RhsT NBL_PARTIAL_REQ_BOT(concepts::Matrix<LhsT>&& concepts::Matrix<RhsT>) >
+NBL_PARTIAL_REQ_TOP(concepts::Matrix<LhsT> && concepts::Matrix<RhsT> && (matrix_traits<LhsT>::ColumnCount == matrix_traits<RhsT>::RowCount))
+struct mul_helper<LhsT, RhsT NBL_PARTIAL_REQ_BOT(concepts::Matrix<LhsT> && concepts::Matrix<RhsT> && (matrix_traits<LhsT>::ColumnCount == matrix_traits<RhsT>::RowCount)) >
 {
 	using lhs_traits = matrix_traits<LhsT>;
 	using rhs_traits = matrix_traits<RhsT>;
diff --git a/include/nbl/builtin/hlsl/cpp_compat/intrinsics.hlsl b/include/nbl/builtin/hlsl/cpp_compat/intrinsics.hlsl
@@ -177,6 +177,12 @@ inline T frac(NBL_CONST_REF_ARG(T) val)
 	return cpp_compat_intrinsics_impl::frac_helper<T>::__call(val);
 }
 
+template<typename T, typename U>
+inline T mix(NBL_CONST_REF_ARG(T) x, NBL_CONST_REF_ARG(T) y, NBL_CONST_REF_ARG(U) a)
+{
+	return cpp_compat_intrinsics_impl::mix_helper<T, U>::__call(x, y, a);
+}
+
 }
 }
 
diff --git a/include/nbl/builtin/hlsl/impl/tgmath_impl.hlsl b/include/nbl/builtin/hlsl/impl/tgmath_impl.hlsl
@@ -65,10 +65,20 @@ template<typename T NBL_STRUCT_CONSTRAINABLE>
 struct acos_helper;
 template<typename T NBL_STRUCT_CONSTRAINABLE>
 struct sqrt_helper;
-template<typename T, typename U NBL_STRUCT_CONSTRAINABLE>
-struct mix_helper;
 template<typename T NBL_STRUCT_CONSTRAINABLE>
 struct modf_helper;
+template<typename T NBL_STRUCT_CONSTRAINABLE>
+struct round_helper;
+template<typename T NBL_STRUCT_CONSTRAINABLE>
+struct roundEven_helper;
+template<typename T NBL_STRUCT_CONSTRAINABLE>
+struct trunc_helper;
+template<typename T NBL_STRUCT_CONSTRAINABLE>
+struct ceil_helper;
+template<typename T NBL_STRUCT_CONSTRAINABLE>
+struct fma_helper;
+template<typename T, typename U NBL_STRUCT_CONSTRAINABLE>
+struct ldexp_helper;
 
 #ifdef __HLSL_VERSION
 
@@ -104,6 +114,11 @@ AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(log2_helper, log2, T)
 AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(exp2_helper, exp2, T)
 AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(exp_helper, exp, T)
 AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(floor_helper, floor, T)
+AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(round_helper, round, T)
+AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(roundEven_helper, roundEven, T)
+AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(trunc_helper, trunc, T)
+AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(ceil_helper, ceil, T)
+
 #define ISINF_AND_ISNAN_RETURN_TYPE conditional_t<is_vector_v<T>, vector<bool, vector_traits<T>::Dimension>, bool>
 AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(isinf_helper, isInf, ISINF_AND_ISNAN_RETURN_TYPE)
 AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(isnan_helper, isNan, ISINF_AND_ISNAN_RETURN_TYPE)
@@ -120,16 +135,6 @@ struct pow_helper<T NBL_PARTIAL_REQ_BOT(always_true<decltype(spirv::pow<T>(exper
 	}
 };
 
-template<typename T, typename U> NBL_PARTIAL_REQ_TOP(always_true<decltype(spirv::fMix<T>(experimental::declval<T>(), experimental::declval<T>(), experimental::declval<U>()))>)
-struct mix_helper<T, U NBL_PARTIAL_REQ_BOT(always_true<decltype(spirv::fMix<T>(experimental::declval<T>(), experimental::declval<T>(), experimental::declval<U>()))>) >
-{
-	using return_t = conditional_t<is_vector_v<T>, vector<typename vector_traits<T>::scalar_type, vector_traits<T>::Dimension>, T>;
-	static inline return_t __call(const T x, const T y, const U a)
-	{
-		return spirv::fMix<T>(x, y, a);
-	}
-};
-
 template<typename T> NBL_PARTIAL_REQ_TOP(concepts::FloatingPointScalar<T>)
 struct modf_helper<T NBL_PARTIAL_REQ_BOT(concepts::FloatingPointScalar<T>) >
 {
@@ -186,6 +191,26 @@ struct erf_helper<FloatingPoint NBL_PARTIAL_REQ_BOT(concepts::FloatingPointScala
 	}
 };
 
+template<typename T> NBL_PARTIAL_REQ_TOP(always_true<decltype(spirv::fma<T>(experimental::declval<T>(), experimental::declval<T>(), experimental::declval<T>()))>)
+struct fma_helper<T NBL_PARTIAL_REQ_BOT(always_true<decltype(spirv::fma<T>(experimental::declval<T>(), experimental::declval<T>(), experimental::declval<T>()))>) >
+{
+	using return_t = T;
+	static inline return_t __call(const T x, const T y, const T z)
+	{
+		return spirv::fma<T>(x, y, z);
+	}
+};
+
+template<typename T, typename U> NBL_PARTIAL_REQ_TOP(always_true<decltype(spirv::ldexp<T>(experimental::declval<T>(), experimental::declval<U>()))>)
+struct ldexp_helper<T, U NBL_PARTIAL_REQ_BOT(always_true<decltype(spirv::ldexp<T>(experimental::declval<T>(), experimental::declval<U>()))>) >
+{
+	using return_t = T;
+	static inline return_t __call(const T arg, const U exp)
+	{
+		return spirv::ldexp<T, U>(arg, exp);
+	}
+};
+
 #else // C++ only specializations
 
 
@@ -212,6 +237,11 @@ AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(log2_helper, concepts::FloatingPointScalar<T
 AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(exp2_helper, concepts::Scalar<T>, exp2, T)
 AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(exp_helper, concepts::Scalar<T>, exp, T)
 AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(floor_helper, concepts::FloatingPointScalar<T>, floor, T)
+AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(round_helper, concepts::FloatingPointScalar<T>, round, T)
+// TODO: uncomment when C++23
+//AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(roundEven_helper, concepts::FloatingPointScalar<T>, roundeven, T)
+AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(trunc_helper, concepts::FloatingPointScalar<T>, trunc, T)
+AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER(ceil_helper, concepts::FloatingPointScalar<T>, ceil, T)
 #undef AUTO_SPECIALIZE_TRIVIAL_CASE_HELPER
 
 template<typename T>
@@ -265,24 +295,54 @@ struct isnan_helper<T>
 	}
 };
 
-template<typename T, typename U>
-requires concepts::FloatingPoint<T> && (concepts::FloatingPoint<T> || concepts::Boolean<T>)
-struct mix_helper<T, U>
+template<typename FloatingPoint>
+NBL_PARTIAL_REQ_TOP(concepts::FloatingPointScalar<FloatingPoint>)
+struct erf_helper<FloatingPoint NBL_PARTIAL_REQ_BOT(concepts::FloatingPointScalar<FloatingPoint>) >
 {
-	using return_t = T;
-	static inline return_t __call(const T x, const T y, const U a)
-	{
-		return glm::mix(x, y ,a);
+	static FloatingPoint __call(NBL_CONST_REF_ARG(FloatingPoint) x)
+	{
+		return std::erf<FloatingPoint>(x);
 	}
 };
 
+// TODO: remove when C++23
 template<typename FloatingPoint>
 NBL_PARTIAL_REQ_TOP(concepts::FloatingPointScalar<FloatingPoint>)
-struct erf_helper<FloatingPoint NBL_PARTIAL_REQ_BOT(concepts::FloatingPointScalar<FloatingPoint>) >
+struct roundEven_helper<FloatingPoint NBL_PARTIAL_REQ_BOT(concepts::FloatingPointScalar<FloatingPoint>) >
 {
 	static FloatingPoint __call(NBL_CONST_REF_ARG(FloatingPoint) x)
 	{
-		return std::erf<FloatingPoint>(x);
+		// TODO: no way this is optimal, find a better implementation
+		float tmp;
+		if (std::abs(std::modf(x, &tmp)) == 0.5f)
+		{
+			int32_t result = static_cast<int32_t>(x);
+			if (result % 2 != 0)
+				result >= 0 ? ++result : --result;
+			return result;
+		}
+
+		return std::round(x);
+	}
+};
+
+template<typename FloatingPoint>
+NBL_PARTIAL_REQ_TOP(concepts::FloatingPointScalar<FloatingPoint>)
+struct fma_helper<FloatingPoint NBL_PARTIAL_REQ_BOT(concepts::FloatingPointScalar<FloatingPoint>) >
+{
+	static FloatingPoint __call(NBL_CONST_REF_ARG(FloatingPoint) x, NBL_CONST_REF_ARG(FloatingPoint) y, NBL_CONST_REF_ARG(FloatingPoint) z)
+	{
+		return std::fma(x, y, z);
+	}
+};
+
+template<typename T, typename U>
+NBL_PARTIAL_REQ_TOP(concepts::FloatingPointScalar<T> && concepts::IntegralScalar<U>)
+struct ldexp_helper<T, U NBL_PARTIAL_REQ_BOT(concepts::FloatingPointScalar<T> && concepts::IntegralScalar<U>) >
+{
+	static T __call(NBL_CONST_REF_ARG(T) arg, NBL_CONST_REF_ARG(U) exp)
+	{
+		return std::ldexp(arg, exp);
 	}
 };
 
@@ -372,6 +432,10 @@ AUTO_SPECIALIZE_HELPER_FOR_VECTOR(cos_helper, T)
 AUTO_SPECIALIZE_HELPER_FOR_VECTOR(sin_helper, T)
 AUTO_SPECIALIZE_HELPER_FOR_VECTOR(acos_helper, T)
 AUTO_SPECIALIZE_HELPER_FOR_VECTOR(modf_helper, T)
+AUTO_SPECIALIZE_HELPER_FOR_VECTOR(round_helper, T)
+AUTO_SPECIALIZE_HELPER_FOR_VECTOR(roundEven_helper, T)
+AUTO_SPECIALIZE_HELPER_FOR_VECTOR(trunc_helper, T)
+AUTO_SPECIALIZE_HELPER_FOR_VECTOR(ceil_helper, T)
 
 #undef INT_VECTOR_RETURN_TYPE
 #undef AUTO_SPECIALIZE_HELPER_FOR_VECTOR
@@ -394,6 +458,47 @@ struct pow_helper<T NBL_PARTIAL_REQ_BOT(VECTOR_SPECIALIZATION_CONCEPT) >
 		return output;
 	}
 };
+
+template<typename T>
+NBL_PARTIAL_REQ_TOP(VECTOR_SPECIALIZATION_CONCEPT)
+struct fma_helper<T NBL_PARTIAL_REQ_BOT(VECTOR_SPECIALIZATION_CONCEPT) >
+{
+	using return_t = T;
+	static return_t __call(NBL_CONST_REF_ARG(T) x, NBL_CONST_REF_ARG(T) y, NBL_CONST_REF_ARG(T) z)
+	{
+		using traits = hlsl::vector_traits<T>;
+		array_get<T, typename traits::scalar_type> getter;
+		array_set<T, typename traits::scalar_type> setter;
+
+		return_t output;
+		for (uint32_t i = 0; i < traits::Dimension; ++i)
+			setter(output, i, fma_helper<typename traits::scalar_type>::__call(getter(x, i), getter(y, i), getter(z, i)));
+
+		return output;
+	}
+};
+
+template<typename T, typename U>
+NBL_PARTIAL_REQ_TOP(VECTOR_SPECIALIZATION_CONCEPT && (vector_traits<T>::Dimension == vector_traits<U>::Dimension))
+struct ldexp_helper<T, U NBL_PARTIAL_REQ_BOT(VECTOR_SPECIALIZATION_CONCEPT && (vector_traits<T>::Dimension == vector_traits<U>::Dimension)) >
+{
+	using return_t = T;
+	static return_t __call(NBL_CONST_REF_ARG(T) arg, NBL_CONST_REF_ARG(U) exp)
+	{
+		using arg_traits = hlsl::vector_traits<T>;
+		using exp_traits = hlsl::vector_traits<U>;
+		array_get<T, typename arg_traits::scalar_type> argGetter;
+		array_get<U, typename exp_traits::scalar_type> expGetter;
+		array_set<T, typename arg_traits::scalar_type> setter;
+
+		return_t output;
+		for (uint32_t i = 0; i < arg_traits::Dimension; ++i)
+			setter(output, i, ldexp_helper<typename arg_traits::scalar_type, typename exp_traits::scalar_type>::__call(argGetter(arg, i), expGetter(exp, i)));
+
+		return output;
+	}
+};
+
 #undef VECTOR_SPECIALIZATION_CONCEPT
 
 }
diff --git a/include/nbl/builtin/hlsl/spirv_intrinsics/glsl.std.450.hlsl b/include/nbl/builtin/hlsl/spirv_intrinsics/glsl.std.450.hlsl
@@ -172,6 +172,32 @@ template<typename T NBL_FUNC_REQUIRES(concepts::FloatingPointVectorOrScalar<T>)
 [[vk::ext_instruction(GLSLstd450Fract, "GLSL.std.450")]]
 T fract(T val);
 
+template<typename T NBL_FUNC_REQUIRES(concepts::FloatingPointVectorOrScalar<T>)
+[[vk::ext_instruction(GLSLstd450Round, "GLSL.std.450")]]
+T round(T val);
+
+template<typename T NBL_FUNC_REQUIRES(concepts::FloatingPointVectorOrScalar<T>)
+[[vk::ext_instruction(GLSLstd450RoundEven, "GLSL.std.450")]]
+T roundEven(T val);
+
+template<typename T NBL_FUNC_REQUIRES(concepts::FloatingPointVectorOrScalar<T>)
+[[vk::ext_instruction(GLSLstd450Trunc, "GLSL.std.450")]]
+T trunc(T val);
+
+template<typename T NBL_FUNC_REQUIRES(concepts::FloatingPointVectorOrScalar<T>)
+[[vk::ext_instruction(GLSLstd450Ceil, "GLSL.std.450")]]
+T ceil(T val);
+
+template<typename T NBL_FUNC_REQUIRES(concepts::FloatingPointVectorOrScalar<T>)
+[[vk::ext_instruction(GLSLstd450Fma, "GLSL.std.450")]]
+T fma(T x, T y, T z);
+
+template<typename T, typename U NBL_FUNC_REQUIRES(concepts::FloatingPointVectorOrScalar<T> && 
+	(concepts::IntegralVectorOrScalar<U> || concepts::UnsignedIntegralVectorOrScalar<U>) && 
+	(vector_traits<T>::Dimension == vector_traits<U>::Dimension))
+[[vk::ext_instruction(GLSLstd450Ldexp, "GLSL.std.450")]]
+T ldexp(T arg, U exp);
+
 }
 }
 }
diff --git a/include/nbl/builtin/hlsl/tgmath.hlsl b/include/nbl/builtin/hlsl/tgmath.hlsl
@@ -41,12 +41,6 @@ inline T floor(NBL_CONST_REF_ARG(T) val)
     return tgmath_impl::floor_helper<T>::__call(val);
 }
 
-template<typename T, typename U>
-inline T mix(NBL_CONST_REF_ARG(T) x, NBL_CONST_REF_ARG(T) y, NBL_CONST_REF_ARG(U) a)
-{
-    return tgmath_impl::mix_helper<T, U>::__call(x, y, a);
-}
-
 template<typename T>
 inline typename tgmath_impl::isnan_helper<T>::return_t isnan(NBL_CONST_REF_ARG(T) val)
 {
@@ -132,6 +126,42 @@ inline T modf(NBL_CONST_REF_ARG(T) val)
     return tgmath_impl::modf_helper<T>::__call(val);
 }
 
+template<typename T>
+inline T round(NBL_CONST_REF_ARG(T) val)
+{
+    return tgmath_impl::round_helper<T>::__call(val);
+}
+
+template<typename T>
+inline T roundEven(NBL_CONST_REF_ARG(T) val)
+{
+    return tgmath_impl::roundEven_helper<T>::__call(val);
+}
+
+template<typename T>
+inline T trunc(NBL_CONST_REF_ARG(T) val)
+{
+    return tgmath_impl::trunc_helper<T>::__call(val);
+}
+
+template<typename T>
+inline T ceil(NBL_CONST_REF_ARG(T) val)
+{
+    return tgmath_impl::ceil_helper<T>::__call(val);
+}
+
+template<typename T>
+inline T fma(NBL_CONST_REF_ARG(T) x, NBL_CONST_REF_ARG(T) y, NBL_CONST_REF_ARG(T) z)
+{
+    return tgmath_impl::fma_helper<T>::__call(x, y, z);
+}
+
+template<typename T, typename U>
+inline T ldexp(NBL_CONST_REF_ARG(T) arg, NBL_CONST_REF_ARG(U) exp)
+{
+    return tgmath_impl::ldexp_helper<T, U>::__call(arg, exp);
+}
+
 }
 }
 
diff --git a/src/nbl/builtin/CMakeLists.txt b/src/nbl/builtin/CMakeLists.txt
@@ -226,7 +226,6 @@ LIST_BUILTIN_RESOURCE(NBL_RESOURCES_TO_EMBED "hlsl/ieee754/impl.hlsl")
 LIST_BUILTIN_RESOURCE(NBL_RESOURCES_TO_EMBED "hlsl/array_accessors.hlsl")
 LIST_BUILTIN_RESOURCE(NBL_RESOURCES_TO_EMBED "hlsl/vector_utils/vector_traits.hlsl")
 LIST_BUILTIN_RESOURCE(NBL_RESOURCES_TO_EMBED "hlsl/matrix_utils/matrix_traits.hlsl")
-LIST_BUILTIN_RESOURCE(NBL_RESOURCES_TO_EMBED "hlsl/matrix_utils/mul_output_t.hlsl")
 LIST_BUILTIN_RESOURCE(NBL_RESOURCES_TO_EMBED "hlsl/tgmath.hlsl")
 LIST_BUILTIN_RESOURCE(NBL_RESOURCES_TO_EMBED "hlsl/impl/tgmath_impl.hlsl")
 

Original file line number	Diff line number	Diff line change
`@@ -177,6 +177,12 @@ inline T frac(NBL_CONST_REF_ARG(T) val)`
`177`	`177`	`return cpp_compat_intrinsics_impl::frac_helper<T>::__call(val);`
`178`	`178`	`}`
`179`	`179`
	`180`	`+template<typename T, typename U>`
	`181`	`+inline T mix(NBL_CONST_REF_ARG(T) x, NBL_CONST_REF_ARG(T) y, NBL_CONST_REF_ARG(U) a)`
	`182`	`+{`
	`183`	`+ return cpp_compat_intrinsics_impl::mix_helper<T, U>::__call(x, y, a);`
	`184`	`+}`
	`185`	`+`
`180`	`186`	`}`
`181`	`187`	`}`
`182`	`188`