[CUSOLVER] Support A \ b for rectangular matrices (#1802)

amontoison · web-flow · commit 15dbba86210d · 2023-03-15T12:25:03.000+01:00
diff --git a/lib/cusolver/linalg.jl b/lib/cusolver/linalg.jl
@@ -2,7 +2,7 @@
 
 using LinearAlgebra
 using LinearAlgebra: BlasComplex, BlasFloat, BlasReal
-using ..CUBLAS: CublasFloat
+using ..CUBLAS: CublasFloat, trsm!
 
 function copy_cublasfloat(As...)
     eltypes = eltype.(As)
@@ -20,17 +20,49 @@ _copywitheltype(::Type{T}, As...) where {T} = map(A -> copyto!(similar(A, T), A)
 
 # matrix division
 
-const CuMatOrAdj{T} = Union{CuMatrix,
+const CuMatOrAdj{T} = Union{CuMatrix{T},
                             LinearAlgebra.Adjoint{T, <:CuMatrix{T}},
                             LinearAlgebra.Transpose{T, <:CuMatrix{T}}}
-const CuOrAdj{T} = Union{CuVecOrMat,
+const CuOrAdj{T} = Union{CuVecOrMat{T},
                          LinearAlgebra.Adjoint{T, <:CuVecOrMat{T}},
                          LinearAlgebra.Transpose{T, <:CuVecOrMat{T}}}
 
 function Base.:\(_A::CuMatOrAdj, _B::CuOrAdj)
     A, B = copy_cublasfloat(_A, _B)
-    A, ipiv = CUSOLVER.getrf!(A)
-    return CUSOLVER.getrs!('N', A, ipiv, B)
+    T = eltype(A)
+    n,m = size(A)
+    if n < m
+        # LQ decomposition
+        At = CuMatrix(A')
+        F, tau = CUSOLVER.geqrf!(At)  # A = RᴴQᴴ
+        if B isa CuVector{T}
+            CUBLAS.trsv!('U', 'C', 'N', view(F,1:n,1:n), B)
+            X = CUDA.zeros(T, m)
+            view(X, 1:n) .= B
+        else
+            CUBLAS.trsm!('L', 'U', 'C', 'N', one(T), view(F,1:n,1:n), B)
+            p = size(B, 2)
+            X = CUDA.zeros(T, m, p)
+            view(X, 1:n, :) .= B
+        end
+        CUSOLVER.ormqr!('L', 'N', F, tau, X)
+    elseif n == m
+        # LU decomposition with partial pivoting
+        F, p, info = CUSOLVER.getrf!(A)  # PA = LU
+        X = CUSOLVER.getrs!('N', F, p, B)
+    else
+        # QR decomposition
+        F, tau = CUSOLVER.geqrf!(A)  # A = QR
+        CUSOLVER.ormqr!('L', T <: Real ? 'T' : 'C', F, tau, B)
+        if B isa CuVector{T}
+            X = B[1:m]
+            CUBLAS.trsv!('U', 'N', 'N', view(F,1:m,1:m), X)
+        else
+            X = B[1:m,:]
+            CUBLAS.trsm!('L', 'U', 'N', 'N', one(T), view(F,1:m,1:m), X)
+        end
+    end
+    return X
 end
 
 # patch JuliaLang/julia#40899 to create a CuArray
diff --git a/test/cusolver/dense.jl b/test/cusolver/dense.jl
@@ -630,18 +630,54 @@ end
 ], elty2 in [
     Float16, Float32, Float64, ComplexF16, ComplexF32, ComplexF64, Int32, Int64, Complex{Int32}, Complex{Int64}
 ]
-    A = rand(elty1,n,n)
-    B = rand(elty2,n,n)
-    b = rand(elty2,n)
-    d_A = CuArray(A)
-    d_B = CuArray(B)
-    d_b = CuArray(b)
-    cublasfloat = promote_type(Float32, promote_type(elty1, elty2))
-    Af = cublasfloat.(A)
-    Bf = cublasfloat.(B)
-    bf = cublasfloat.(b)
-    @test Array(d_A \ d_B) ≈ (Af \ Bf)
-    @test Array(d_A \ d_b) ≈ (Af \ bf)
-    @inferred d_A \ d_B
-    @inferred d_A \ d_b
+    @testset "Square linear systems" begin
+        A = rand(elty1,n,n)
+        B = rand(elty2,n,5)
+        b = rand(elty2,n)
+        d_A = CuArray(A)
+        d_B = CuArray(B)
+        d_b = CuArray(b)
+        cublasfloat = promote_type(Float32, promote_type(elty1, elty2))
+        Af = cublasfloat.(A)
+        Bf = cublasfloat.(B)
+        bf = cublasfloat.(b)
+        @test Array(d_A \ d_B) ≈ (Af \ Bf)
+        @test Array(d_A \ d_b) ≈ (Af \ bf)
+        @inferred d_A \ d_B
+        @inferred d_A \ d_b
+    end
+
+    @testset "Overdetermined linear systems" begin
+        A = rand(elty1,m,n)
+        B = rand(elty2,m,5)
+        b = rand(elty2,m)
+        d_A = CuArray(A)
+        d_B = CuArray(B)
+        d_b = CuArray(b)
+        cublasfloat = promote_type(Float32, promote_type(elty1, elty2))
+        Af = cublasfloat.(A)
+        Bf = cublasfloat.(B)
+        bf = cublasfloat.(b)
+        @test Array(d_A \ d_B) ≈ (Af \ Bf)
+        @test Array(d_A \ d_b) ≈ (Af \ bf)
+        @inferred d_A \ d_B
+        @inferred d_A \ d_b
+    end
+
+    @testset "Underdetermined linear systems" begin
+        A = rand(elty1,n,m)
+        B = rand(elty2,n,5)
+        b = rand(elty2,n)
+        d_A = CuArray(A)
+        d_B = CuArray(B)
+        d_b = CuArray(b)
+        cublasfloat = promote_type(Float32, promote_type(elty1, elty2))
+        Af = cublasfloat.(A)
+        Bf = cublasfloat.(B)
+        bf = cublasfloat.(b)
+        @test Array(d_A \ d_B) ≈ (Af \ Bf)
+        @test Array(d_A \ d_b) ≈ (Af \ bf)
+        @inferred d_A \ d_B
+        @inferred d_A \ d_b
+    end
 end