adding necessary changes for KA transition with gpuarrays

leios · leios · commit 1af94901e7d4 · 2024-04-10T18:54:31.000+02:00
diff --git a/src/gpuarrays.jl b/src/gpuarrays.jl
@@ -1,48 +1,7 @@
-struct ROCArrayBackend <: AbstractGPUBackend end
+import KernelAbstractions
+import KernelAbstractions: Backend
 
-struct ROCKernelContext <: AbstractKernelContext end
-
-@inline function GPUArrays.gpu_call(
-    ::ROCArrayBackend, f, args, threads::Int, blocks::Int; name::Maybe{String},
-)
-    @roc gridsize=blocks groupsize=threads name=name f(ROCKernelContext(), args...)
-end
-
-# indexing
-
-for (f, froc) in (
-    (:blockidx, :blockIdx),
-    (:blockdim, :blockDim),
-    (:threadidx, :threadIdx),
-    (:griddim, :gridGroupDim)
-)
-    @eval @inline GPUArrays.$f(::ROCKernelContext) = AMDGPU.$froc().x
-end
-
-# math
-
-@inline GPUArrays.cos(::ROCKernelContext, x) = cos(x)
-@inline GPUArrays.sin(::ROCKernelContext, x) = sin(x)
-@inline GPUArrays.sqrt(::ROCKernelContext, x) = sqrt(x)
-@inline GPUArrays.log(::ROCKernelContext, x) = log(x)
-
-# memory
-
-@inline function GPUArrays.LocalMemory(::ROCKernelContext, ::Type{T}, ::Val{dims}, ::Val{id}) where {T,dims,id}
-    ptr = AMDGPU.Device.alloc_special(Val{id}(), T, Val{AMDGPU.AS.Local}(), Val{prod(dims)}())
-    ROCDeviceArray(dims, ptr)
-end
-
-# synchronization
-
-@inline function GPUArrays.synchronize_threads(::ROCKernelContext)
-    sync_workgroup()
-    return
-end
-
-GPUArrays.device(x::ROCArray) = x.buf[].device
-
-GPUArrays.backend(::Type{<:ROCArray}) = ROCArrayBackend()
+struct ROCArrayBackend <: Backend end
 
 function GPUArrays.derive(
     ::Type{T}, x::ROCArray, dims::Dims{N}, offset::Int,