codeplaysoftware
diff --git a/‎setup-script/README.md
Lines changed: 74 additions & 0 deletions b/‎setup-script/README.md
Lines changed: 74 additions & 0 deletions
diff --git a/‎setup-script/build.sh
Lines changed: 157 additions & 0 deletions b/‎setup-script/build.sh
Lines changed: 157 additions & 0 deletions
diff --git a/‎setup-script/build_minimal.sh
Lines changed: 154 additions & 0 deletions b/‎setup-script/build_minimal.sh
Lines changed: 154 additions & 0 deletions
@@ -0,0 +1,74 @@
+# oneAPI on CUDA setup script
+
+This script allows you to build and setup the DPC++ compiler, oneMKL and oneDNN with Nvidia GPUs support.
+
+### Use
+
+1. If needed, set `$DPCPP_HOME` and `$CUDA_ROOT` in the script.
+2. Run the script with ```./build.sh```.
+
+Everything will be installed to `$DPCPP_HOME/deploy`.
+
+To build with testing support and run the tests for DPC++, oneMKL, oneTBB, oneDNN and Lapack,
+run: ```DPCPP_TESTS=ON ./build.sh```
+
+If you want to build libc++, use `CC=clang-X CXX=clang++-X` with another version of clang, gcc won't compile the libc as
+the `asm` syntax is not the same. Using this clang/dpc++ won't work either, there's a bug. Then link
+with `-stdlib=libc++`.
+
+### Environment variables
+
+Once everything was built, add the first four exports of the script in your environment or add them in your shell's
+config file.
+
+### Using the CUDA Backend
+
+1. Use the following selector:
+
+```C++
+class CUDADeviceSelector : public sycl::device_selector {
+public:
+    int operator()(const sycl::device &device) const override {
+        return device.get_platform().get_backend() == sycl::backend::cuda ? 1 : -1;
+    }
+};
+```
+
+2. Build with `-fsycl -fsycl-targets=nvptx64-nvidia-cuda-sycldevice`
+3. For oneMKL, link with: `-lonemkl_blas_cublas -lonemkl`
+
+### Intel's openCL
+
+You can also install Intel's openCL driver (`intel-oneapi-runtime-opencl`) so you can target your CPU
+with `-fsycl-targets=spir64_x86_64-unknown-unknown-sycldevice`. For the setup
+see [here](https://software.intel.com/content/www/us/en/develop/documentation/installation-guide-for-intel-oneapi-toolkits-linux/top/installation/install-using-package-managers.html)
+.
+
+### Dependencies
+
+* Even though the latest version of CUDA seems to work with DPC++, we need to use CUDA 10.2 as oneMKL uses cuBLAS 10.2.
+  On RHEL: `cuda-10-2 libcublas-devel-10-2`. For the setup
+  see: https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#pre-installation-actions.
+* `libatomic`
+* to be able to target Intel's CPUs with openCL.
+* `ninja-build cmake libxml2-devel ...` and other "build essentials" required for building a compiler.
+* `libcudnn8 libcudnn8-devel` for oneDNN.
+* `gcc-gfortran` or another Fortran compiler for NETLIB Lapack.
+* `hwloc-devel` for oneTBB
+* `mpfr-devel` when building libcxx
+
+### Caveats
+
+* CLion integration: you need to add `cidr.compiler.clang.fsycl=true` in the registry of CLion [see](https://www.jetbrains.com/help/clion/tuning-the-ide.html?keymap=secondary_macos#configure-platform-properties)
+* oneMKL does not support testing when building for both cuBLAS and cuRAND
+* for oneMKL with cuda you should use the namespace `oneapi::mkl::blas::column_major::` as cuBLAS is column_major.
+
+### Repositories used
+
+- OpenCL Headers+Loaders: https://github.com/KhronosGroup/OpenCL-Headers.git
+  , https://github.com/KhronosGroup/OpenCL-ICD-Loader.git
+- DPC++ Compiler: https://github.com/intel/llvm.git
+- NETLIB Lapack: https://github.com/Reference-LAPACK/lapack.git
+- oneTBB: https://github.com/oneapi-src/oneTBB.git
+- oneMKL: https://github.com/oneapi-src/oneMKL.git
+- oneDNN: https://github.com/oneapi-src/oneDNN.git
@@ -0,0 +1,157 @@
+#!/bin/sh
+export DPCPP_HOME=~/sycl_workspace
+export CUDA_ROOT=/usr/local/cuda-10.2
+export LD_LIBRARY_PATH=$DPCPP_HOME/deploy/lib/:$DPCPP_HOME/deploy/lib64/:$DPCPP_HOME/lapack/install/lib64/:$DPCPP_HOME/OpenCL-ICD-Loader/install/lib64:$CUDA_ROOT/lib:$CUDA_ROOT/lib64:$LD_LIBRARY_PATH
+export PATH=$DPCPP_HOME/deploy/bin/:$CUDA_ROOT/bin:$PATH
+
+mkdir -p $DPCPP_HOME
+cd $DPCPP_HOME
+mkdir -p deploy
+
+#export LD_PRELOAD=/opt/intel/opencl/libOpenCL.so.1
+
+run_test=false
+cmake_test="OFF"
+
+if [[ -z "$DPCPP_TESTS" ]]; then
+  echo "Not testing"
+else
+  echo "testing"
+  run_test=true
+  cmake_test="ON"
+fi
+
+export CXXFLAGS="${CXXFLAGS} -D_GLIBCXX_USE_CXX11_ABI=1"
+
+# OpenCL headers+ICD
+cd $DPCPP_HOME
+(if cd OpenCL-Headers; then git pull; else git clone https://github.com/KhronosGroup/OpenCL-Headers.git; fi)
+(if cd OpenCL-ICD-Loader; then git pull; else git clone https://github.com/KhronosGroup/OpenCL-ICD-Loader.git; fi)
+cd OpenCL-ICD-Loader
+mkdir -p build
+cd build
+cmake \
+  -DOPENCL_ICD_LOADER_HEADERS_DIR=$DPCPP_HOME/OpenCL-Headers \
+  -DCMAKE_INSTALL_PREFIX=$DPCPP_HOME/OpenCL-ICD-Loader/install \
+  ..
+make install -j $(nproc)
+
+#sycl compiler with cuda
+source /opt/intel/opencl/env/compiler_rt_vars.sh
+cd $DPCPP_HOME
+(if cd llvm; then git pull; else git clone https://github.com/intel/llvm.git -b sycl; fi)
+cd llvm
+python3 ./buildbot/configure.py \
+  --cuda \
+  -t release \
+  --cmake-opt="-DCMAKE_INSTALL_PREFIX=$DPCPP_HOME/deploy" \
+  --cmake-opt="-DCUDA_SDK_ROOT_DIR=$CUDA_ROOT" \
+  --cmake-opt="-DLLVM_BINUTILS_INCDIR=/usr/local/include" \
+  --cmake-opt="-DLLVM_ENABLE_PROJECTS=clang;sycl;llvm-spirv;libunwind;opencl;libdevice;xpti;xptifw;libclc;lld;lldb;libc;libcxx;libcxxabi;openmp;clang-tools-extra;compiler-rt" \
+  --cmake-opt="-DLLVM_BUILD_TESTS=$cmake_test" \
+  --cmake-opt="-DCMAKE_CXX_STANDARD=17" \
+  --cmake-opt="-DLLVM_ENABLE_LTO=off" \
+  --cmake-opt="-DLLVM_ENABLE_LLD=ON" \
+  --cmake-opt="-DSYCL_ENABLE_WERROR=OFF" \
+  --cmake-opt="-Wno-dev"
+cd build
+ninja install -j $(nproc)
+if $run_test; then
+  echo "testing llvm"
+  ninja check -j $(nproc)
+fi
+
+#Lapack Reference
+cd $DPCPP_HOME
+(if cd lapack; then git pull; else git clone https://github.com/Reference-LAPACK/lapack.git; fi)
+cd lapack/
+mkdir -p build
+cd build/
+cmake \
+  -DBUILD_SHARED_LIBS=ON \
+  -DCBLAS=ON \
+  -DLAPACKE=ON \
+  -DBUILD_TESTING=$cmake_test \
+  -DCMAKE_INSTALL_PREFIX=$DPCPP_HOME/lapack/install \
+  ..
+cmake --build . -j $(nproc) --target install
+if $run_test; then
+  cmake --build . -j $(nproc) --target test
+fi
+
+#oneTBB
+cd $DPCPP_HOME
+(if cd oneTBB; then git pull; else git clone https://github.com/oneapi-src/oneTBB.git; fi)
+cd oneTBB
+mkdir -p build
+cd build
+cmake -GNinja \
+  -DCMAKE_CXX_COMPILER=$DPCPP_HOME/deploy/bin/clang++ \
+  -DCMAKE_BUILD_TYPE=Release \
+  -DTBB_STRICT=OFF \
+  -DCMAKE_INSTALL_PREFIX=$DPCPP_HOME/deploy/ \
+  -DTBB_TEST=$cmake_test \
+  ..
+ninja install -j $(nproc)
+if $run_test; then
+  ninja test -j $(nproc)
+fi
+
+#oneMKL
+cd $DPCPP_HOME
+(if cd oneMKL; then git pull; else git clone https://github.com/oneapi-src/oneMKL.git; fi)
+cd oneMKL
+mkdir -p build
+cd build
+cmake -GNinja \
+  -DCMAKE_CXX_COMPILER=$DPCPP_HOME/deploy/bin/clang++ \
+  -DCMAKE_BUILD_TYPE=Release \
+  -DCMAKE_CXX_STANDARD=17 \
+  -DTARGET_DOMAINS=blas \
+  -DENABLE_MKLGPU_BACKEND=OFF \
+  -DENABLE_CURAND_BACKEND=OFF \
+  -DENABLE_MKLCPU_BACKEND=OFF \
+  -DENABLE_CUBLAS_BACKEND=ON \
+  -DENABLE_NETLIB_BACKEND=ON \
+  -DREF_BLAS_ROOT=$DPCPP_HOME/lapack/install \
+  -DNETLIB_ROOT=$DPCPP_HOME/lapack/install \
+  -DOPENCL_INCLUDE_DIR=$DPCPP_HOME/OpenCL-Headers \
+  -DCUDA_TOOLKIT_ROOT_DIR=$CUDA_ROOT \
+  -DSYCL_LIBRARY=$DPCPP_HOME/deploy/lib/libsycl.so \
+  -DCMAKE_INSTALL_PREFIX=$DPCPP_HOME/deploy/ \
+  -DBUILD_FUNCTIONAL_TESTS=$cmake_test \
+  ..
+ninja install -j $(nproc)
+if $run_test; then
+  ninja test -j $(nproc)
+fi
+
+#oneDNN
+cd $DPCPP_HOME
+(if cd oneDNN; then git pull; else git clone https://github.com/oneapi-src/oneDNN.git; fi)
+cd oneDNN
+mkdir -p build
+cd build
+cmake -GNinja \
+  -DCMAKE_C_COMPILER=$DPCPP_HOME/deploy/bin/clang \
+  -DCMAKE_CXX_COMPILER=$DPCPP_HOME/deploy/bin/clang++ \
+  -DCMAKE_BUILD_TYPE=Release \
+  -DCMAKE_CXX_STANDARD=17 \
+  -DDNNL_INSTALL_MODE=BUNDLE \
+  -DDNNL_CPU_RUNTIME=DPCPP \
+  -DDNNL_GPU_RUNTIME=DPCPP \
+  -DDNNL_GPU_VENDOR=NVIDIA \
+  -DNNL_BUILD_EXAMPLES=OFF \
+  -DTBBROOT=$DPCPP_HOME/deploy \
+  -DCUDA_SDK_ROOT_DIR=$CUDA_ROOT \
+  -DOPENCLROOT=$DPCPP_HOME/OpenCL-ICD-Loader/install \
+  -DOpenCL_INCLUDE_DIR=$DPCPP_HOME/OpenCL-Headers \
+  -DCUBLAS_LIBRARY=$CUDA_ROOT/lib64/libcublas.so \
+  -DCUBLAS_INCLUDE_DIR=$CUDA_ROOT/include \
+  -DCMAKE_INSTALL_PREFIX=$DPCPP_HOME/deploy \
+  -DDNNL_BUILD_TESTS=$cmake_test \
+  ..
+ninja install -j $(nproc)
+if $run_test; then
+  LD_LIBRARY_PATH=$DPCPP_HOME/deploy/lib ninja test -j $(nproc)
+fi
@@ -0,0 +1,154 @@
+#!/bin/sh
+export DPCPP_HOME=~/sycl_workspace
+export CUDA_ROOT=/usr/local/cuda-10.2
+export LD_LIBRARY_PATH=$DPCPP_HOME/deploy/lib/:$DPCPP_HOME/deploy/lib64/:$DPCPP_HOME/lapack/install/lib64/:$DPCPP_HOME/OpenCL-ICD-Loader/install/lib64:$CUDA_ROOT/lib:$CUDA_ROOT/lib64:$LD_LIBRARY_PATH
+export PATH=$DPCPP_HOME/deploy/bin/:$CUDA_ROOT/bin:$PATH
+
+mkdir -p $DPCPP_HOME
+cd $DPCPP_HOME
+mkdir -p deploy
+
+#export LD_PRELOAD=/opt/intel/opencl/libOpenCL.so.1
+
+run_test=false
+cmake_test="OFF"
+
+if [[ -z "$DPCPP_TESTS" ]]; then
+  echo "Not testing"
+else
+  echo "testing"
+  run_test=true
+  cmake_test="ON"
+fi
+
+export CXXFLAGS="${CXXFLAGS} -D_GLIBCXX_USE_CXX11_ABI=1"
+
+# OpenCL headers+ICD
+cd $DPCPP_HOME
+(if cd OpenCL-Headers; then git pull; else git clone https://github.com/KhronosGroup/OpenCL-Headers.git; fi)
+(if cd OpenCL-ICD-Loader; then git pull; else git clone https://github.com/KhronosGroup/OpenCL-ICD-Loader.git; fi)
+cd OpenCL-ICD-Loader
+mkdir -p build
+cd build
+cmake \
+  -DOPENCL_ICD_LOADER_HEADERS_DIR=$DPCPP_HOME/OpenCL-Headers \
+  -DCMAKE_INSTALL_PREFIX=$DPCPP_HOME/OpenCL-ICD-Loader/install \
+  ..
+make install -j $(nproc)
+
+#sycl compiler with cuda
+cd $DPCPP_HOME
+(if cd llvm; then git pull; else git clone https://github.com/intel/llvm.git -b sycl; fi)
+cd llvm
+python3 ./buildbot/configure.py \
+  --cuda \
+  -t release \
+  --cmake-opt="-DCMAKE_INSTALL_PREFIX=$DPCPP_HOME/deploy" \
+  --cmake-opt="-DCUDA_SDK_ROOT_DIR=$CUDA_ROOT" \
+  --cmake-opt="-DLLVM_BINUTILS_INCDIR=/usr/local/include" \
+  --cmake-opt="-DLLVM_ENABLE_PROJECTS=clang;sycl;llvm-spirv;opencl;libdevice;xpti;xptifw;libclc;openmp" \
+  --cmake-opt="-DLLVM_BUILD_TESTS=$cmake_test" \
+  --cmake-opt="-DCMAKE_CXX_STANDARD=17" \
+  --cmake-opt="-DLLVM_ENABLE_LTO=off" \
+  --cmake-opt="-DLLVM_ENABLE_LLD=ON" \
+  --cmake-opt="-Wno-dev"
+cd build
+ninja install -j $(nproc)
+if $run_test; then
+  echo "testing llvm"
+  ninja check -j $(nproc)
+fi
+
+#Lapack Reference
+cd $DPCPP_HOME
+(if cd lapack; then git pull; else git clone https://github.com/Reference-LAPACK/lapack.git; fi)
+cd lapack/
+mkdir -p build
+cd build/
+cmake \
+  -DBUILD_SHARED_LIBS=ON \
+  -DCBLAS=ON \
+  -DLAPACKE=ON \
+  -DBUILD_TESTING=$cmake_test \
+  -DCMAKE_INSTALL_PREFIX=$DPCPP_HOME/lapack/install \
+  ..
+cmake --build . -j $(nproc) --target install
+if $run_test; then
+  cmake --build . -j $(nproc) --target test
+fi
+
+#oneTBB
+cd $DPCPP_HOME
+(if cd oneTBB; then git pull; else git clone https://github.com/oneapi-src/oneTBB.git; fi)
+cd oneTBB
+mkdir -p build
+cd build
+cmake -GNinja \
+  -DCMAKE_CXX_COMPILER=$DPCPP_HOME/deploy/bin/clang++ \
+  -DCMAKE_BUILD_TYPE=Release \
+  -DTBB_STRICT=OFF \
+  -DCMAKE_INSTALL_PREFIX=$DPCPP_HOME/deploy/ \
+  -DTBB_TEST=$cmake_test \
+  ..
+ninja install -j $(nproc)
+if $run_test; then
+  ninja test -j $(nproc)
+fi
+
+#oneMKL
+cd $DPCPP_HOME
+(if cd oneMKL; then git pull; else git clone https://github.com/oneapi-src/oneMKL.git; fi)
+cd oneMKL
+mkdir -p build
+cd build
+cmake -GNinja \
+  -DCMAKE_CXX_COMPILER=$DPCPP_HOME/deploy/bin/clang++ \
+  -DCMAKE_BUILD_TYPE=Release \
+  -DCMAKE_CXX_STANDARD=17 \
+  -DTARGET_DOMAINS=blas \
+  -DENABLE_MKLGPU_BACKEND=OFF \
+  -DENABLE_CURAND_BACKEND=OFF \
+  -DENABLE_MKLCPU_BACKEND=OFF \
+  -DENABLE_CUBLAS_BACKEND=ON \
+  -DENABLE_NETLIB_BACKEND=ON \
+  -DREF_BLAS_ROOT=$DPCPP_HOME/lapack/install \
+  -DNETLIB_ROOT=$DPCPP_HOME/lapack/install \
+  -DOPENCL_INCLUDE_DIR=$DPCPP_HOME/OpenCL-Headers \
+  -DCUDA_TOOLKIT_ROOT_DIR=$CUDA_ROOT \
+  -DSYCL_LIBRARY=$DPCPP_HOME/deploy/lib/libsycl.so \
+  -DCMAKE_INSTALL_PREFIX=$DPCPP_HOME/deploy/ \
+  -DBUILD_FUNCTIONAL_TESTS=$cmake_test \
+  ..
+ninja install -j $(nproc)
+if $run_test; then
+  ninja test -j $(nproc)
+fi
+
+#oneDNN
+cd $DPCPP_HOME
+(if cd oneDNN; then git pull; else git clone https://github.com/oneapi-src/oneDNN.git; fi)
+cd oneDNN
+mkdir -p build
+cd build
+cmake -GNinja \
+  -DCMAKE_C_COMPILER=$DPCPP_HOME/deploy/bin/clang \
+  -DCMAKE_CXX_COMPILER=$DPCPP_HOME/deploy/bin/clang++ \
+  -DCMAKE_BUILD_TYPE=Release \
+  -DCMAKE_CXX_STANDARD=17 \
+  -DDNNL_INSTALL_MODE=BUNDLE \
+  -DDNNL_CPU_RUNTIME=DPCPP \
+  -DDNNL_GPU_RUNTIME=DPCPP \
+  -DDNNL_GPU_VENDOR=NVIDIA \
+  -DTBBROOT=$DPCPP_HOME/deploy \
+  -DCUDA_SDK_ROOT_DIR=$CUDA_ROOT \
+  -DOPENCLROOT=$DPCPP_HOME/OpenCL-ICD-Loader/install \
+  -DOpenCL_INCLUDE_DIR=$DPCPP_HOME/OpenCL-Headers \
+  -DCUBLAS_LIBRARY=$CUDA_ROOT/lib64/libcublas.so \
+  -DCUBLAS_INCLUDE_DIR=$CUDA_ROOT/include \
+  -DCMAKE_INSTALL_PREFIX=$DPCPP_HOME/deploy \
+  -DDNNL_BUILD_TESTS=$cmake_test \
+  ..
+ninja install -j $(nproc)
+if $run_test; then
+  LD_LIBRARY_PATH=$DPCPP_HOME/deploy/lib ninja test -j $(nproc)
+fi