Cuda parallel test add mark large #4723

oleksandr-pavlyk · 2025-05-16T14:11:59Z

Description

This PR introduces pytest.mark.large to cuda.parallel test suite and marks tests allocating over 2**20 elements as large. CI script running project's test use -m "not large".

Verified that this helps by running CUDA_VISIBLE_DEVICES=1 pytest -s -n 6 -m "not large" tests locally, where device 1 is RTX A400 4GB consumer GPU card.

Of course, with a 64-core machine, CUDA_VISIBLE_DEVICES=1 pytest -s -n auto -m "not large" tests runs into out-of-memory issues.

Checklist

New or existing tests cover these changes.
The documentation is up to date with these changes.

pytest.mark.large is intended to mark test making large GPU memory allocations.

github-actions · 2025-05-16T15:42:05Z

🟩 CI finished in 1h 15m: Pass: 100%/187 | Total: 1d 07h | Avg: 10m 14s | Max: 38m 35s | Hits: 97%/282436

🟩 cub: Pass: 100%/47 | Total: 10h 44m | Avg: 13m 43s | Max: 33m 27s | Hits: 99%/56985

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total: 10h 30m | Avg: 14m 00s | Max: 33m 27s | Hits:  99%/54507 
  🟩 arm64              Pass: 100%/2   | Total: 14m 41s | Avg:  7m 20s | Max:  8m 20s | Hits:  99%/2478  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 57m 49s | Avg: 11m 33s | Max: 27m 46s | Hits:  99%/6021  
  🟩 12.8               Pass: 100%/42  | Total:  9h 47m | Avg: 13m 58s | Max: 33m 27s | Hits:  99%/50964 
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 11m 14s | Avg:  5m 37s | Max:  5m 39s | Hits: 100%/2134  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 57m 49s | Avg: 11m 33s | Max: 27m 46s | Hits:  99%/6021  
  🟩 nvcc12.8           Pass: 100%/40  | Total:  9h 35m | Avg: 14m 23s | Max: 33m 27s | Hits:  99%/48830 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 11m 14s | Avg:  5m 37s | Max:  5m 39s | Hits: 100%/2134  
  🟩 nvcc               Pass: 100%/45  | Total: 10h 33m | Avg: 14m 04s | Max: 33m 27s | Hits:  99%/54851 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 27m 28s | Avg:  6m 52s | Max:  7m 21s | Hits: 100%/4964  
  🟩 Clang15            Pass: 100%/2   | Total: 15m 05s | Avg:  7m 32s | Max:  7m 33s | Hits: 100%/2478  
  🟩 Clang16            Pass: 100%/2   | Total: 14m 30s | Avg:  7m 15s | Max:  7m 26s | Hits: 100%/2478  
  🟩 Clang17            Pass: 100%/2   | Total: 15m 14s | Avg:  7m 37s | Max:  7m 38s | Hits: 100%/2478  
  🟩 Clang18            Pass: 100%/2   | Total: 14m 15s | Avg:  7m 07s | Max:  7m 11s | Hits: 100%/2478  
  🟩 Clang19            Pass: 100%/7   | Total:  1h 27m | Avg: 12m 27s | Max: 29m 59s | Hits: 100%/8329  
  🟩 GCC7               Pass: 100%/2   | Total: 17m 27s | Avg:  8m 43s | Max:  8m 50s | Hits:  99%/2482  
  🟩 GCC8               Pass: 100%/1   | Total:  9m 06s | Avg:  9m 06s | Max:  9m 06s | Hits:  99%/1241  
  🟩 GCC9               Pass: 100%/2   | Total: 17m 22s | Avg:  8m 41s | Max:  8m 57s | Hits:  99%/2482  
  🟩 GCC10              Pass: 100%/2   | Total: 17m 58s | Avg:  8m 59s | Max:  9m 09s | Hits:  99%/2482  
  🟩 GCC11              Pass: 100%/2   | Total: 18m 01s | Avg:  9m 00s | Max:  9m 14s | Hits:  99%/2478  
  🟩 GCC12              Pass: 100%/2   | Total: 18m 23s | Avg:  9m 11s | Max:  9m 23s | Hits:  99%/2478  
  🟩 GCC13              Pass: 100%/11  | Total:  3h 45m | Avg: 20m 32s | Max: 33m 27s | Hits:  99%/13629 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 56m 25s | Avg: 28m 12s | Max: 28m 39s | Hits:  99%/2114  
  🟩 MSVC14.42          Pass: 100%/2   | Total:  1h 00m | Avg: 30m 22s | Max: 30m 33s | Hits:  99%/2114  
  🟩 NVHPC25.3          Pass: 100%/2   | Total: 29m 42s | Avg: 14m 51s | Max: 15m 05s | Hits:  98%/2280  
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 53m | Avg:  9m 08s | Max: 29m 59s | Hits: 100%/23205 
  🟩 GCC                Pass: 100%/22  | Total:  5h 24m | Avg: 14m 44s | Max: 33m 27s | Hits:  99%/27272 
  🟩 MSVC               Pass: 100%/4   | Total:  1h 57m | Avg: 29m 17s | Max: 30m 33s | Hits:  99%/4228  
  🟩 NVHPC              Pass: 100%/2   | Total: 29m 42s | Avg: 14m 51s | Max: 15m 05s | Hits:  98%/2280  
🟩 gpu
  🟩 h100               Pass: 100%/3   | Total:  1h 01m | Avg: 20m 32s | Max: 28m 58s | Hits:  99%/3717  
  🟩 rtx2080            Pass: 100%/36  | Total:  6h 23m | Avg: 10m 39s | Max: 30m 33s | Hits:  99%/43356 
  🟩 rtxa6000           Pass: 100%/8   | Total:  3h 19m | Avg: 24m 55s | Max: 33m 27s | Hits:  99%/9912  
🟩 jobs
  🟩 Build              Pass: 100%/39  | Total:  6h 47m | Avg: 10m 26s | Max: 30m 33s | Hits:  99%/47073 
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 30m 38s | Avg: 30m 38s | Max: 30m 38s | Hits:  99%/1239  
  🟩 GraphCapture       Pass: 100%/1   | Total: 30m 28s | Avg: 30m 28s | Max: 30m 28s | Hits:  99%/1239  
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 32m | Avg: 30m 47s | Max: 33m 24s | Hits:  99%/3717  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 24m | Avg: 28m 08s | Max: 33m 27s | Hits:  99%/3717  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total:  1h 01m | Avg: 20m 32s | Max: 28m 58s | Hits:  99%/3717  
  🟩 90;90a;100         Pass: 100%/1   | Total:  9m 28s | Avg:  9m 28s | Max:  9m 28s | Hits:  99%/1239  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  3h 59m | Avg: 11m 23s | Max: 30m 33s | Hits:  99%/25218 
  🟩 20                 Pass: 100%/26  | Total:  6h 45m | Avg: 15m 36s | Max: 33m 27s | Hits:  99%/31767

🟩 thrust: Pass: 100%/47 | Total: 8h 49m | Avg: 11m 16s | Max: 38m 35s | Hits: 99%/84074

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 21m 20s | Avg: 10m 40s | Max: 13m 17s | Hits:  99%/3580  
🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  8h 37m | Avg: 11m 29s | Max: 38m 35s | Hits:  99%/80495 
  🟩 arm64              Pass: 100%/2   | Total: 12m 15s | Avg:  6m 07s | Max:  6m 52s | Hits:  99%/3579  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 56m 56s | Avg: 11m 23s | Max: 30m 25s | Hits:  99%/8941  
  🟩 12.8               Pass: 100%/42  | Total:  7h 52m | Avg: 11m 15s | Max: 38m 35s | Hits:  99%/75133 
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 11m 28s | Avg:  5m 44s | Max:  5m 50s | Hits: 100%/3578  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 56m 56s | Avg: 11m 23s | Max: 30m 25s | Hits:  99%/8941  
  🟩 nvcc12.8           Pass: 100%/40  | Total:  7h 41m | Avg: 11m 31s | Max: 38m 35s | Hits:  99%/71555 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 11m 28s | Avg:  5m 44s | Max:  5m 50s | Hits: 100%/3578  
  🟩 nvcc               Pass: 100%/45  | Total:  8h 38m | Avg: 11m 30s | Max: 38m 35s | Hits:  99%/80496 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 24m 27s | Avg:  6m 06s | Max:  6m 50s | Hits: 100%/7156  
  🟩 Clang15            Pass: 100%/2   | Total: 12m 38s | Avg:  6m 19s | Max:  6m 29s | Hits: 100%/3578  
  🟩 Clang16            Pass: 100%/2   | Total: 12m 12s | Avg:  6m 06s | Max:  6m 18s | Hits: 100%/3578  
  🟩 Clang17            Pass: 100%/2   | Total: 12m 46s | Avg:  6m 23s | Max:  6m 42s | Hits: 100%/3578  
  🟩 Clang18            Pass: 100%/2   | Total: 12m 33s | Avg:  6m 16s | Max:  6m 28s | Hits: 100%/3578  
  🟩 Clang19            Pass: 100%/7   | Total: 48m 38s | Avg:  6m 56s | Max: 10m 46s | Hits: 100%/12523 
  🟩 GCC7               Pass: 100%/2   | Total: 15m 09s | Avg:  7m 34s | Max:  7m 35s | Hits:  99%/3580  
  🟩 GCC8               Pass: 100%/1   | Total:  6m 48s | Avg:  6m 48s | Max:  6m 48s | Hits:  99%/1790  
  🟩 GCC9               Pass: 100%/2   | Total: 14m 49s | Avg:  7m 24s | Max:  7m 35s | Hits:  99%/3580  
  🟩 GCC10              Pass: 100%/2   | Total: 15m 21s | Avg:  7m 40s | Max:  7m 44s | Hits:  99%/3580  
  🟩 GCC11              Pass: 100%/2   | Total: 15m 22s | Avg:  7m 41s | Max:  7m 43s | Hits:  99%/3580  
  🟩 GCC12              Pass: 100%/2   | Total: 15m 23s | Avg:  7m 41s | Max:  7m 45s | Hits:  99%/3580  
  🟩 GCC13              Pass: 100%/10  | Total:  1h 35m | Avg:  9m 32s | Max: 13m 51s | Hits:  99%/17900 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 03m | Avg: 31m 37s | Max: 32m 50s | Hits:  99%/3566  
  🟩 MSVC14.42          Pass: 100%/3   | Total:  1h 40m | Avg: 33m 37s | Max: 38m 35s | Hits:  99%/5349  
  🟩 NVHPC25.3          Pass: 100%/2   | Total:  1h 03m | Avg: 31m 59s | Max: 32m 41s | Hits:  99%/3578  
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 03m | Avg:  6m 29s | Max: 10m 46s | Hits: 100%/33991 
  🟩 GCC                Pass: 100%/21  | Total:  2h 58m | Avg:  8m 29s | Max: 13m 51s | Hits:  99%/37590 
  🟩 MSVC               Pass: 100%/5   | Total:  2h 44m | Avg: 32m 49s | Max: 38m 35s | Hits:  99%/8915  
  🟩 NVHPC              Pass: 100%/2   | Total:  1h 03m | Avg: 31m 59s | Max: 32m 41s | Hits:  99%/3578  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 19m 18s | Avg:  9m 39s | Max: 13m 24s | Hits:  99%/3580  
  🟩 rtx2080            Pass: 100%/35  | Total:  6h 01m | Avg: 10m 19s | Max: 32m 50s | Hits:  99%/62611 
  🟩 rtx4090            Pass: 100%/10  | Total:  2h 28m | Avg: 14m 53s | Max: 38m 35s | Hits:  99%/17883 
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  7h 01m | Avg: 10m 31s | Max: 32m 50s | Hits:  99%/71553 
  🟩 TestCPU            Pass: 100%/3   | Total: 57m 06s | Avg: 19m 02s | Max: 38m 35s | Hits:  99%/5362  
  🟩 TestGPU            Pass: 100%/4   | Total: 51m 18s | Avg: 12m 49s | Max: 13m 51s | Hits:  99%/7159  
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 19m 18s | Avg:  9m 39s | Max: 13m 24s | Hits:  99%/3580  
  🟩 90;90a;100         Pass: 100%/1   | Total:  8m 05s | Avg:  8m 05s | Max:  8m 05s | Hits:  99%/1790  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  4h 04m | Avg: 11m 39s | Max: 32m 50s | Hits:  99%/37560 
  🟩 20                 Pass: 100%/24  | Total:  4h 23m | Avg: 10m 58s | Max: 38m 35s | Hits:  99%/42934

🟩 libcudacxx: Pass: 100%/45 | Total: 7h 20m | Avg: 9m 46s | Max: 32m 07s | Hits: 95%/126409

🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total:  7h 10m | Avg: 10m 00s | Max: 32m 07s | Hits:  95%/119860
  🟩 arm64              Pass: 100%/2   | Total:  9m 31s | Avg:  4m 45s | Max:  4m 50s | Hits:  99%/6549  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 48m 22s | Avg:  9m 40s | Max: 30m 20s | Hits:  99%/16001 
  🟩 12.8               Pass: 100%/40  | Total:  6h 31m | Avg:  9m 47s | Max: 32m 07s | Hits:  95%/110408
🟩 cudacxx
  🟩 ClangCUDA19        Pass: 100%/2   | Total: 52m 30s | Avg: 26m 15s | Max: 28m 44s | Hits:  26%/6511  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 48m 22s | Avg:  9m 40s | Max: 30m 20s | Hits:  99%/16001 
  🟩 nvcc12.8           Pass: 100%/38  | Total:  5h 39m | Avg:  8m 55s | Max: 32m 07s | Hits:  99%/103897
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 52m 30s | Avg: 26m 15s | Max: 28m 44s | Hits:  26%/6511  
  🟩 nvcc               Pass: 100%/43  | Total:  6h 27m | Avg:  9m 00s | Max: 32m 07s | Hits:  99%/119898
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 19m 46s | Avg:  4m 56s | Max:  5m 18s | Hits:  99%/12978 
  🟩 Clang15            Pass: 100%/2   | Total: 11m 06s | Avg:  5m 33s | Max:  5m 34s | Hits:  99%/6507  
  🟩 Clang16            Pass: 100%/2   | Total: 10m 32s | Avg:  5m 16s | Max:  5m 18s | Hits:  99%/6507  
  🟩 Clang17            Pass: 100%/2   | Total: 10m 21s | Avg:  5m 10s | Max:  5m 11s | Hits:  99%/6507  
  🟩 Clang18            Pass: 100%/2   | Total: 10m 40s | Avg:  5m 20s | Max:  5m 27s | Hits:  99%/6507  
  🟩 Clang19            Pass: 100%/6   | Total:  1h 18m | Avg: 13m 09s | Max: 28m 44s | Hits:  70%/16292 
  🟩 GCC7               Pass: 100%/2   | Total:  9m 01s | Avg:  4m 30s | Max:  4m 45s | Hits:  99%/6441  
  🟩 GCC8               Pass: 100%/1   | Total:  4m 44s | Avg:  4m 44s | Max:  4m 44s | Hits:  99%/3231  
  🟩 GCC9               Pass: 100%/2   | Total: 10m 00s | Avg:  5m 00s | Max:  5m 27s | Hits:  99%/6453  
  🟩 GCC10              Pass: 100%/2   | Total: 10m 06s | Avg:  5m 03s | Max:  5m 13s | Hits:  99%/6509  
  🟩 GCC11              Pass: 100%/2   | Total:  9m 52s | Avg:  4m 56s | Max:  4m 59s | Hits:  99%/6505  
  🟩 GCC12              Pass: 100%/2   | Total: 10m 21s | Avg:  5m 10s | Max:  5m 45s | Hits:  99%/6509  
  🟩 GCC13              Pass: 100%/10  | Total:  1h 33m | Avg:  9m 21s | Max: 20m 20s | Hits:  99%/16538 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 02m | Avg: 31m 11s | Max: 32m 02s | Hits:  99%/6185  
  🟩 MSVC14.42          Pass: 100%/2   | Total:  1h 03m | Avg: 31m 30s | Max: 32m 07s | Hits:  99%/6243  
  🟩 NVHPC25.3          Pass: 100%/2   | Total: 25m 43s | Avg: 12m 51s | Max: 12m 55s | Hits:  98%/6497  
🟩 cxx_family
  🟩 Clang              Pass: 100%/18  | Total:  2h 21m | Avg:  7m 51s | Max: 28m 44s | Hits:  90%/55298 
  🟩 GCC                Pass: 100%/21  | Total:  2h 27m | Avg:  7m 01s | Max: 20m 20s | Hits:  99%/52186 
  🟩 MSVC               Pass: 100%/4   | Total:  2h 05m | Avg: 31m 20s | Max: 32m 07s | Hits:  99%/12428 
  🟩 NVHPC              Pass: 100%/2   | Total: 25m 43s | Avg: 12m 51s | Max: 12m 55s | Hits:  98%/6497  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 20m 15s | Avg: 10m 07s | Max: 15m 17s | Hits:  99%/3357  
  🟩 rtx2080            Pass: 100%/43  | Total:  6h 59m | Avg:  9m 45s | Max: 32m 07s | Hits:  95%/123052
🟩 jobs
  🟩 Build              Pass: 100%/39  | Total:  6h 01m | Avg:  9m 15s | Max: 32m 07s | Hits:  95%/126369
  🟩 NVRTC              Pass: 100%/2   | Total: 39m 54s | Avg: 19m 57s | Max: 20m 20s | Hits:  90%/40    
  🟩 Test               Pass: 100%/3   | Total: 36m 24s | Avg: 12m 08s | Max: 15m 17s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 37s | Avg:  2m 37s | Max:  2m 37s
🟩 sm
  🟩 75                 Pass: 100%/2   | Total: 39m 54s | Avg: 19m 57s | Max: 20m 20s | Hits:  90%/40    
  🟩 90                 Pass: 100%/2   | Total: 20m 15s | Avg: 10m 07s | Max: 15m 17s | Hits:  99%/3357  
  🟩 90;90a;100         Pass: 100%/1   | Total:  6m 00s | Avg:  6m 00s | Max:  6m 00s | Hits:  99%/3357  
🟩 std
  🟩 17                 Pass: 100%/22  | Total:  3h 49m | Avg: 10m 24s | Max: 32m 02s | Hits:  95%/67441 
  🟩 20                 Pass: 100%/22  | Total:  3h 28m | Avg:  9m 28s | Max: 32m 07s | Hits:  95%/58968

🟩 cudax: Pass: 100%/26 | Total: 2h 27m | Avg: 5m 41s | Max: 13m 23s | Hits: 99%/14642

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  2h 13m | Avg:  6m 04s | Max: 13m 23s | Hits:  99%/12298 
  🟩 arm64              Pass: 100%/4   | Total: 14m 20s | Avg:  3m 35s | Max:  3m 53s | Hits:  99%/2344  
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 20m 47s | Avg:  6m 55s | Max: 13m 23s | Hits:  98%/1463  
  🟩 12.8               Pass: 100%/23  | Total:  2h 07m | Avg:  5m 31s | Max: 13m 20s | Hits:  99%/13179 
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 20m 47s | Avg:  6m 55s | Max: 13m 23s | Hits:  98%/1463  
  🟩 nvcc12.8           Pass: 100%/23  | Total:  2h 07m | Avg:  5m 31s | Max: 13m 20s | Hits:  99%/13179 
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 27m | Avg:  5m 41s | Max: 13m 23s | Hits:  99%/14642 
🟩 cxx
  🟩 Clang14            Pass: 100%/2   | Total:  7m 15s | Avg:  3m 37s | Max:  3m 49s | Hits: 100%/1176  
  🟩 Clang15            Pass: 100%/1   | Total:  3m 53s | Avg:  3m 53s | Max:  3m 53s | Hits: 100%/586   
  🟩 Clang16            Pass: 100%/1   | Total:  4m 04s | Avg:  4m 04s | Max:  4m 04s | Hits: 100%/586   
  🟩 Clang17            Pass: 100%/1   | Total:  4m 12s | Avg:  4m 12s | Max:  4m 12s | Hits: 100%/586   
  🟩 Clang18            Pass: 100%/1   | Total:  3m 44s | Avg:  3m 44s | Max:  3m 44s | Hits: 100%/586   
  🟩 Clang19            Pass: 100%/4   | Total: 19m 07s | Avg:  4m 46s | Max:  8m 45s | Hits: 100%/2344  
  🟩 GCC10              Pass: 100%/2   | Total:  8m 02s | Avg:  4m 01s | Max:  4m 04s | Hits:  99%/1176  
  🟩 GCC11              Pass: 100%/1   | Total:  4m 09s | Avg:  4m 09s | Max:  4m 09s | Hits:  99%/586   
  🟩 GCC12              Pass: 100%/1   | Total:  4m 52s | Avg:  4m 52s | Max:  4m 52s | Hits:  99%/586   
  🟩 GCC13              Pass: 100%/8   | Total: 44m 18s | Avg:  5m 32s | Max: 13m 02s | Hits:  99%/4688  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 13m 23s | Avg: 13m 23s | Max: 13m 23s | Hits:  95%/287   
  🟩 MSVC14.42          Pass: 100%/1   | Total: 13m 20s | Avg: 13m 20s | Max: 13m 20s | Hits:  95%/287   
  🟩 NVHPC25.3          Pass: 100%/2   | Total: 17m 35s | Avg:  8m 47s | Max:  8m 48s | Hits:  97%/1168  
🟩 cxx_family
  🟩 Clang              Pass: 100%/10  | Total: 42m 15s | Avg:  4m 13s | Max:  8m 45s | Hits: 100%/5864  
  🟩 GCC                Pass: 100%/12  | Total:  1h 01m | Avg:  5m 06s | Max: 13m 02s | Hits:  99%/7036  
  🟩 MSVC               Pass: 100%/2   | Total: 26m 43s | Avg: 13m 21s | Max: 13m 23s | Hits:  95%/574   
  🟩 NVHPC              Pass: 100%/2   | Total: 17m 35s | Avg:  8m 47s | Max:  8m 48s | Hits:  97%/1168  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 11m 44s | Avg:  5m 52s | Max:  8m 16s | Hits:  99%/1172  
  🟩 rtx2080            Pass: 100%/24  | Total:  2h 16m | Avg:  5m 40s | Max: 13m 23s | Hits:  99%/13470 
🟩 jobs
  🟩 Build              Pass: 100%/23  | Total:  1h 57m | Avg:  5m 07s | Max: 13m 23s | Hits:  99%/12884 
  🟩 Test               Pass: 100%/3   | Total: 30m 03s | Avg: 10m 01s | Max: 13m 02s | Hits:  99%/1758  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total: 15m 15s | Avg:  5m 05s | Max:  8m 16s | Hits:  99%/1758  
  🟩 90a                Pass: 100%/1   | Total:  3m 40s | Avg:  3m 40s | Max:  3m 40s | Hits:  99%/586   
🟩 std
  🟩 17                 Pass: 100%/4   | Total: 19m 31s | Avg:  4m 52s | Max:  8m 47s | Hits:  99%/2342  
  🟩 20                 Pass: 100%/22  | Total:  2h 08m | Avg:  5m 50s | Max: 13m 23s | Hits:  99%/12300

🟩 python: Pass: 100%/12 | Total: 1h 35m | Avg: 7m 59s | Max: 19m 25s

🟩 cpu
  🟩 amd64              Pass: 100%/12  | Total:  1h 35m | Avg:  7m 59s | Max: 19m 25s
🟩 ctk
  🟩 12.8               Pass: 100%/12  | Total:  1h 35m | Avg:  7m 59s | Max: 19m 25s
🟩 cudacxx
  🟩 nvcc12.8           Pass: 100%/12  | Total:  1h 35m | Avg:  7m 59s | Max: 19m 25s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/12  | Total:  1h 35m | Avg:  7m 59s | Max: 19m 25s
🟩 cxx
  🟩 GCC13              Pass: 100%/12  | Total:  1h 35m | Avg:  7m 59s | Max: 19m 25s
🟩 cxx_family
  🟩 GCC                Pass: 100%/12  | Total:  1h 35m | Avg:  7m 59s | Max: 19m 25s
🟩 gpu
  🟩 rtxa6000           Pass: 100%/12  | Total:  1h 35m | Avg:  7m 59s | Max: 19m 25s
🟩 jobs
  🟩 Build cuda.cccl    Pass: 100%/2   | Total:  6m 50s | Avg:  3m 25s | Max:  3m 28s
  🟩 Build cuda.cooperative Pass: 100%/2   | Total:  6m 37s | Avg:  3m 18s | Max:  3m 19s
  🟩 Build cuda.parallel Pass: 100%/2   | Total: 19m 24s | Avg:  9m 42s | Max:  9m 48s
  🟩 Test cuda.cccl     Pass: 100%/2   | Total:  8m 42s | Avg:  4m 21s | Max:  4m 32s
  🟩 Test cuda.cooperative Pass: 100%/2   | Total: 36m 49s | Avg: 18m 24s | Max: 19m 25s
  🟩 Test cuda.parallel Pass: 100%/2   | Total: 17m 30s | Avg:  8m 45s | Max:  8m 46s
🟩 py_version
  🟩 3.10               Pass: 100%/6   | Total: 47m 15s | Avg:  7m 52s | Max: 17m 24s
  🟩 3.13               Pass: 100%/6   | Total: 48m 37s | Avg:  8m 06s | Max: 19m 25s

🟩 cccl: Pass: 100%/4 | Total: 20m 16s | Avg: 5m 04s | Max: 7m 48s

🟩 cpu
  🟩 amd64              Pass: 100%/4   | Total: 20m 16s | Avg:  5m 04s | Max:  7m 48s
🟩 ctk
  🟩 12.0               Pass: 100%/2   | Total:  7m 35s | Avg:  3m 47s | Max:  4m 14s
  🟩 12.8               Pass: 100%/2   | Total: 12m 41s | Avg:  6m 20s | Max:  7m 48s
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/2   | Total:  7m 35s | Avg:  3m 47s | Max:  4m 14s
  🟩 nvcc12.8           Pass: 100%/2   | Total: 12m 41s | Avg:  6m 20s | Max:  7m 48s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 20m 16s | Avg:  5m 04s | Max:  7m 48s
🟩 cxx
  🟩 Clang14            Pass: 100%/1   | Total:  4m 14s | Avg:  4m 14s | Max:  4m 14s
  🟩 Clang19            Pass: 100%/1   | Total:  4m 53s | Avg:  4m 53s | Max:  4m 53s
  🟩 GCC12              Pass: 100%/1   | Total:  3m 21s | Avg:  3m 21s | Max:  3m 21s
  🟩 GCC13              Pass: 100%/1   | Total:  7m 48s | Avg:  7m 48s | Max:  7m 48s
🟩 cxx_family
  🟩 Clang              Pass: 100%/2   | Total:  9m 07s | Avg:  4m 33s | Max:  4m 53s
  🟩 GCC                Pass: 100%/2   | Total: 11m 09s | Avg:  5m 34s | Max:  7m 48s
🟩 gpu
  🟩 rtx2080            Pass: 100%/4   | Total: 20m 16s | Avg:  5m 04s | Max:  7m 48s
🟩 jobs
  🟩 Infra              Pass: 100%/4   | Total: 20m 16s | Avg:  5m 04s | Max:  7m 48s

🟩 stdpar: Pass: 100%/4 | Total: 21m 09s | Avg: 5m 17s | Max: 6m 04s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 12m 07s | Avg:  6m 03s | Max:  6m 04s
  🟩 arm64              Pass: 100%/2   | Total:  9m 02s | Avg:  4m 31s | Max:  4m 33s
🟩 ctk
  🟩 12.8               Pass: 100%/4   | Total: 21m 09s | Avg:  5m 17s | Max:  6m 04s
🟩 cudacxx
  🟩 nvcc12.8           Pass: 100%/4   | Total: 21m 09s | Avg:  5m 17s | Max:  6m 04s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 21m 09s | Avg:  5m 17s | Max:  6m 04s
🟩 cxx
  🟩 NVHPC25.3          Pass: 100%/4   | Total: 21m 09s | Avg:  5m 17s | Max:  6m 04s
🟩 cxx_family
  🟩 NVHPC              Pass: 100%/4   | Total: 21m 09s | Avg:  5m 17s | Max:  6m 04s
🟩 gpu
  🟩 rtx2080            Pass: 100%/4   | Total: 21m 09s | Avg:  5m 17s | Max:  6m 04s
🟩 jobs
  🟩 Build              Pass: 100%/4   | Total: 21m 09s | Avg:  5m 17s | Max:  6m 04s
🟩 std
  🟩 17                 Pass: 100%/2   | Total: 10m 33s | Avg:  5m 16s | Max:  6m 04s
  🟩 20                 Pass: 100%/2   | Total: 10m 36s | Avg:  5m 18s | Max:  6m 03s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 15m 07s | Avg: 7m 33s | Max: 12m 33s | Hits: 98%/326

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 15m 07s | Avg:  7m 33s | Max: 12m 33s | Hits:  98%/326   
🟩 ctk
  🟩 12.8               Pass: 100%/2   | Total: 15m 07s | Avg:  7m 33s | Max: 12m 33s | Hits:  98%/326   
🟩 cudacxx
  🟩 nvcc12.8           Pass: 100%/2   | Total: 15m 07s | Avg:  7m 33s | Max: 12m 33s | Hits:  98%/326   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 15m 07s | Avg:  7m 33s | Max: 12m 33s | Hits:  98%/326   
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 15m 07s | Avg:  7m 33s | Max: 12m 33s | Hits:  98%/326   
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 15m 07s | Avg:  7m 33s | Max: 12m 33s | Hits:  98%/326   
🟩 gpu
  🟩 rtx2080            Pass: 100%/2   | Total: 15m 07s | Avg:  7m 33s | Max: 12m 33s | Hits:  98%/326   
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 34s | Avg:  2m 34s | Max:  2m 34s | Hits:  98%/163   
  🟩 Test               Pass: 100%/1   | Total: 12m 33s | Avg: 12m 33s | Max: 12m 33s | Hits:  98%/163

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
	libcu++
	CUB
	Thrust
	CUDA Experimental
	stdpar
+/-	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	stdpar
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 187)

#	Runner
129	`linux-amd64-cpu16`
15	`windows-amd64-cpu16`
12	`linux-arm64-cpu16`
12	`linux-amd64-gpu-rtxa6000-latest-1`
11	`linux-amd64-gpu-rtx2080-latest-1`
5	`linux-amd64-gpu-h100-latest-1`
3	`linux-amd64-gpu-rtx4090-latest-1`

python/cuda_parallel/tests/test_radix_sort.py

oleksandr-pavlyk added 2 commits May 16, 2025 08:37

Introduce large mark for cuda-parallel tests

a352ae6

pytest.mark.large is intended to mark test making large GPU memory allocations.

Run cuda_parallel/tests excluding tests marked large

9046127

oleksandr-pavlyk requested review from a team as code owners May 16, 2025 14:12

oleksandr-pavlyk requested review from elstehle and NaderAlAwar May 16, 2025 14:12

github-project-automation bot added this to CCCL May 16, 2025

github-project-automation bot moved this to Todo in CCCL May 16, 2025

oleksandr-pavlyk requested a review from shwina May 16, 2025 14:12

cccl-authenticator-app bot moved this from Todo to In Review in CCCL May 16, 2025

shwina approved these changes May 16, 2025

View reviewed changes

Replace pytest -n auto with pytest -n 6 in test_cuda_parallel_python.sh

9393a86

leofang approved these changes May 16, 2025

View reviewed changes

python/cuda_parallel/tests/test_radix_sort.py Show resolved Hide resolved

alliepiper approved these changes May 19, 2025

View reviewed changes

oleksandr-pavlyk merged commit a54dced into NVIDIA:main May 19, 2025
200 checks passed

github-project-automation bot moved this from In Review to Done in CCCL May 19, 2025

oleksandr-pavlyk deleted the cuda-parallel-test-add-mark-large branch May 19, 2025 20:24

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Cuda parallel test add mark large #4723

Cuda parallel test add mark large #4723

Uh oh!

oleksandr-pavlyk commented May 16, 2025

Uh oh!

github-actions bot commented May 16, 2025

🟩 cub: Pass: 100%/47 | Total: 10h 44m | Avg: 13m 43s | Max: 33m 27s | Hits: 99%/56985

🟩 thrust: Pass: 100%/47 | Total: 8h 49m | Avg: 11m 16s | Max: 38m 35s | Hits: 99%/84074

🟩 libcudacxx: Pass: 100%/45 | Total: 7h 20m | Avg: 9m 46s | Max: 32m 07s | Hits: 95%/126409

🟩 cudax: Pass: 100%/26 | Total: 2h 27m | Avg: 5m 41s | Max: 13m 23s | Hits: 99%/14642

🟩 python: Pass: 100%/12 | Total: 1h 35m | Avg: 7m 59s | Max: 19m 25s

🟩 cccl: Pass: 100%/4 | Total: 20m 16s | Avg: 5m 04s | Max: 7m 48s

🟩 stdpar: Pass: 100%/4 | Total: 21m 09s | Avg: 5m 17s | Max: 6m 04s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 15m 07s | Avg: 7m 33s | Max: 12m 33s | Hits: 98%/326

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 187)

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Cuda parallel test add mark large #4723

Cuda parallel test add mark large #4723

Uh oh!

Conversation

oleksandr-pavlyk commented May 16, 2025

Description

Checklist

Uh oh!

github-actions bot commented May 16, 2025

🟩 cub: Pass: 100%/47 | Total: 10h 44m | Avg: 13m 43s | Max: 33m 27s | Hits: 99%/56985

🟩 thrust: Pass: 100%/47 | Total: 8h 49m | Avg: 11m 16s | Max: 38m 35s | Hits: 99%/84074

🟩 libcudacxx: Pass: 100%/45 | Total: 7h 20m | Avg: 9m 46s | Max: 32m 07s | Hits: 95%/126409

🟩 cudax: Pass: 100%/26 | Total: 2h 27m | Avg: 5m 41s | Max: 13m 23s | Hits: 99%/14642

🟩 python: Pass: 100%/12 | Total: 1h 35m | Avg: 7m 59s | Max: 19m 25s

🟩 cccl: Pass: 100%/4 | Total: 20m 16s | Avg: 5m 04s | Max: 7m 48s

🟩 stdpar: Pass: 100%/4 | Total: 21m 09s | Avg: 5m 17s | Max: 6m 04s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 15m 07s | Avg: 7m 33s | Max: 12m 33s | Hits: 98%/326

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 187)

Uh oh!

Uh oh!

Uh oh!

Uh oh!