@@ -33,7 +33,7 @@ static void dequantize_block_sycl(const void *__restrict__ vx,
33
33
{
34
34
dpct::has_capability_or_fail (stream->get_device (),
35
35
{sycl::aspect::fp16});
36
- stream-> parallel_for (
36
+ syclex::nd_launch (*stream,
37
37
sycl::nd_range<3 >(
38
38
sycl::range<3 >(1 , 1 , num_blocks) *
39
39
sycl::range<3 >(1 , 1 , SYCL_DEQUANTIZE_BLOCK_SIZE),
@@ -53,7 +53,7 @@ static void dequantize_row_q2_K_sycl(const void *vx, dst_t *y, const int64_t k,
53
53
dpct::has_capability_or_fail (stream->get_device (),
54
54
{sycl::aspect::fp16});
55
55
56
- stream-> parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
56
+ syclex::nd_launch (*stream, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
57
57
sycl::range<3 >(1 , 1 , 64 ),
58
58
sycl::range<3 >(1 , 1 , 64 )),
59
59
[=](sycl::nd_item<3 > item_ct1) {
@@ -65,7 +65,7 @@ static void dequantize_row_q2_K_sycl(const void *vx, dst_t *y, const int64_t k,
65
65
dpct::has_capability_or_fail (stream->get_device (),
66
66
{sycl::aspect::fp16});
67
67
68
- stream-> parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
68
+ syclex::nd_launch (*stream, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
69
69
sycl::range<3 >(1 , 1 , 32 ),
70
70
sycl::range<3 >(1 , 1 , 32 )),
71
71
[=](sycl::nd_item<3 > item_ct1) {
@@ -85,7 +85,7 @@ static void dequantize_row_q3_K_sycl(const void *vx, dst_t *y, const int64_t k,
85
85
dpct::has_capability_or_fail (stream->get_device (),
86
86
{sycl::aspect::fp16});
87
87
88
- stream-> parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
88
+ syclex::nd_launch (*stream, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
89
89
sycl::range<3 >(1 , 1 , 64 ),
90
90
sycl::range<3 >(1 , 1 , 64 )),
91
91
[=](sycl::nd_item<3 > item_ct1) {
@@ -97,7 +97,7 @@ static void dequantize_row_q3_K_sycl(const void *vx, dst_t *y, const int64_t k,
97
97
dpct::has_capability_or_fail (stream->get_device (),
98
98
{sycl::aspect::fp16});
99
99
100
- stream-> parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
100
+ syclex::nd_launch (*stream, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
101
101
sycl::range<3 >(1 , 1 , 32 ),
102
102
sycl::range<3 >(1 , 1 , 32 )),
103
103
[=](sycl::nd_item<3 > item_ct1) {
@@ -116,7 +116,7 @@ static void dequantize_row_q4_0_sycl(const void *vx, dst_t *y, const int64_t k,
116
116
dpct::has_capability_or_fail (stream->get_device (),
117
117
{sycl::aspect::fp16});
118
118
119
- stream-> parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
119
+ syclex::nd_launch (*stream, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
120
120
sycl::range<3 >(1 , 1 , 32 ),
121
121
sycl::range<3 >(1 , 1 , 32 )),
122
122
[=](sycl::nd_item<3 > item_ct1) {
@@ -135,7 +135,7 @@ static void dequantize_row_q4_0_sycl_reorder(const void *vx, dst_t *y, const int
135
135
int constexpr WARP_K = WARP_SIZE * QK4_0;
136
136
const int n_warp = (k + WARP_K - 1 ) / WARP_K;
137
137
GGML_ASSERT (k % 2 == 0 );
138
- stream-> parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , n_warp) *
138
+ syclex::nd_launch (*stream, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , n_warp) *
139
139
sycl::range<3 >(1 , 1 , WARP_SIZE),
140
140
sycl::range<3 >(1 , 1 , WARP_SIZE)),
141
141
[=](sycl::nd_item<3 > item_ct1) [[sycl::reqd_sub_group_size (WARP_SIZE)]]{
@@ -153,7 +153,7 @@ static void dequantize_row_q4_1_sycl(const void *vx, dst_t *y, const int64_t k,
153
153
dpct::has_capability_or_fail (stream->get_device (),
154
154
{sycl::aspect::fp16});
155
155
156
- stream-> parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
156
+ syclex::nd_launch (*stream, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
157
157
sycl::range<3 >(1 , 1 , 32 ),
158
158
sycl::range<3 >(1 , 1 , 32 )),
159
159
[=](sycl::nd_item<3 > item_ct1) {
@@ -210,7 +210,7 @@ static void dequantize_row_q5_K_sycl(const void *vx, dst_t *y, const int64_t k,
210
210
dpct::has_capability_or_fail (stream->get_device (),
211
211
{sycl::aspect::fp16});
212
212
213
- stream-> parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
213
+ syclex::nd_launch (*stream, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
214
214
sycl::range<3 >(1 , 1 , 64 ),
215
215
sycl::range<3 >(1 , 1 , 64 )),
216
216
[=](sycl::nd_item<3 > item_ct1) {
@@ -222,7 +222,7 @@ static void dequantize_row_q5_K_sycl(const void *vx, dst_t *y, const int64_t k,
222
222
dpct::has_capability_or_fail (stream->get_device (),
223
223
{sycl::aspect::fp16});
224
224
225
- stream-> parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
225
+ syclex::nd_launch (*stream, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
226
226
sycl::range<3 >(1 , 1 , 32 ),
227
227
sycl::range<3 >(1 , 1 , 32 )),
228
228
[=](sycl::nd_item<3 > item_ct1) {
@@ -242,7 +242,7 @@ static void dequantize_row_q6_K_sycl(const void *vx, dst_t *y, const int64_t k,
242
242
dpct::has_capability_or_fail (stream->get_device (),
243
243
{sycl::aspect::fp16});
244
244
245
- stream-> parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
245
+ syclex::nd_launch (*stream, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
246
246
sycl::range<3 >(1 , 1 , 64 ),
247
247
sycl::range<3 >(1 , 1 , 64 )),
248
248
[=](sycl::nd_item<3 > item_ct1) {
@@ -254,7 +254,7 @@ static void dequantize_row_q6_K_sycl(const void *vx, dst_t *y, const int64_t k,
254
254
dpct::has_capability_or_fail (stream->get_device (),
255
255
{sycl::aspect::fp16});
256
256
257
- stream-> parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
257
+ syclex::nd_launch (*stream, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
258
258
sycl::range<3 >(1 , 1 , 32 ),
259
259
sycl::range<3 >(1 , 1 , 32 )),
260
260
[=](sycl::nd_item<3 > item_ct1) {
@@ -271,7 +271,7 @@ static void dequantize_row_q6_K_sycl_reorder(const void * vx, dst_t * y, const i
271
271
272
272
dpct::has_capability_or_fail (stream->get_device (), { sycl::aspect::fp16 });
273
273
274
- stream-> parallel_for (
274
+ syclex::nd_launch (*stream,
275
275
sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) * sycl::range<3 >(1 , 1 , 64 ), sycl::range<3 >(1 , 1 , 64 )),
276
276
[=](sycl::nd_item<3 > item_ct1) { dequantize_block_q6_K_reorder (vx, y, item_ct1, nb); });
277
277
}
0 commit comments