@@ -171,9 +171,9 @@ static void dequantize_row_q4_K_sycl(const void *vx, dst_t *y, const int64_t k,
171
171
dpct::has_capability_or_fail (stream->get_device (),
172
172
{sycl::aspect::fp16});
173
173
174
- stream-> submit ([&](sycl::handler &cgh) {
174
+ syclex:: submit (*stream, [&](sycl::handler &cgh) {
175
175
sycl::local_accessor<uint8_t , 1 > scale_local_acc (sycl::range<1 >(12 ), cgh);
176
- cgh. parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
176
+ syclex::nd_launch (cgh, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
177
177
sycl::range<3 >(1 , 1 , 32 ),
178
178
sycl::range<3 >(1 , 1 , 32 )),
179
179
[=](sycl::nd_item<3 > item_ct1) {
@@ -191,10 +191,10 @@ static void dequantize_row_q4_K_sycl_reorder(const void * vx, dst_t * y, const i
191
191
192
192
dpct::has_capability_or_fail (stream->get_device (), { sycl::aspect::fp16 });
193
193
194
- stream-> submit ([&](sycl::handler & cgh) {
194
+ syclex:: submit (*stream, [&](sycl::handler & cgh) {
195
195
sycl::local_accessor<uint8_t , 1 > scale_local_acc (sycl::range<1 >(12 ), cgh);
196
196
197
- cgh. parallel_for ( sycl::nd_range<1 >(sycl::range<1 >(global_size), sycl::range<1 >(local_size)),
197
+ syclex::nd_launch (cgh, sycl::nd_range<1 >(sycl::range<1 >(global_size), sycl::range<1 >(local_size)),
198
198
[=](sycl::nd_item<1 > item_ct1) {
199
199
dequantize_block_q4_K_reorder (vx, y, get_pointer (scale_local_acc), item_ct1, nb);
200
200
});
@@ -284,8 +284,8 @@ static void dequantize_row_iq1_s_sycl(const void *vx, dst_t *y, const int64_t k,
284
284
dpct::has_capability_or_fail (stream->get_device (),
285
285
{sycl::aspect::fp16});
286
286
287
- stream-> submit ([&](sycl::handler &cgh) {
288
- cgh. parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
287
+ syclex:: submit (*stream, [&](sycl::handler &cgh) {
288
+ syclex::nd_launch (cgh, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
289
289
sycl::range<3 >(1 , 1 , 32 ),
290
290
sycl::range<3 >(1 , 1 , 32 )),
291
291
[=](sycl::nd_item<3 > item_ct1) {
@@ -305,8 +305,8 @@ static void dequantize_row_iq1_m_sycl(const void *vx, dst_t *y, const int64_t k,
305
305
dpct::has_capability_or_fail (stream->get_device (),
306
306
{sycl::aspect::fp16});
307
307
308
- stream-> submit ([&](sycl::handler &cgh) {
309
- cgh. parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
308
+ syclex:: submit (*stream, [&](sycl::handler &cgh) {
309
+ syclex::nd_launch (cgh, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
310
310
sycl::range<3 >(1 , 1 , 32 ),
311
311
sycl::range<3 >(1 , 1 , 32 )),
312
312
[=](sycl::nd_item<3 > item_ct1) {
@@ -326,8 +326,8 @@ static void dequantize_row_iq2_xxs_sycl(const void *vx, dst_t *y, const int64_t
326
326
dpct::has_capability_or_fail (stream->get_device (),
327
327
{sycl::aspect::fp16});
328
328
329
- stream-> submit ([&](sycl::handler &cgh) {
330
- cgh. parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
329
+ syclex:: submit (*stream, [&](sycl::handler &cgh) {
330
+ syclex::nd_launch (cgh, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
331
331
sycl::range<3 >(1 , 1 , 32 ),
332
332
sycl::range<3 >(1 , 1 , 32 )),
333
333
[=](sycl::nd_item<3 > item_ct1) {
@@ -347,8 +347,8 @@ static void dequantize_row_iq2_xs_sycl(const void *vx, dst_t *y, const int64_t k
347
347
dpct::has_capability_or_fail (stream->get_device (),
348
348
{sycl::aspect::fp16});
349
349
350
- stream-> submit ([&](sycl::handler &cgh) {
351
- cgh. parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
350
+ syclex:: submit (*stream, [&](sycl::handler &cgh) {
351
+ syclex::nd_launch (cgh, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
352
352
sycl::range<3 >(1 , 1 , 32 ),
353
353
sycl::range<3 >(1 , 1 , 32 )),
354
354
[=](sycl::nd_item<3 > item_ct1) {
@@ -368,8 +368,8 @@ static void dequantize_row_iq2_s_sycl(const void *vx, dst_t *y, const int64_t k,
368
368
dpct::has_capability_or_fail (stream->get_device (),
369
369
{sycl::aspect::fp16});
370
370
371
- stream-> submit ([&](sycl::handler &cgh) {
372
- cgh. parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
371
+ syclex:: submit (*stream, [&](sycl::handler &cgh) {
372
+ syclex::nd_launch (cgh, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
373
373
sycl::range<3 >(1 , 1 , 32 ),
374
374
sycl::range<3 >(1 , 1 , 32 )),
375
375
[=](sycl::nd_item<3 > item_ct1) {
@@ -388,8 +388,8 @@ static void dequantize_row_iq3_xxs_sycl(const void *vx, dst_t *y, const int64_t
388
388
dpct::has_capability_or_fail (stream->get_device (),
389
389
{sycl::aspect::fp16});
390
390
391
- stream-> submit ([&](sycl::handler &cgh) {
392
- cgh. parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
391
+ syclex:: submit (*stream, [&](sycl::handler &cgh) {
392
+ syclex::nd_launch (cgh, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
393
393
sycl::range<3 >(1 , 1 , 32 ),
394
394
sycl::range<3 >(1 , 1 , 32 )),
395
395
[=](sycl::nd_item<3 > item_ct1) {
@@ -409,8 +409,8 @@ static void dequantize_row_iq3_s_sycl(const void *vx, dst_t *y, const int64_t k,
409
409
dpct::has_capability_or_fail (stream->get_device (),
410
410
{sycl::aspect::fp16});
411
411
412
- stream-> submit ([&](sycl::handler &cgh) {
413
- cgh. parallel_for ( sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
412
+ syclex:: submit (*stream, [&](sycl::handler &cgh) {
413
+ syclex::nd_launch (cgh, sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
414
414
sycl::range<3 >(1 , 1 , 32 ),
415
415
sycl::range<3 >(1 , 1 , 32 )),
416
416
[=](sycl::nd_item<3 > item_ct1) {
@@ -432,8 +432,8 @@ static void dequantize_row_iq4_xs_sycl(const void *vx, dst_t *y, const int64_t k
432
432
dpct::has_capability_or_fail (stream->get_device (),
433
433
{sycl::aspect::fp16});
434
434
435
- stream-> submit ([&](sycl::handler &cgh) {
436
- cgh. parallel_for (
435
+ syclex:: submit (*stream, [&](sycl::handler &cgh) {
436
+ syclex::nd_launch (cgh,
437
437
sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
438
438
sycl::range<3 >(1 , 1 , 32 ),
439
439
sycl::range<3 >(1 , 1 , 32 )),
@@ -453,8 +453,8 @@ static void dequantize_row_iq4_nl_sycl(const void *vx, dst_t *y, const int64_t k
453
453
dpct::has_capability_or_fail (stream->get_device (),
454
454
{sycl::aspect::fp16});
455
455
456
- stream-> submit ([&](sycl::handler &cgh) {
457
- cgh. parallel_for (
456
+ syclex:: submit (*stream, [&](sycl::handler &cgh) {
457
+ syclex::nd_launch (cgh,
458
458
sycl::nd_range<3 >(sycl::range<3 >(1 , 1 , nb) *
459
459
sycl::range<3 >(1 , 1 , 32 ),
460
460
sycl::range<3 >(1 , 1 , 32 )),
0 commit comments