@@ -3310,12 +3310,12 @@ define <2 x i32> @smulo_v2i128(<2 x i128> %a0, <2 x i128> %a1, ptr %p2) nounwind
3310
3310
; SSE2-NEXT: movq %rdi, %r10
3311
3311
; SSE2-NEXT: movq {{[0-9]+}}(%rsp), %rsi
3312
3312
; SSE2-NEXT: movq {{[0-9]+}}(%rsp), %rbp
3313
- ; SSE2-NEXT: movq %r11, %rdi
3314
- ; SSE2-NEXT: sarq $63, %rdi
3313
+ ; SSE2-NEXT: movq %r11, %rdx
3314
+ ; SSE2-NEXT: sarq $63, %rdx
3315
3315
; SSE2-NEXT: movq %r9, %rbx
3316
- ; SSE2-NEXT: imulq %rdi , %rbx
3316
+ ; SSE2-NEXT: imulq %rdx , %rbx
3317
3317
; SSE2-NEXT: movq %r15, %rax
3318
- ; SSE2-NEXT: mulq %rdi
3318
+ ; SSE2-NEXT: mulq %rdx
3319
3319
; SSE2-NEXT: movq %rdx, %rdi
3320
3320
; SSE2-NEXT: movq %rax, %r12
3321
3321
; SSE2-NEXT: addq %rax, %rdi
@@ -3363,12 +3363,12 @@ define <2 x i32> @smulo_v2i128(<2 x i128> %a0, <2 x i128> %a1, ptr %p2) nounwind
3363
3363
; SSE2-NEXT: xorl %r15d, %r15d
3364
3364
; SSE2-NEXT: orq %rdx, %r10
3365
3365
; SSE2-NEXT: setne %r15b
3366
- ; SSE2-NEXT: movq %rcx, %r9
3367
- ; SSE2-NEXT: sarq $63, %r9
3366
+ ; SSE2-NEXT: movq %rcx, %rdx
3367
+ ; SSE2-NEXT: sarq $63, %rdx
3368
3368
; SSE2-NEXT: movq %rbp, %r11
3369
- ; SSE2-NEXT: imulq %r9 , %r11
3369
+ ; SSE2-NEXT: imulq %rdx , %r11
3370
3370
; SSE2-NEXT: movq %rsi, %rax
3371
- ; SSE2-NEXT: mulq %r9
3371
+ ; SSE2-NEXT: mulq %rdx
3372
3372
; SSE2-NEXT: movq %rdx, %r9
3373
3373
; SSE2-NEXT: movq %rax, %r10
3374
3374
; SSE2-NEXT: addq %rax, %r9
@@ -3444,12 +3444,12 @@ define <2 x i32> @smulo_v2i128(<2 x i128> %a0, <2 x i128> %a1, ptr %p2) nounwind
3444
3444
; SSSE3-NEXT: movq %rdi, %r10
3445
3445
; SSSE3-NEXT: movq {{[0-9]+}}(%rsp), %rsi
3446
3446
; SSSE3-NEXT: movq {{[0-9]+}}(%rsp), %rbp
3447
- ; SSSE3-NEXT: movq %r11, %rdi
3448
- ; SSSE3-NEXT: sarq $63, %rdi
3447
+ ; SSSE3-NEXT: movq %r11, %rdx
3448
+ ; SSSE3-NEXT: sarq $63, %rdx
3449
3449
; SSSE3-NEXT: movq %r9, %rbx
3450
- ; SSSE3-NEXT: imulq %rdi , %rbx
3450
+ ; SSSE3-NEXT: imulq %rdx , %rbx
3451
3451
; SSSE3-NEXT: movq %r15, %rax
3452
- ; SSSE3-NEXT: mulq %rdi
3452
+ ; SSSE3-NEXT: mulq %rdx
3453
3453
; SSSE3-NEXT: movq %rdx, %rdi
3454
3454
; SSSE3-NEXT: movq %rax, %r12
3455
3455
; SSSE3-NEXT: addq %rax, %rdi
@@ -3497,12 +3497,12 @@ define <2 x i32> @smulo_v2i128(<2 x i128> %a0, <2 x i128> %a1, ptr %p2) nounwind
3497
3497
; SSSE3-NEXT: xorl %r15d, %r15d
3498
3498
; SSSE3-NEXT: orq %rdx, %r10
3499
3499
; SSSE3-NEXT: setne %r15b
3500
- ; SSSE3-NEXT: movq %rcx, %r9
3501
- ; SSSE3-NEXT: sarq $63, %r9
3500
+ ; SSSE3-NEXT: movq %rcx, %rdx
3501
+ ; SSSE3-NEXT: sarq $63, %rdx
3502
3502
; SSSE3-NEXT: movq %rbp, %r11
3503
- ; SSSE3-NEXT: imulq %r9 , %r11
3503
+ ; SSSE3-NEXT: imulq %rdx , %r11
3504
3504
; SSSE3-NEXT: movq %rsi, %rax
3505
- ; SSSE3-NEXT: mulq %r9
3505
+ ; SSSE3-NEXT: mulq %rdx
3506
3506
; SSSE3-NEXT: movq %rdx, %r9
3507
3507
; SSSE3-NEXT: movq %rax, %r10
3508
3508
; SSSE3-NEXT: addq %rax, %r9
@@ -3578,12 +3578,12 @@ define <2 x i32> @smulo_v2i128(<2 x i128> %a0, <2 x i128> %a1, ptr %p2) nounwind
3578
3578
; SSE41-NEXT: movq %rdi, %r10
3579
3579
; SSE41-NEXT: movq {{[0-9]+}}(%rsp), %rsi
3580
3580
; SSE41-NEXT: movq {{[0-9]+}}(%rsp), %rbp
3581
- ; SSE41-NEXT: movq %r11, %rdi
3582
- ; SSE41-NEXT: sarq $63, %rdi
3581
+ ; SSE41-NEXT: movq %r11, %rdx
3582
+ ; SSE41-NEXT: sarq $63, %rdx
3583
3583
; SSE41-NEXT: movq %r9, %rbx
3584
- ; SSE41-NEXT: imulq %rdi , %rbx
3584
+ ; SSE41-NEXT: imulq %rdx , %rbx
3585
3585
; SSE41-NEXT: movq %r15, %rax
3586
- ; SSE41-NEXT: mulq %rdi
3586
+ ; SSE41-NEXT: mulq %rdx
3587
3587
; SSE41-NEXT: movq %rdx, %rdi
3588
3588
; SSE41-NEXT: movq %rax, %r12
3589
3589
; SSE41-NEXT: addq %rax, %rdi
@@ -3631,12 +3631,12 @@ define <2 x i32> @smulo_v2i128(<2 x i128> %a0, <2 x i128> %a1, ptr %p2) nounwind
3631
3631
; SSE41-NEXT: xorl %r15d, %r15d
3632
3632
; SSE41-NEXT: orq %rdx, %r10
3633
3633
; SSE41-NEXT: setne %r15b
3634
- ; SSE41-NEXT: movq %rcx, %r9
3635
- ; SSE41-NEXT: sarq $63, %r9
3634
+ ; SSE41-NEXT: movq %rcx, %rdx
3635
+ ; SSE41-NEXT: sarq $63, %rdx
3636
3636
; SSE41-NEXT: movq %rbp, %r11
3637
- ; SSE41-NEXT: imulq %r9 , %r11
3637
+ ; SSE41-NEXT: imulq %rdx , %r11
3638
3638
; SSE41-NEXT: movq %rsi, %rax
3639
- ; SSE41-NEXT: mulq %r9
3639
+ ; SSE41-NEXT: mulq %rdx
3640
3640
; SSE41-NEXT: movq %rdx, %r9
3641
3641
; SSE41-NEXT: movq %rax, %r10
3642
3642
; SSE41-NEXT: addq %rax, %r9
@@ -3711,12 +3711,12 @@ define <2 x i32> @smulo_v2i128(<2 x i128> %a0, <2 x i128> %a1, ptr %p2) nounwind
3711
3711
; AVX-NEXT: movq %rdi, %r10
3712
3712
; AVX-NEXT: movq {{[0-9]+}}(%rsp), %rsi
3713
3713
; AVX-NEXT: movq {{[0-9]+}}(%rsp), %rbp
3714
- ; AVX-NEXT: movq %r11, %rdi
3715
- ; AVX-NEXT: sarq $63, %rdi
3714
+ ; AVX-NEXT: movq %r11, %rdx
3715
+ ; AVX-NEXT: sarq $63, %rdx
3716
3716
; AVX-NEXT: movq %r9, %rbx
3717
- ; AVX-NEXT: imulq %rdi , %rbx
3717
+ ; AVX-NEXT: imulq %rdx , %rbx
3718
3718
; AVX-NEXT: movq %r15, %rax
3719
- ; AVX-NEXT: mulq %rdi
3719
+ ; AVX-NEXT: mulq %rdx
3720
3720
; AVX-NEXT: movq %rdx, %rdi
3721
3721
; AVX-NEXT: movq %rax, %r12
3722
3722
; AVX-NEXT: addq %rax, %rdi
@@ -3764,12 +3764,12 @@ define <2 x i32> @smulo_v2i128(<2 x i128> %a0, <2 x i128> %a1, ptr %p2) nounwind
3764
3764
; AVX-NEXT: xorl %r15d, %r15d
3765
3765
; AVX-NEXT: orq %rdx, %r10
3766
3766
; AVX-NEXT: setne %r15b
3767
- ; AVX-NEXT: movq %rcx, %r9
3768
- ; AVX-NEXT: sarq $63, %r9
3767
+ ; AVX-NEXT: movq %rcx, %rdx
3768
+ ; AVX-NEXT: sarq $63, %rdx
3769
3769
; AVX-NEXT: movq %rbp, %r11
3770
- ; AVX-NEXT: imulq %r9 , %r11
3770
+ ; AVX-NEXT: imulq %rdx , %r11
3771
3771
; AVX-NEXT: movq %rsi, %rax
3772
- ; AVX-NEXT: mulq %r9
3772
+ ; AVX-NEXT: mulq %rdx
3773
3773
; AVX-NEXT: movq %rdx, %r9
3774
3774
; AVX-NEXT: movq %rax, %r10
3775
3775
; AVX-NEXT: addq %rax, %r9
@@ -3896,16 +3896,16 @@ define <2 x i32> @smulo_v2i128(<2 x i128> %a0, <2 x i128> %a1, ptr %p2) nounwind
3896
3896
; AVX512F-NEXT: orq %rdx, %r10
3897
3897
; AVX512F-NEXT: setne %al
3898
3898
; AVX512F-NEXT: kmovw %eax, %k0
3899
- ; AVX512F-NEXT: movq %r9, %rsi
3900
- ; AVX512F-NEXT: sarq $63, %rsi
3901
- ; AVX512F-NEXT: movq %rbp, %rbx
3902
- ; AVX512F-NEXT: imulq %rsi , %rbx
3899
+ ; AVX512F-NEXT: movq %r9, %rdx
3900
+ ; AVX512F-NEXT: sarq $63, %rdx
3901
+ ; AVX512F-NEXT: movq %rbp, %rsi
3902
+ ; AVX512F-NEXT: imulq %rdx , %rsi
3903
3903
; AVX512F-NEXT: movq %r8, %rax
3904
- ; AVX512F-NEXT: mulq %rsi
3904
+ ; AVX512F-NEXT: mulq %rdx
3905
3905
; AVX512F-NEXT: movq %rdx, %r10
3906
3906
; AVX512F-NEXT: movq %rax, %r11
3907
3907
; AVX512F-NEXT: addq %rax, %r10
3908
- ; AVX512F-NEXT: addq %rbx , %r10
3908
+ ; AVX512F-NEXT: addq %rsi , %r10
3909
3909
; AVX512F-NEXT: movq %rbp, %rax
3910
3910
; AVX512F-NEXT: sarq $63, %rax
3911
3911
; AVX512F-NEXT: movq %rax, %rsi
@@ -4029,16 +4029,16 @@ define <2 x i32> @smulo_v2i128(<2 x i128> %a0, <2 x i128> %a1, ptr %p2) nounwind
4029
4029
; AVX512BW-NEXT: orq %rdx, %r10
4030
4030
; AVX512BW-NEXT: setne %al
4031
4031
; AVX512BW-NEXT: kmovd %eax, %k0
4032
- ; AVX512BW-NEXT: movq %r9, %rsi
4033
- ; AVX512BW-NEXT: sarq $63, %rsi
4034
- ; AVX512BW-NEXT: movq %rbp, %rbx
4035
- ; AVX512BW-NEXT: imulq %rsi , %rbx
4032
+ ; AVX512BW-NEXT: movq %r9, %rdx
4033
+ ; AVX512BW-NEXT: sarq $63, %rdx
4034
+ ; AVX512BW-NEXT: movq %rbp, %rsi
4035
+ ; AVX512BW-NEXT: imulq %rdx , %rsi
4036
4036
; AVX512BW-NEXT: movq %r8, %rax
4037
- ; AVX512BW-NEXT: mulq %rsi
4037
+ ; AVX512BW-NEXT: mulq %rdx
4038
4038
; AVX512BW-NEXT: movq %rdx, %r10
4039
4039
; AVX512BW-NEXT: movq %rax, %r11
4040
4040
; AVX512BW-NEXT: addq %rax, %r10
4041
- ; AVX512BW-NEXT: addq %rbx , %r10
4041
+ ; AVX512BW-NEXT: addq %rsi , %r10
4042
4042
; AVX512BW-NEXT: movq %rbp, %rax
4043
4043
; AVX512BW-NEXT: sarq $63, %rax
4044
4044
; AVX512BW-NEXT: movq %rax, %rsi
0 commit comments