@@ -864,15 +864,15 @@ LL(22):
864
864
LFD f22, 10 * SIZE(BO)
865
865
LFD f23, 11 * SIZE(BO)
866
866
867
- FMADD f2 , f18, f24, f2
868
- FMADD f3 , f19, f24, f3
869
- FMADD f6 , f18, f25, f6
870
- FMADD f7 , f19, f25, f7
867
+ FMADD f0 , f18, f24, f0
868
+ FMADD f1 , f19, f24, f1
869
+ FMADD f4 , f18, f25, f4
870
+ FMADD f5 , f19, f25, f5
871
871
872
- FMADD f10 , f18, f26, f10
873
- FMADD f11 , f19, f26, f11
874
- FMADD f14 , f18, f27, f14
875
- FMADD f15 , f19, f27, f15
872
+ FMADD f8 , f18, f26, f8
873
+ FMADD f9 , f19, f26, f9
874
+ FMADD f12 , f18, f27, f12
875
+ FMADD f13 , f19, f27, f13
876
876
877
877
LFD f16, 4 * SIZE(AO)
878
878
LFD f17, 5 * SIZE(AO)
@@ -899,15 +899,15 @@ LL(22):
899
899
LFD f22, 18 * SIZE(BO)
900
900
LFD f23, 19 * SIZE(BO)
901
901
902
- FMADD f2 , f18, f24, f2
903
- FMADD f3 , f19, f24, f3
904
- FMADD f6 , f18, f25, f6
905
- FMADD f7 , f19, f25, f7
902
+ FMADD f0 , f18, f24, f0
903
+ FMADD f1 , f19, f24, f1
904
+ FMADD f4 , f18, f25, f4
905
+ FMADD f5 , f19, f25, f5
906
906
907
- FMADD f10 , f18, f26, f10
908
- FMADD f11 , f19, f26, f11
909
- FMADD f14 , f18, f27, f14
910
- FMADD f15 , f19, f27, f15
907
+ FMADD f8 , f18, f26, f8
908
+ FMADD f9 , f19, f26, f9
909
+ FMADD f12 , f18, f27, f12
910
+ FMADD f13 , f19, f27, f13
911
911
912
912
LFD f16, 8 * SIZE(AO)
913
913
LFD f17, 9 * SIZE(AO)
@@ -923,14 +923,6 @@ LL(22):
923
923
addi BO, BO, 16 * SIZE
924
924
bdnz LL(22 )
925
925
926
- fadd f0, f2, f0
927
- fadd f1, f3, f1
928
- fadd f4, f6, f4
929
- fadd f5, f7, f5
930
- fadd f8, f10, f8
931
- fadd f9, f11, f9
932
- fadd f12, f14, f12
933
- fadd f13, f15, f13
934
926
.align 4
935
927
936
928
LL(25 ):
@@ -1161,10 +1153,10 @@ LL(32):
1161
1153
LFD f22, 10 * SIZE(BO)
1162
1154
LFD f23, 11 * SIZE(BO)
1163
1155
1164
- FMADD f1 , f17, f24, f1
1165
- FMADD f5 , f17, f25, f5
1166
- FMADD f9 , f17, f26, f9
1167
- FMADD f13 , f17, f27, f13
1156
+ FMADD f0 , f17, f24, f0
1157
+ FMADD f4 , f17, f25, f4
1158
+ FMADD f8 , f17, f26, f8
1159
+ FMADD f12 , f17, f27, f12
1168
1160
1169
1161
LFD f24, 12 * SIZE(BO)
1170
1162
LFD f25, 13 * SIZE(BO)
@@ -1181,10 +1173,10 @@ LL(32):
1181
1173
LFD f22, 18 * SIZE(BO)
1182
1174
LFD f23, 19 * SIZE(BO)
1183
1175
1184
- FMADD f1 , f19, f24, f1
1185
- FMADD f5 , f19, f25, f5
1186
- FMADD f9 , f19, f26, f9
1187
- FMADD f13 , f19, f27, f13
1176
+ FMADD f0 , f19, f24, f0
1177
+ FMADD f4 , f19, f25, f4
1178
+ FMADD f8 , f19, f26, f8
1179
+ FMADD f12 , f19, f27, f12
1188
1180
1189
1181
LFD f16, 4 * SIZE(AO)
1190
1182
LFD f17, 5 * SIZE(AO)
@@ -1200,10 +1192,6 @@ LL(32):
1200
1192
addi BO, BO, 16 * SIZE
1201
1193
bdnz LL(32 )
1202
1194
1203
- fadd f0, f1, f0
1204
- fadd f4, f5, f4
1205
- fadd f8, f9, f8
1206
- fadd f12, f13, f12
1207
1195
.align 4
1208
1196
1209
1197
LL(35 ):
@@ -1691,10 +1679,10 @@ LL(52):
1691
1679
FMADD f2, f16, f21, f2
1692
1680
FMADD f3, f17, f21, f3
1693
1681
1694
- FMADD f4 , f18, f22, f4
1695
- FMADD f5 , f19, f22, f5
1696
- FMADD f6 , f18, f23, f6
1697
- FMADD f7 , f19, f23, f7
1682
+ FMADD f0 , f18, f22, f0
1683
+ FMADD f1 , f19, f22, f1
1684
+ FMADD f2 , f18, f23, f2
1685
+ FMADD f3 , f19, f23, f3
1698
1686
1699
1687
LFD f16, 4 * SIZE(AO)
1700
1688
LFD f17, 5 * SIZE(AO)
@@ -1711,10 +1699,10 @@ LL(52):
1711
1699
FMADD f2, f16, f25, f2
1712
1700
FMADD f3, f17, f25, f3
1713
1701
1714
- FMADD f4 , f18, f26, f4
1715
- FMADD f5 , f19, f26, f5
1716
- FMADD f6 , f18, f27, f6
1717
- FMADD f7 , f19, f27, f7
1702
+ FMADD f0 , f18, f26, f0
1703
+ FMADD f1 , f19, f26, f1
1704
+ FMADD f2 , f18, f27, f2
1705
+ FMADD f3 , f19, f27, f3
1718
1706
1719
1707
LFD f16, 8 * SIZE(AO)
1720
1708
LFD f17, 9 * SIZE(AO)
@@ -1775,21 +1763,11 @@ LL(58):
1775
1763
LFD f18, 0 * SIZE(CO2)
1776
1764
LFD f19, 1 * SIZE(CO2)
1777
1765
1778
- FADD f0, f4, f0
1779
- FADD f1, f5, f1
1780
- FADD f2, f6, f2
1781
- FADD f3, f7, f3
1782
-
1783
1766
FMADD f0, f0, f30, f16
1784
1767
FMADD f1, f1, f30, f17
1785
1768
FMADD f2, f2, f30, f18
1786
1769
FMADD f3, f3, f30, f19
1787
1770
#else
1788
- FADD f0, f4, f0
1789
- FADD f1, f5, f1
1790
- FADD f2, f6, f2
1791
- FADD f3, f7, f3
1792
-
1793
1771
FMUL f0, f0, f30
1794
1772
FMUL f1, f1, f30
1795
1773
FMUL f2, f2, f30
@@ -1916,8 +1894,8 @@ LL(60):
1916
1894
LL(62 ):
1917
1895
FMADD f0, f16, f20, f0
1918
1896
FMADD f1, f16, f21, f1
1919
- FMADD f2 , f17, f22, f2
1920
- FMADD f3 , f17, f23, f3
1897
+ FMADD f0 , f17, f22, f0
1898
+ FMADD f1 , f17, f23, f1
1921
1899
1922
1900
LFD f20, 8 * SIZE(BO)
1923
1901
LFD f21, 9 * SIZE(BO)
@@ -1926,8 +1904,8 @@ LL(62):
1926
1904
1927
1905
FMADD f0, f18, f24, f0
1928
1906
FMADD f1, f18, f25, f1
1929
- FMADD f2 , f19, f26, f2
1930
- FMADD f3 , f19, f27, f3
1907
+ FMADD f0 , f19, f26, f0
1908
+ FMADD f1 , f19, f27, f1
1931
1909
1932
1910
LFD f16, 4 * SIZE(AO)
1933
1911
LFD f17, 5 * SIZE(AO)
@@ -1986,15 +1964,9 @@ LL(68):
1986
1964
LFD f16, 0 * SIZE(CO1)
1987
1965
LFD f18, 0 * SIZE(CO2)
1988
1966
1989
- FADD f0, f2, f0
1990
- FADD f1, f3, f1
1991
-
1992
1967
FMADD f0, f0, f30, f16
1993
1968
FMADD f1, f1, f30, f18
1994
1969
#else
1995
- FADD f0, f2, f0
1996
- FADD f1, f3, f1
1997
-
1998
1970
FMUL f0, f0, f30
1999
1971
FMUL f1, f1, f30
2000
1972
#endif
@@ -2007,7 +1979,6 @@ LL(68):
2007
1979
fmr f4, f0
2008
1980
fmr f5, f0
2009
1981
2010
-
2011
1982
#ifdef TRMMKERNEL
2012
1983
#if ( defined(LEFT) && defined(TRANSA)) || \
2013
1984
(!defined(LEFT) && !defined(TRANSA))
@@ -2332,8 +2303,8 @@ LL(80):
2332
2303
LL(82 ):
2333
2304
FMADD f0, f16, f20, f0
2334
2305
FMADD f1, f17, f20, f1
2335
- FMADD f2 , f18, f21, f2
2336
- FMADD f3 , f19, f21, f3
2306
+ FMADD f0 , f18, f21, f0
2307
+ FMADD f1 , f19, f21, f1
2337
2308
2338
2309
LFD f16, 4 * SIZE(AO)
2339
2310
LFD f17, 5 * SIZE(AO)
@@ -2342,8 +2313,8 @@ LL(82):
2342
2313
2343
2314
FMADD f0, f16, f22, f0
2344
2315
FMADD f1, f17, f22, f1
2345
- FMADD f2 , f18, f23, f2
2346
- FMADD f3 , f19, f23, f3
2316
+ FMADD f0 , f18, f23, f0
2317
+ FMADD f1 , f19, f23, f1
2347
2318
2348
2319
LFD f16, 8 * SIZE(AO)
2349
2320
LFD f17, 9 * SIZE(AO)
@@ -2401,15 +2372,9 @@ LL(88):
2401
2372
LFD f16, 0 * SIZE(CO1)
2402
2373
LFD f17, 1 * SIZE(CO1)
2403
2374
2404
- FADD f0, f2, f0
2405
- FADD f1, f3, f1
2406
-
2407
2375
FMADD f0, f0, f30, f16
2408
2376
FMADD f1, f1, f30, f17
2409
2377
#else
2410
- FADD f0, f2, f0
2411
- FADD f1, f3, f1
2412
-
2413
2378
FMUL f0, f0, f30
2414
2379
FMUL f1, f1, f30
2415
2380
#endif
@@ -2418,9 +2383,6 @@ LL(88):
2418
2383
STFD f1, 1 * SIZE(CO1)
2419
2384
2420
2385
lfs f0, FZERO
2421
- fmr f1, f0
2422
- fmr f2, f0
2423
- fmr f3, f0
2424
2386
2425
2387
addi CO1, CO1, 2 * SIZE
2426
2388
@@ -2512,9 +2474,9 @@ LL(90):
2512
2474
2513
2475
LL(92 ):
2514
2476
FMADD f0, f16, f20, f0
2515
- FMADD f1 , f17, f21, f1
2516
- FMADD f2 , f18, f22, f2
2517
- FMADD f3 , f19, f23, f3
2477
+ FMADD f0 , f17, f21, f0
2478
+ FMADD f0 , f18, f22, f0
2479
+ FMADD f0 , f19, f23, f0
2518
2480
2519
2481
LFD f16, 4 * SIZE(AO)
2520
2482
LFD f17, 5 * SIZE(AO)
@@ -2527,9 +2489,9 @@ LL(92):
2527
2489
LFD f23, 7 * SIZE(BO)
2528
2490
2529
2491
FMADD f0, f16, f20, f0
2530
- FMADD f1 , f17, f21, f1
2531
- FMADD f2 , f18, f22, f2
2532
- FMADD f3 , f19, f23, f3
2492
+ FMADD f0 , f17, f21, f0
2493
+ FMADD f0 , f18, f22, f0
2494
+ FMADD f0 , f19, f23, f0
2533
2495
2534
2496
LFD f16, 8 * SIZE(AO)
2535
2497
LFD f17, 9 * SIZE(AO)
@@ -2583,16 +2545,8 @@ LL(98):
2583
2545
#ifndef TRMMKERNEL
2584
2546
LFD f16, 0 * SIZE(CO1)
2585
2547
2586
- FADD f0, f1, f0
2587
- FADD f2, f3, f2
2588
- FADD f0, f2, f0
2589
-
2590
2548
FMADD f0, f0, f30, f16
2591
2549
#else
2592
- FADD f0, f1, f0
2593
- FADD f2, f3, f2
2594
- FADD f0, f2, f0
2595
-
2596
2550
FMUL f0, f0, f30
2597
2551
#endif
2598
2552
0 commit comments