@@ -44,12 +44,12 @@ SBLAS3OBJS = \
44
44
sgemm.$(SUFFIX ) ssymm.$(SUFFIX ) strmm.$(SUFFIX ) \
45
45
strsm.$(SUFFIX ) ssyrk.$(SUFFIX ) ssyr2k.$(SUFFIX ) \
46
46
somatcopy.$(SUFFIX ) simatcopy.$(SUFFIX ) \
47
- sgeadd.$(SUFFIX ) sgemmt.$(SUFFIX )
47
+ sgeadd.$(SUFFIX ) sgemmt.$(SUFFIX ) sgemmtr. $( SUFFIX )
48
48
49
49
ifeq ($(BUILD_BFLOAT16 ) ,1)
50
50
SBBLAS1OBJS = sbdot.$(SUFFIX )
51
51
SBBLAS2OBJS = sbgemv.$(SUFFIX )
52
- SBBLAS3OBJS = sbgemm.$(SUFFIX ) sbgemmt.$(SUFFIX )
52
+ SBBLAS3OBJS = sbgemm.$(SUFFIX ) sbgemmt.$(SUFFIX ) sbgemmtr. $( SUFFIX )
53
53
SBEXTOBJS = sbstobf16.$(SUFFIX ) sbdtobf16.$(SUFFIX ) sbf16tos.$(SUFFIX ) dbf16tod.$(SUFFIX )
54
54
endif
55
55
@@ -76,7 +76,7 @@ DBLAS3OBJS = \
76
76
dgemm.$(SUFFIX ) dsymm.$(SUFFIX ) dtrmm.$(SUFFIX ) \
77
77
dtrsm.$(SUFFIX ) dsyrk.$(SUFFIX ) dsyr2k.$(SUFFIX ) \
78
78
domatcopy.$(SUFFIX ) dimatcopy.$(SUFFIX ) \
79
- dgeadd.$(SUFFIX ) dgemmt.$(SUFFIX )
79
+ dgeadd.$(SUFFIX ) dgemmt.$(SUFFIX ) dgemmtr. $( SUFFIX )
80
80
81
81
CBLAS1OBJS = \
82
82
caxpy.$(SUFFIX ) caxpyc.$(SUFFIX ) cswap.$(SUFFIX ) \
@@ -105,7 +105,7 @@ CBLAS3OBJS = \
105
105
ctrsm.$(SUFFIX ) csyrk.$(SUFFIX ) csyr2k.$(SUFFIX ) \
106
106
chemm.$(SUFFIX ) cherk.$(SUFFIX ) cher2k.$(SUFFIX ) \
107
107
comatcopy.$(SUFFIX ) cimatcopy.$(SUFFIX ) \
108
- cgeadd.$(SUFFIX ) cgemmt.$(SUFFIX )
108
+ cgeadd.$(SUFFIX ) cgemmt.$(SUFFIX ) cgemmtr. $( SUFFIX )
109
109
110
110
ZBLAS1OBJS = \
111
111
zaxpy.$(SUFFIX ) zaxpyc.$(SUFFIX ) zswap.$(SUFFIX ) \
@@ -134,7 +134,7 @@ ZBLAS3OBJS = \
134
134
ztrsm.$(SUFFIX ) zsyrk.$(SUFFIX ) zsyr2k.$(SUFFIX ) \
135
135
zhemm.$(SUFFIX ) zherk.$(SUFFIX ) zher2k.$(SUFFIX ) \
136
136
zomatcopy.$(SUFFIX ) zimatcopy.$(SUFFIX ) \
137
- zgeadd.$(SUFFIX ) zgemmt.$(SUFFIX )
137
+ zgeadd.$(SUFFIX ) zgemmt.$(SUFFIX ) zgemmtr. $( SUFFIX )
138
138
139
139
ifeq ($(SUPPORT_GEMM3M ) , 1)
140
140
@@ -282,12 +282,12 @@ CSBLAS2OBJS = \
282
282
CSBLAS3OBJS = \
283
283
cblas_sgemm.$(SUFFIX ) cblas_ssymm.$(SUFFIX ) cblas_strmm.$(SUFFIX ) cblas_strsm.$(SUFFIX ) \
284
284
cblas_ssyrk.$(SUFFIX ) cblas_ssyr2k.$(SUFFIX ) cblas_somatcopy.$(SUFFIX ) cblas_simatcopy.$(SUFFIX ) \
285
- cblas_sgeadd.$(SUFFIX ) cblas_sgemmt.$(SUFFIX ) cblas_sgemm_batch.$(SUFFIX )
285
+ cblas_sgeadd.$(SUFFIX ) cblas_sgemmt.$(SUFFIX ) cblas_sgemmtr. $( SUFFIX ) cblas_sgemm_batch.$(SUFFIX )
286
286
287
287
ifeq ($(BUILD_BFLOAT16 ) ,1)
288
288
CSBBLAS1OBJS = cblas_sbdot.$(SUFFIX )
289
289
CSBBLAS2OBJS = cblas_sbgemv.$(SUFFIX )
290
- CSBBLAS3OBJS = cblas_sbgemm.$(SUFFIX ) cblas_sbgemmt.$(SUFFIX ) cblas_sbgemm_batch.$(SUFFIX )
290
+ CSBBLAS3OBJS = cblas_sbgemm.$(SUFFIX ) cblas_sbgemmt.$(SUFFIX ) cblas_sbgemmtr. $( SUFFIX ) cblas_sbgemm_batch.$(SUFFIX )
291
291
CSBEXTOBJS = cblas_sbstobf16.$(SUFFIX ) cblas_sbdtobf16.$(SUFFIX ) cblas_sbf16tos.$(SUFFIX ) cblas_dbf16tod.$(SUFFIX )
292
292
endif
293
293
@@ -308,7 +308,7 @@ CDBLAS2OBJS = \
308
308
CDBLAS3OBJS += \
309
309
cblas_dgemm.$(SUFFIX ) cblas_dsymm.$(SUFFIX ) cblas_dtrmm.$(SUFFIX ) cblas_dtrsm.$(SUFFIX ) \
310
310
cblas_dsyrk.$(SUFFIX ) cblas_dsyr2k.$(SUFFIX ) cblas_domatcopy.$(SUFFIX ) cblas_dimatcopy.$(SUFFIX ) \
311
- cblas_dgeadd.$(SUFFIX ) cblas_dgemmt.$(SUFFIX ) cblas_dgemm_batch.$(SUFFIX )
311
+ cblas_dgeadd.$(SUFFIX ) cblas_dgemmt.$(SUFFIX ) cblas_dgemmtr. $( SUFFIX ) cblas_dgemm_batch.$(SUFFIX )
312
312
313
313
CCBLAS1OBJS = \
314
314
cblas_icamax.$(SUFFIX ) cblas_icamin.$(SUFFIX ) cblas_scasum.$(SUFFIX ) cblas_caxpy.$(SUFFIX ) \
@@ -333,7 +333,7 @@ CCBLAS3OBJS = \
333
333
cblas_csyrk.$(SUFFIX ) cblas_csyr2k.$(SUFFIX ) \
334
334
cblas_chemm.$(SUFFIX ) cblas_cherk.$(SUFFIX ) cblas_cher2k.$(SUFFIX ) \
335
335
cblas_comatcopy.$(SUFFIX ) cblas_cimatcopy.$(SUFFIX ) \
336
- cblas_cgeadd.$(SUFFIX ) cblas_cgemmt.$(SUFFIX ) cblas_cgemm_batch.$(SUFFIX )
336
+ cblas_cgeadd.$(SUFFIX ) cblas_cgemmt.$(SUFFIX ) cblas_cgemmtr. $( SUFFIX ) cblas_cgemm_batch.$(SUFFIX )
337
337
338
338
CXERBLAOBJ = \
339
339
cblas_xerbla.$(SUFFIX )
@@ -364,7 +364,7 @@ CZBLAS3OBJS = \
364
364
cblas_zsyrk.$(SUFFIX ) cblas_zsyr2k.$(SUFFIX ) \
365
365
cblas_zhemm.$(SUFFIX ) cblas_zherk.$(SUFFIX ) cblas_zher2k.$(SUFFIX ) \
366
366
cblas_zomatcopy.$(SUFFIX ) cblas_zimatcopy.$(SUFFIX ) \
367
- cblas_zgeadd.$(SUFFIX ) cblas_zgemmt.$(SUFFIX ) cblas_zgemm_batch.$(SUFFIX )
367
+ cblas_zgeadd.$(SUFFIX ) cblas_zgemmt.$(SUFFIX ) cblas_zgemmtr. $( SUFFIX ) cblas_zgemm_batch.$(SUFFIX )
368
368
369
369
370
370
ifeq ($(SUPPORT_GEMM3M ) , 1)
@@ -1305,6 +1305,8 @@ sbgemm.$(SUFFIX) sbgemm.$(PSUFFIX) : gemm.c ../param.h
1305
1305
$(CC ) -c $(CFLAGS ) $< -o $(@F )
1306
1306
sbgemmt.$(SUFFIX ) sbgemmt.$(PSUFFIX ) : sbgemmt.c ../param.h
1307
1307
$(CC ) -c $(CFLAGS ) $< -o $(@F )
1308
+ sbgemmtr.$(SUFFIX ) sbgemmtr.$(PSUFFIX ) : sbgemmt.c ../param.h
1309
+ $(CC ) -c $(CFLAGS ) $< -o $(@F )
1308
1310
endif
1309
1311
1310
1312
sgemm.$(SUFFIX ) sgemm.$(PSUFFIX ) : gemm.c ../param.h
@@ -1340,7 +1342,19 @@ cgemmt.$(SUFFIX) cgemmt.$(PSUFFIX) : gemmt.c ../param.h
1340
1342
zgemmt.$(SUFFIX ) zgemmt.$(PSUFFIX ) : gemmt.c ../param.h
1341
1343
$(CC ) -c $(CFLAGS ) $< -o $(@F )
1342
1344
1343
- xgemmt.$(SUFFIX ) xgemmt.$(PSUFFIX ) : gemmt.c ../param.h
1345
+ sgemmtr.$(SUFFIX ) sgemmtr.$(PSUFFIX ) : gemmt.c ../param.h
1346
+ $(CC ) -c $(CFLAGS ) $< -o $(@F )
1347
+
1348
+ dgemmtr.$(SUFFIX ) dgemmtr.$(PSUFFIX ) : gemmt.c ../param.h
1349
+ $(CC ) -c $(CFLAGS ) $< -o $(@F )
1350
+
1351
+ qgemmtr.$(SUFFIX ) qgemmtr.$(PSUFFIX ) : gemmt.c ../param.h
1352
+ $(CC ) -c $(CFLAGS ) $< -o $(@F )
1353
+
1354
+ cgemmtr.$(SUFFIX ) cgemmtr.$(PSUFFIX ) : gemmt.c ../param.h
1355
+ $(CC ) -c $(CFLAGS ) $< -o $(@F )
1356
+
1357
+ zgemmtr.$(SUFFIX ) zgemmtr.$(PSUFFIX ) : gemmt.c ../param.h
1344
1358
$(CC ) -c $(CFLAGS ) $< -o $(@F )
1345
1359
1346
1360
ssymm.$(SUFFIX ) ssymm.$(PSUFFIX ) : symm.c
@@ -1966,9 +1980,14 @@ cblas_zgemm.$(SUFFIX) cblas_zgemm.$(PSUFFIX) : gemm.c ../param.h
1966
1980
cblas_sgemmt.$(SUFFIX ) cblas_sgemmt.$(PSUFFIX ) : gemmt.c ../param.h
1967
1981
$(CC ) -DCBLAS -c $(CFLAGS ) $< -o $(@F )
1968
1982
1983
+ cblas_sgemmtr.$(SUFFIX ) cblas_sgemmtr.$(PSUFFIX ) : gemmt.c ../param.h
1984
+ $(CC ) -DCBLAS -c $(CFLAGS ) $< -o $(@F )
1985
+
1969
1986
ifeq ($(BUILD_BFLOAT16 ) ,1)
1970
1987
cblas_sbgemmt.$(SUFFIX ) cblas_sbgemmt.$(PSUFFIX ) : sbgemmt.c ../param.h
1971
1988
$(CC ) -DCBLAS -c $(CFLAGS ) $< -o $(@F )
1989
+ cblas_sbgemmtr.$(SUFFIX ) cblas_sbgemmtr.$(PSUFFIX ) : sbgemmt.c ../param.h
1990
+ $(CC ) -DCBLAS -c $(CFLAGS ) $< -o $(@F )
1972
1991
endif
1973
1992
1974
1993
cblas_dgemmt.$(SUFFIX ) cblas_dgemmt.$(PSUFFIX ) : gemmt.c ../param.h
@@ -1980,6 +1999,15 @@ cblas_cgemmt.$(SUFFIX) cblas_cgemmt.$(PSUFFIX) : gemmt.c ../param.h
1980
1999
cblas_zgemmt.$(SUFFIX ) cblas_zgemmt.$(PSUFFIX ) : gemmt.c ../param.h
1981
2000
$(CC ) -DCBLAS -c $(CFLAGS ) $< -o $(@F )
1982
2001
2002
+ cblas_dgemmtr.$(SUFFIX ) cblas_dgemmtr.$(PSUFFIX ) : gemmt.c ../param.h
2003
+ $(CC ) -DCBLAS -c $(CFLAGS ) $< -o $(@F )
2004
+
2005
+ cblas_cgemmtr.$(SUFFIX ) cblas_cgemmtr.$(PSUFFIX ) : gemmt.c ../param.h
2006
+ $(CC ) -DCBLAS -c $(CFLAGS ) $< -o $(@F )
2007
+
2008
+ cblas_zgemmtr.$(SUFFIX ) cblas_zgemmtr.$(PSUFFIX ) : gemmt.c ../param.h
2009
+ $(CC ) -DCBLAS -c $(CFLAGS ) $< -o $(@F )
2010
+
1983
2011
cblas_ssymm.$(SUFFIX ) cblas_ssymm.$(PSUFFIX ) : symm.c
1984
2012
$(CC ) -DCBLAS -c $(CFLAGS ) $< -o $(@F )
1985
2013
0 commit comments