Skip to content

Commit 4ecf631

Browse files
authored
Merge pull request #3228 from martin-frbg/issue3226
filter out -mavx flag on Sandybridge zgemm/ztrmm kernels
2 parents 5af5100 + c4da892 commit 4ecf631

File tree

1 file changed

+56
-6
lines changed

1 file changed

+56
-6
lines changed

kernel/Makefile.L3

Lines changed: 56 additions & 6 deletions
Original file line numberDiff line numberDiff line change
@@ -818,6 +818,8 @@ ifeq ($(OS), AIX)
818818
m4 zgemm_kernel_n.s > zgemm_kernel_n_nomacros.s
819819
$(CC) $(CFLAGS) -c -DDOUBLE -DCOMPLEX -DNN zgemm_kernel_n_nomacros.s -o $@
820820
rm zgemm_kernel_n.s zgemm_kernel_n_nomacros.s
821+
else ifeq ($(CORE),SANDYBRIDGE)
822+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DDOUBLE -DCOMPLEX -DNN $< -o $@
821823
else
822824
$(CC) $(CFLAGS) -c -DDOUBLE -DCOMPLEX -DNN $< -o $@
823825
endif
@@ -828,6 +830,8 @@ ifeq ($(OS), AIX)
828830
m4 zgemm_kernel_l.s > zgemm_kernel_l_nomacros.s
829831
$(CC) $(CFLAGS) -c -DDOUBLE -DCOMPLEX -DCN zgemm_kernel_l_nomacros.s -o $@
830832
rm zgemm_kernel_l.s zgemm_kernel_l_nomacros.s
833+
else ifeq ($(CORE),SANDYBRIDGE)
834+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DDOUBLE -DCOMPLEX -DCN $< -o $@
831835
else
832836
$(CC) $(CFLAGS) -c -DDOUBLE -DCOMPLEX -DCN $< -o $@
833837
endif
@@ -838,6 +842,8 @@ ifeq ($(OS), AIX)
838842
m4 zgemm_kernel_r.s > zgemm_kernel_r_nomacros.s
839843
$(CC) $(CFLAGS) -c -DDOUBLE -DCOMPLEX -DNC zgemm_kernel_r_nomacros.s -o $@
840844
rm zgemm_kernel_r.s zgemm_kernel_r_nomacros.s
845+
else ifeq ($(CORE),SANDYBRIDGE)
846+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DDOUBLE -DCOMPLEX -DNC $< -o $@
841847
else
842848
$(CC) $(CFLAGS) -c -DDOUBLE -DCOMPLEX -DNC $< -o $@
843849
endif
@@ -848,6 +854,8 @@ ifeq ($(OS), AIX)
848854
m4 zgemm_kernel_b.s > zgemm_kernel_b_nomacros.s
849855
$(CC) $(CFLAGS) -c -DDOUBLE -DCOMPLEX -DCC zgemm_kernel_b_nomacros.s -o $@
850856
rm zgemm_kernel_b.s zgemm_kernel_b_nomacros.s
857+
else ifeq ($(CORE),SANDYBRIDGE)
858+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DDOUBLE -DCOMPLEX -DCC $< -o $@
851859
else
852860
$(CC) $(CFLAGS) -c -DDOUBLE -DCOMPLEX -DCC $< -o $@
853861
endif
@@ -1044,6 +1052,8 @@ ifeq ($(OS), AIX)
10441052
m4 ztrmm_kernel_ln.s > ztrmm_kernel_ln_nomacros.s
10451053
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN ztrmm_kernel_ln_nomacros.s -o $@
10461054
rm ztrmm_kernel_ln.s ztrmm_kernel_ln_nomacros.s
1055+
else ifeq ($(CORE), SANDYBRIDGE)
1056+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN $< -o $@
10471057
else
10481058
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN $< -o $@
10491059
endif
@@ -1054,6 +1064,8 @@ ifeq ($(OS), AIX)
10541064
m4 ztrmm_kernel_lt.s > ztrmm_kernel_lt_nomacros.s
10551065
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN ztrmm_kernel_lt_nomacros.s -o $@
10561066
rm ztrmm_kernel_lt.s ztrmm_kernel_lt_nomacros.s
1067+
else ifeq ($(CORE), SANDYBRIDGE)
1068+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN $< -o $@
10571069
else
10581070
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN $< -o $@
10591071
endif
@@ -1064,6 +1076,8 @@ ifeq ($(OS), AIX)
10641076
m4 ztrmm_kernel_lr.s > ztrmm_kernel_lr_nomacros.s
10651077
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN ztrmm_kernel_lr_nomacros.s -o $@
10661078
rm ztrmm_kernel_lr.s ztrmm_kernel_lr_nomacros.s
1079+
else ifeq ($(CORE), SANDYBRIDGE)
1080+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN $< -o $@
10671081
else
10681082
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN $< -o $@
10691083
endif
@@ -1074,6 +1088,8 @@ ifeq ($(OS), AIX)
10741088
m4 ztrmm_kernel_lc.s >ztrmm_kernel_lc_nomacros.s
10751089
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN ztrmm_kernel_lc_nomacros.s -o $@
10761090
rm ztrmm_kernel_lc.s ztrmm_kernel_lc_nomacros.s
1091+
else ifeq ($(CORE), SANDYBRIDGE)
1092+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN $< -o $@
10771093
else
10781094
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN $< -o $@
10791095
endif
@@ -1084,6 +1100,8 @@ ifeq ($(OS), AIX)
10841100
m4 ztrmm_kernel_rn.s > ztrmm_kernel_rn_nomacros.s
10851101
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN ztrmm_kernel_rn_nomacros.s -o $@
10861102
rm ztrmm_kernel_rn.s ztrmm_kernel_rn_nomacros.s
1103+
else ifeq ($(CORE), SANDYBRIDGE)
1104+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN $< -o $@
10871105
else
10881106
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN $< -o $@
10891107
endif
@@ -1094,6 +1112,8 @@ ifeq ($(OS), AIX)
10941112
m4 ztrmm_kernel_rt.s > ztrmm_kernel_rt_nomacros.s
10951113
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN ztrmm_kernel_rt_nomacros.s -o $@
10961114
rm ztrmm_kernel_rt.s ztrmm_kernel_rt_nomacros.s
1115+
else ifeq ($(CORE), SANDYBRIDGE)
1116+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN $< -o $@
10971117
else
10981118
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN $< -o $@
10991119
endif
@@ -1104,6 +1124,8 @@ ifeq ($(OS), AIX)
11041124
m4 ztrmm_kernel_rr.s > ztrmm_kernel_rr_nomacros.s
11051125
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC ztrmm_kernel_rr_nomacros.s -o $@
11061126
rm ztrmm_kernel_rr.s ztrmm_kernel_rr_nomacros.s
1127+
else ifeq ($(CORE), SANDYBRIDGE)
1128+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC $< -o $@
11071129
else
11081130
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC $< -o $@
11091131
endif
@@ -1114,6 +1136,8 @@ ifeq ($(OS), AIX)
11141136
m4 ztrmm_kernel_rc.s > ztrmm_kernel_rc_nomacros.s
11151137
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC ztrmm_kernel_rc_nomacros.s -o $@
11161138
rm ztrmm_kernel_rc.s ztrmm_kernel_rc_nomacros.s
1139+
else ifeq ($(CORE), SANDYBRIDGE)
1140+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC $< -o $@
11171141
else
11181142
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC $< -o $@
11191143
endif
@@ -1187,29 +1211,55 @@ $(KDIR)ctrmm_kernel_RC$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(CGEMMKERNEL)
11871211
$(CC) $(CFLAGS) -c -DTRMMKERNEL -UDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC $< -o $@
11881212

11891213
$(KDIR)ztrmm_kernel_LN$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1214+
ifeq ($(CORE),SANDYBRIDGE)
1215+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN $< -o $@
1216+
else
11901217
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -UCONJ -DNN $< -o $@
1218+
endif
11911219

11921220
$(KDIR)ztrmm_kernel_LT$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1221+
ifeq ($(CORE),SANDYBRIDGE)
1222+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN $< -o $@
1223+
else
11931224
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -UCONJ -DNN $< -o $@
1194-
1225+
endif
11951226
$(KDIR)ztrmm_kernel_LR$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1227+
ifeq ($(CORE),SANDYBRIDGE)
1228+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN $< -o $@
1229+
else
11961230
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -UTRANSA -DCONJ -DCN $< -o $@
1197-
1231+
endif
11981232
$(KDIR)ztrmm_kernel_LC$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1233+
ifeq ($(CORE),SANDYBRIDGE)
1234+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN $< -o $@
1235+
else
11991236
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -DLEFT -DTRANSA -DCONJ -DCN $< -o $@
1200-
1237+
endif
12011238
$(KDIR)ztrmm_kernel_RN$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1239+
ifeq ($(CORE),SANDYBRIDGE)
1240+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN $< -o $@
1241+
else
12021242
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -UCONJ -DNN $< -o $@
1203-
1243+
endif
12041244
$(KDIR)ztrmm_kernel_RT$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1245+
ifeq ($(CORE),SANDYBRIDGE)
1246+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN $< -o $@
1247+
else
12051248
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -UCONJ -DNN $< -o $@
1206-
1249+
endif
12071250
$(KDIR)ztrmm_kernel_RR$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1251+
ifeq ($(CORE),SANDYBRIDGE)
1252+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC $< -o $@
1253+
else
12081254
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -UTRANSA -DCONJ -DNC $< -o $@
1209-
1255+
endif
12101256
$(KDIR)ztrmm_kernel_RC$(TSUFFIX).$(SUFFIX) : $(KERNELDIR)/$(ZGEMMKERNEL)
1257+
ifeq ($(CORE),SANDYBRIDGE)
1258+
$(CC) $(filter-out -mavx,$(CFLAGS)) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC $< -o $@
1259+
else
12111260
$(CC) $(CFLAGS) -c -DTRMMKERNEL -DDOUBLE -DCOMPLEX -ULEFT -DTRANSA -DCONJ -DNC $< -o $@
12121261
endif
1262+
endif
12131263

12141264

12151265

0 commit comments

Comments
 (0)