x86: don't use AVX512BW vmovdqu variants without -mavx512bw

Simply mirror the MODE_XI logic of handling unaligned operands in mov<mode>_internal into MODE_TI / MODE_OI handling. gcc/ 2018-01-03 Jan Beulich <jbeulich@suse.com> * sse.md (mov<mode>_internal): Tighten condition for when to use vmovdqu<ssescalarsize> for TI and OI modes. gcc/testsuite/ 2018-01-03 Jan Beulich <jbeulich@suse.com> * gcc.target/i386/avx512vl-no-vmovdqu8.c, gcc.target/i386/avx512vl-no-vmovdqu16.c: New. From-SVN: r256170

x86: don't use AVX512BW vmovdqu variants without -mavx512bw
Simply mirror the MODE_XI logic of handling unaligned operands in mov<mode>_internal into MODE_TI / MODE_OI handling. gcc/ 2018-01-03 Jan Beulich <jbeulich@suse.com> * sse.md (mov<mode>_internal): Tighten condition for when to use vmovdqu<ssescalarsize> for TI and OI modes. gcc/testsuite/ 2018-01-03 Jan Beulich <jbeulich@suse.com> * gcc.target/i386/avx512vl-no-vmovdqu8.c, gcc.target/i386/avx512vl-no-vmovdqu16.c: New. From-SVN: r256170
b853346e · Jan Beulich · Jan Beulich · 85ec4feb · b853346e · b853346e
Commit b853346e authored Jan 03, 2018 by Jan Beulich Committed by Jan Beulich Jan 03, 2018
Showing with 66 additions and 2 deletions

gcc/ChangeLog
+5 -0

gcc/config/i386/sse.md
+8 -2

gcc/testsuite/ChangeLog
+5 -0

gcc/testsuite/gcc.target/i386/avx512vl-no-vmovdqu16.c
+24 -0

gcc/testsuite/gcc.target/i386/avx512vl-no-vmovdqu8.c
+24 -0

No files found.
--- a/gcc/ChangeLog
+++ b/gcc/ChangeLog
+2018-01-03  Jan Beulich  <jbeulich@suse.com>
+	* sse.md (mov<mode>_internal): Tighten condition for when to use
+	vmovdqu<ssescalarsize> for TI and OI modes.
 2018-01-03  Jakub Jelinek  <jakub@redhat.com>
 	Update copyright years.

--- a/gcc/config/i386/sse.md
+++ b/gcc/config/i386/sse.md
@@ -1021,8 +1021,14 @@
 	case MODE_TI:
 	  if (misaligned_operand (operands[0], <MODE>mode)
 	      || misaligned_operand (operands[1], <MODE>mode))
-	    return TARGET_AVX512VL ? "vmovdqu<ssescalarsize>\t{%1, %0|%0, %1}"
+	    return TARGET_AVX512VL
-				   : "%vmovdqu\t{%1, %0|%0, %1}";
+		   && (<MODE>mode == V4SImode
+		       || <MODE>mode == V2DImode
+		       || <MODE>mode == V8SImode
+		       || <MODE>mode == V4DImode
+		       || TARGET_AVX512BW)
+		   ? "vmovdqu<ssescalarsize>\t{%1, %0|%0, %1}"
+		   : "%vmovdqu\t{%1, %0|%0, %1}";
 	  else
 	    return TARGET_AVX512VL ? "vmovdqa64\t{%1, %0|%0, %1}"
 				   : "%vmovdqa\t{%1, %0|%0, %1}";

--- a/gcc/testsuite/ChangeLog
+++ b/gcc/testsuite/ChangeLog
+2018-01-03  Jan Beulich  <jbeulich@suse.com>
+	* gcc.target/i386/avx512vl-no-vmovdqu8.c,
+	gcc.target/i386/avx512vl-no-vmovdqu16.c: New.
 2018-01-03  Jakub Jelinek  <jakub@redhat.com>
 	Update copyright years.

--- a/gcc/testsuite/gcc.target/i386/avx512vl-no-vmovdqu16.c
+++ b/gcc/testsuite/gcc.target/i386/avx512vl-no-vmovdqu16.c
+/* { dg-do compile } */
+/* { dg-options "-O2 -mavx512vl -mno-avx512bw" } */
+typedef unsigned int __attribute__((mode(HI), vector_size(16))) v8hi_t;
+typedef unsigned int __attribute__((mode(HI), vector_size(32))) v16hi_t;
+struct s8hi {
+	int i;
+	v8hi_t __attribute__((packed)) v;
+};
+struct s16hi {
+	int i;
+	v16hi_t __attribute__((packed)) v;
+};
+void f8hi(struct s8hi*p1, const struct s8hi*p2) {
+	p1->v += p2->v;
+}
+void f16hi(struct s16hi*p1, const struct s16hi*p2) {
+	p1->v += p2->v;
+}
+/* { dg-final { scan-assembler-not "^\[ \t\]*vmovdq\[au\](8|16)" } } */
--- a/gcc/testsuite/gcc.target/i386/avx512vl-no-vmovdqu8.c
+++ b/gcc/testsuite/gcc.target/i386/avx512vl-no-vmovdqu8.c
+/* { dg-do compile } */
+/* { dg-options "-O2 -mavx512vl -mno-avx512bw" } */
+typedef unsigned int __attribute__((mode(QI), vector_size(16))) v16qi_t;
+typedef unsigned int __attribute__((mode(QI), vector_size(32))) v32qi_t;
+struct s16qi {
+	int i;
+	v16qi_t __attribute__((packed)) v;
+};
+struct s32qi {
+	int i;
+	v32qi_t __attribute__((packed)) v;
+};
+void f16qi(struct s16qi*p1, const struct s16qi*p2) {
+	p1->v += p2->v;
+}
+void f32qi(struct s32qi*p1, const struct s32qi*p2) {
+	p1->v += p2->v;
+}
+/* { dg-final { scan-assembler-not "^\[ \t\]*vmovdq\[au\](8|16)" } } */