blob: b334b88194be5591f2fbab64e62c1daa18b078dc [file] [log] [blame]
/* { dg-do compile } */
/* { dg-options "-mavx512dq -mavx512vl -mtune=generic -mtune-ctrl=dest_false_dep_for_glc -O2" } */
#include <immintrin.h>
extern __m512i i1;
extern __m256i i2;
extern __m128i i3;
extern __m512d d1, d11;
extern __m256d d2;
extern __m128d d3, d33;
extern __m512 f1, f11;
extern __m256 f2;
extern __m128 f3, f33;
__mmask32 m32;
__mmask16 m16;
__mmask8 m8;
void mullo_test (void)
{
i1 = _mm512_mullo_epi64 (i1, i1);
i1 = _mm512_mask_mullo_epi64 (i1, m8, i1, i1);
i1 = _mm512_maskz_mullo_epi64 (m8, i1, i1);
i2 = _mm256_mullo_epi64 (i2, i2);
i2 = _mm256_mask_mullo_epi64 (i2, m8, i2, i2);
i2 = _mm256_maskz_mullo_epi64 (m8, i2, i2);
i3 = _mm_mullo_epi64 (i3, i3);
i3 = _mm_mask_mullo_epi64 (i3, m8, i3, i3);
i3 = _mm_maskz_mullo_epi64 (m8, i3, i3);
}
void range_test (void)
{
d1 = _mm512_range_pd (d1, d11, 15);
d11 = _mm512_range_round_pd (d11, d1, 15, 8);
d1 = _mm512_mask_range_pd (d1, m8, d11, d11, 15);
d11 = _mm512_mask_range_round_pd (d11, m8, d1, d1, 15, 8);
d1 = _mm512_maskz_range_pd (m8, d11, d11, 15);
d11 = _mm512_maskz_range_round_pd (m8, d1, d1, 15, 8);
d2 = _mm256_range_pd (d2, d2, 15);
d2 = _mm256_mask_range_pd (d2, m8, d2, d2, 15);
d2 = _mm256_maskz_range_pd (m8, d2, d2, 15);
d3 = _mm_range_pd (d3, d3, 15);
d3 = _mm_mask_range_pd (d3, m8, d3, d3, 15);
d3 = _mm_maskz_range_pd (m8, d3, d3, 15);
d33 = _mm_range_sd (d33, d33, 15);
d33 = _mm_mask_range_sd (d33, m8, d33, d33, 15);
d33 = _mm_maskz_range_sd (m8, d33, d33, 15);
f1 = _mm512_range_ps (f1, f11, 15);
f11 = _mm512_range_round_ps (f11, f1, 15, 8);
f1 = _mm512_mask_range_ps (f1, m16, f11, f11, 15);
f11 = _mm512_mask_range_round_ps (f11, m16, f1, f1, 15, 8);
f1 = _mm512_maskz_range_ps (m16, f11, f11, 15);
f11 = _mm512_maskz_range_round_ps (m16, f1, f1, 15, 8);
f2 = _mm256_range_ps (f2, f2, 15);
f2 = _mm256_mask_range_ps (f2, m8, f2, f2, 15);
f2 = _mm256_maskz_range_ps (m8, f2, f2, 15);
f3 = _mm_range_ps (f3, f3, 15);
f3 = _mm_mask_range_ps (f3, m8, f3, f3, 15);
f3 = _mm_maskz_range_ps (m8, f3, f3, 15);
f33 = _mm_range_ss (f33, f33, 15);
f33 = _mm_mask_range_ss (f33, m8, f33, f33, 15);
f33 = _mm_maskz_range_ss (m8, f33, f33, 15);
}
/* { dg-final { scan-assembler-times "vxorps" 26 } } */
/* { dg-final { scan-assembler-times "vpmullq" 9 } } */
/* { dg-final { scan-assembler-times "vrangepd" 12 } } */
/* { dg-final { scan-assembler-times "vrangesd" 3 } } */
/* { dg-final { scan-assembler-times "vrangeps" 12 } } */
/* { dg-final { scan-assembler-times "vrangess" 3 } } */