From 138fc5b5a896d168ce732162bc47565d7104edbd Mon Sep 17 00:00:00 2001 From: Michael Zuckerman Date: Tue, 3 May 2016 11:05:24 +0000 Subject: [PATCH] [Clang][AVX512][Builtin] Adding intrinsics for vcvttpd2udq instruction set Differential Revision: http://reviews.llvm.org/D19768 llvm-svn: 268373 --- clang/lib/Headers/avx512fintrin.h | 48 +++++++++++++++++++++++++++ clang/test/CodeGen/avx512f-builtins.c | 36 ++++++++++++++++++++ 2 files changed, 84 insertions(+) diff --git a/clang/lib/Headers/avx512fintrin.h b/clang/lib/Headers/avx512fintrin.h index 3ab7aa543529..aca2364468cc 100644 --- a/clang/lib/Headers/avx512fintrin.h +++ b/clang/lib/Headers/avx512fintrin.h @@ -5229,6 +5229,54 @@ _mm512_mask_testn_epi64_mask (__mmask8 __U, __m512i __A, __m512i __B) (__v8di) __B, __U); } +#define _mm512_cvtt_roundpd_epu32( __A, __R) __extension__ ({ \ +__builtin_ia32_cvttpd2udq512_mask ((__v8df)( __A),\ + (__v8si)\ + _mm256_undefined_si256 (),\ + (__mmask8) -1,( __R));\ +}) + +#define _mm512_mask_cvtt_roundpd_epu32( __W, __U, __A, __R) __extension__ ({ \ +__builtin_ia32_cvttpd2udq512_mask ((__v8df)( __A),\ + (__v8si)( __W),\ + (__mmask8)( __U),( __R));\ +}) + +#define _mm512_maskz_cvtt_roundpd_epu32( __U, __A, __R) __extension__ ({ \ +__builtin_ia32_cvttpd2udq512_mask ((__v8df)( __A),\ + (__v8si)\ + _mm256_setzero_si256 (),\ + (__mmask8)( __U),( __R));\ +}) + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm512_cvttpd_epu32 (__m512d __A) +{ + return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A, + (__v8si) + _mm256_undefined_si256 (), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm512_mask_cvttpd_epu32 (__m256i __W, __mmask8 __U, __m512d __A) +{ + return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A, + (__v8si) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm512_maskz_cvttpd_epu32 (__mmask8 __U, __m512d __A) +{ + return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A, + (__v8si) + _mm256_setzero_si256 (), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpackhi_epi32 (__m512i __W, __mmask16 __U, __m512i __A, diff --git a/clang/test/CodeGen/avx512f-builtins.c b/clang/test/CodeGen/avx512f-builtins.c index b2926b904ac6..ffc54c747d47 100644 --- a/clang/test/CodeGen/avx512f-builtins.c +++ b/clang/test/CodeGen/avx512f-builtins.c @@ -5552,3 +5552,39 @@ void test_mm512_mask_compressstoreu_epi32(void *__P, __mmask16 __U, __m512i __A) // CHECK: @llvm.x86.avx512.mask.compress.store.d.512 return _mm512_mask_compressstoreu_epi32(__P, __U, __A); } + +__m256i test_mm512_cvtt_roundpd_epu32(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvtt_roundpd_epu32 + // CHECK: @llvm.x86.avx512.mask.cvttpd2udq.512 + return _mm512_cvtt_roundpd_epu32(__A, _MM_FROUND_CUR_DIRECTION); +} + +__m256i test_mm512_mask_cvtt_roundpd_epu32(__m256i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvtt_roundpd_epu32 + // CHECK: @llvm.x86.avx512.mask.cvttpd2udq.512 + return _mm512_mask_cvtt_roundpd_epu32(__W, __U, __A, _MM_FROUND_CUR_DIRECTION); +} + +__m256i test_mm512_maskz_cvtt_roundpd_epu32(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtt_roundpd_epu32 + // CHECK: @llvm.x86.avx512.mask.cvttpd2udq.512 + return _mm512_maskz_cvtt_roundpd_epu32(__U, __A, _MM_FROUND_CUR_DIRECTION); +} + +__m256i test_mm512_cvttpd_epu32(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvttpd_epu32 + // CHECK: @llvm.x86.avx512.mask.cvttpd2udq.512 + return _mm512_cvttpd_epu32(__A); +} + +__m256i test_mm512_mask_cvttpd_epu32(__m256i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvttpd_epu32 + // CHECK: @llvm.x86.avx512.mask.cvttpd2udq.512 + return _mm512_mask_cvttpd_epu32(__W, __U, __A); +} + +__m256i test_mm512_maskz_cvttpd_epu32(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvttpd_epu32 + // CHECK: @llvm.x86.avx512.mask.cvttpd2udq.512 + return _mm512_maskz_cvttpd_epu32(__U, __A); +}