// RUN: %clang_cc1 -flax-vector-conversions=none -ffreestanding %s -triple=x86_64-unknown-unknown -target-feature +avx10.2-256 -emit-llvm -o - | FileCheck %s #include #include // scalar int test_mm_cvtts_sd_i32(__m128d __A) { // CHECK-LABEL: @test_mm_cvtts_sd_i32 // CHECK: @llvm.x86.avx10.vcvttsd2sis return _mm_cvtts_roundsd_i32(__A, _MM_FROUND_NO_EXC); } int test_mm_cvtts_sd_si32(__m128d __A) { // CHECK-LABEL: @test_mm_cvtts_sd_si32( // CHECK: @llvm.x86.avx10.vcvttsd2sis(<2 x double> return _mm_cvtts_roundsd_si32(__A, _MM_FROUND_NO_EXC); } unsigned test_mm_cvtts_sd_u32(__m128d __A) { // CHECK-LABEL: @test_mm_cvtts_sd_u32( // CHECK: @llvm.x86.avx10.vcvttsd2usis(<2 x double> return _mm_cvtts_roundsd_u32(__A, _MM_FROUND_NO_EXC); } int test_mm_cvtts_ss_i32(__m128 __A) { // CHECK-LABEL: @test_mm_cvtts_ss_i32( // CHECK: @llvm.x86.avx10.vcvttss2sis(<4 x float> return _mm_cvtts_roundss_i32(__A, _MM_FROUND_NO_EXC); } int test_mm_cvtts_ss_si32(__m128 __A) { // CHECK-LABEL: @test_mm_cvtts_ss_si32( // CHECK: @llvm.x86.avx10.vcvttss2sis(<4 x float> return _mm_cvtts_roundss_si32(__A, _MM_FROUND_NO_EXC); } unsigned test_mm_cvtts_ss_u32(__m128 __A) { // CHECK-LABEL: @test_mm_cvtts_ss_u32( // CHECK: @llvm.x86.avx10.vcvttss2usis(<4 x float> return _mm_cvtts_roundss_u32(__A, _MM_FROUND_NO_EXC); } // vector // 128 bit __m128i test_mm_cvtts_pd_epi64(__m128d A){ // CHECK-LABEL: @test_mm_cvtts_pd_epi64 // CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.128(<2 x double> return _mm_cvtts_pd_epi64(A); } __m128i test_mm_mask_cvtts_pd_epi64(__m128i W, __mmask8 U, __m128d A){ // CHECK-LABEL: @test_mm_mask_cvtts_pd_epi64 // CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.128(<2 x double> return _mm_mask_cvtts_pd_epi64(W, U, A); } __m128i test_mm_maskz_cvtts_pd_epi64(__mmask8 U,__m128d A){ // CHECK-LABEL: @test_mm_maskz_cvtts_pd_epi64 // CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.128(<2 x double> return _mm_maskz_cvtts_pd_epi64(U, A); } __m128i test_mm_cvtts_pd_epu64(__m128d A){ // CHECK-LABEL: @test_mm_cvtts_pd_epu64 // CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.128(<2 x double> return _mm_cvtts_pd_epu64(A); } __m128i test_mm_mask_cvtts_pd_epu64(__m128i W, __mmask8 U, __m128d A){ // CHECK-LABEL: @test_mm_mask_cvtts_pd_epu64 // CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.128(<2 x double> return _mm_mask_cvtts_pd_epu64(W, U, A); } __m128i test_mm_maskz_cvtts_pd_epu64(__mmask8 U,__m128d A){ // CHECK-LABEL: @test_mm_maskz_cvtts_pd_epu64 // CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.128(<2 x double> return _mm_maskz_cvtts_pd_epu64(U, A); } // 256 bit __m256i test_mm256_cvtts_pd_epi64(__m256d A){ // CHECK-LABEL: @test_mm256_cvtts_pd_epi64 // CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.256(<4 x double> return _mm256_cvtts_pd_epi64(A); } __m256i test_mm256_mask_cvtts_pd_epi64(__m256i W,__mmask8 U, __m256d A){ // CHECK-LABEL: @test_mm256_mask_cvtts_pd_epi64 // CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.256(<4 x double> return _mm256_mask_cvtts_pd_epi64(W,U, A); } __m256i test_mm256_maskz_cvtts_pd_epi64(__mmask8 U, __m256d A){ // CHECK-LABEL: @test_mm256_maskz_cvtts_pd_epi64 // CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.256(<4 x double> return _mm256_maskz_cvtts_pd_epi64(U, A); } __m256i test_mm256_cvtts_pd_epu64(__m256d A){ // CHECK-LABEL: @test_mm256_cvtts_pd_epu64 // CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.256(<4 x double> return _mm256_cvtts_pd_epu64(A); } __m256i test_mm256_mask_cvtts_pd_epu64(__m256i W,__mmask8 U, __m256d A){ // CHECK-LABEL: @test_mm256_mask_cvtts_pd_epu64 // CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.256(<4 x double> return _mm256_mask_cvtts_pd_epu64(W,U, A); } __m256i test_mm256_maskz_cvtts_pd_epu64(__mmask8 U, __m256d A){ // CHECK-LABEL: @test_mm256_maskz_cvtts_pd_epu64 // CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.256(<4 x double> return _mm256_maskz_cvtts_pd_epu64(U, A); } // 128 bit __m128i test_mm_cvtts_ps_epi64(__m128 A){ // CHECK-LABEL: @test_mm_cvtts_ps_epi64 // CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.128(<4 x float> return _mm_cvtts_ps_epi64(A); } __m128i test_mm_mask_cvtts_ps_epi64(__m128i W, __mmask8 U, __m128 A){ // CHECK-LABEL: @test_mm_mask_cvtts_ps_epi64 // CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.128(<4 x float> return _mm_mask_cvtts_ps_epi64(W, U, A); } __m128i test_mm_maskz_cvtts_ps_epi64(__mmask8 U,__m128 A){ // CHECK-LABEL: @test_mm_maskz_cvtts_ps_epi64 // CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.128(<4 x float> return _mm_maskz_cvtts_ps_epi64(U, A); } __m128i test_mm_cvtts_ps_epu64(__m128 A){ // CHECK-LABEL: @test_mm_cvtts_ps_epu64 // CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.128(<4 x float> return _mm_cvtts_ps_epu64(A); } __m128i test_mm_mask_cvtts_ps_epu64(__m128i W, __mmask8 U, __m128 A){ // CHECK-LABEL: @test_mm_mask_cvtts_ps_epu64 // CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.128(<4 x float> return _mm_mask_cvtts_ps_epu64(W, U, A); } __m128i test_mm_maskz_cvtts_ps_epu64(__mmask8 U,__m128 A){ // CHECK-LABEL: @test_mm_maskz_cvtts_ps_epu64 // CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.128(<4 x float> return _mm_maskz_cvtts_ps_epu64(U, A); } __m256i test_mm256_cvtts_ps_epi64(__m128 A){ // CHECK-LABEL: @test_mm256_cvtts_ps_epi64 // CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.256(<4 x float> return _mm256_cvtts_ps_epi64(A); } __m256i test_mm256_mask_cvtts_ps_epi64(__m256i W,__mmask8 U, __m128 A){ // CHECK-LABEL: @test_mm256_mask_cvtts_ps_epi64 // CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.256(<4 x float> return _mm256_mask_cvtts_ps_epi64(W,U, A); } __m256i test_mm256_maskz_cvtts_ps_epi64(__mmask8 U, __m128 A){ // CHECK-LABEL: @test_mm256_maskz_cvtts_ps_epi64 // CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.256(<4 x float> return _mm256_maskz_cvtts_ps_epi64(U, A); } __m256i test_mm256_cvtts_ps_epu64(__m128 A){ // CHECK-LABEL: @test_mm256_cvtts_ps_epu64 // CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.256(<4 x float> return _mm256_cvtts_ps_epu64(A); } __m256i test_mm256_mask_cvtts_ps_epu64(__m256i W,__mmask8 U, __m128 A){ // CHECK-LABEL: @test_mm256_mask_cvtts_ps_epu64 // CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.256(<4 x float> return _mm256_mask_cvtts_ps_epu64(W,U, A); } __m256i test_mm256_maskz_cvtts_ps_epu64(__mmask8 U, __m128 A){ // CHECK-LABEL: @test_mm256_maskz_cvtts_ps_epu64 // CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.256(<4 x float> return _mm256_maskz_cvtts_ps_epu64(U, A); }