// RUN: %clang_cc1 %s -ffreestanding -triple=x86_64-unknown-unknown \ // RUN: -target-feature +amx-movrs -emit-llvm -o - -Wall -Werror -pedantic \ // RUN: -Wno-gnu-statement-expression| FileCheck %s #include #include #define STRIDE 32 char buf[1024]; void test_tile_loadd(short row) { // CHECK-LABEL: define dso_local void @test_tile_loadd( // CHECK: call x86_amx @llvm.x86.tileloaddrs64.internal(i16 %{{.*}}, i16 %{{.*}}, ptr %{{.*}}, i64 %{{.*}}) // CHECK-NEXT: call <256 x i32> @llvm.x86.cast.tile.to.vector.v256i32(x86_amx %{{.*}}) __tile1024i a = {row, 8}; __tile_loaddrs(&a, buf, STRIDE); } void test_tile_loaddt1(short row) { // CHECK-LABEL: define dso_local void @test_tile_loaddt1( // CHECK: call x86_amx @llvm.x86.tileloaddrst164.internal(i16 %{{.*}}, i16 %{{.*}}, ptr %{{.*}}, i64 %{{.*}}) // CHECK-NEXT: call <256 x i32> @llvm.x86.cast.tile.to.vector.v256i32(x86_amx %{{.*}}) __tile1024i a = {row, 8}; __tile_stream_loaddrs(&a, buf, STRIDE); } void test_tile_loadd_macro(void *data) { // CHECK-LABEL: define dso_local void @test_tile_loadd_macro( // CHECK: call void @llvm.x86.tileloaddrs64(i8 {{.*}}, ptr %{{.*}}, i64 {{.*}}) // CHECK: call void @llvm.x86.tileloaddrst164(i8 {{.*}}, ptr %{{.*}}, i64 {{.*}}) _tile_loaddrs(4, data, STRIDE); _tile_stream_loaddrs(2, data, STRIDE); }