; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2 ; RUN: llc < %s -mtriple=riscv32 -mattr=+v,m -O2 | FileCheck -check-prefixes=CHECK,RV32 %s ; RUN: llc < %s -mtriple=riscv64 -mattr=+v,m -O2 | FileCheck -check-prefixes=CHECK,RV64 %s define {, } @load_factor2_v2(ptr %ptr, i32 zeroext %evl) { ; CHECK-LABEL: load_factor2_v2: ; CHECK: # %bb.0: ; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma ; CHECK-NEXT: vlseg2e32.v v8, (a0) ; CHECK-NEXT: ret %rvl = mul nuw i32 %evl, 2 %wide.masked.load = call @llvm.vp.load.nxv4i32.p0(ptr %ptr, splat (i1 true), i32 %rvl) %deinterleaved.results = call { , } @llvm.vector.deinterleave2.nxv4i32( %wide.masked.load) %t0 = extractvalue { , } %deinterleaved.results, 0 %t1 = extractvalue { , } %deinterleaved.results, 1 %res0 = insertvalue { , } poison, %t0, 0 %res1 = insertvalue { , } %res0, %t1, 1 ret { , } %res1 } define {, , } @load_factor3_v2(ptr %ptr, i32 zeroext %evl) { ; CHECK-LABEL: load_factor3_v2: ; CHECK: # %bb.0: ; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma ; CHECK-NEXT: vlseg3e32.v v8, (a0) ; CHECK-NEXT: ret %rvl = mul nuw i32 %evl, 3 %wide.masked.load = call @llvm.vp.load(ptr %ptr, splat (i1 true), i32 %rvl) %deinterleaved.results = call { , , } @llvm.vector.deinterleave3( %wide.masked.load) %t0 = extractvalue { , , } %deinterleaved.results, 0 %t1 = extractvalue { , , } %deinterleaved.results, 1 %t2 = extractvalue { , , } %deinterleaved.results, 2 %res0 = insertvalue { , , } poison, %t0, 0 %res1 = insertvalue { , , } %res0, %t1, 1 %res2 = insertvalue { , , } %res1, %t2, 2 ret { , , } %res1 } define {, } @load_factor3_partial(ptr %ptr, i32 zeroext %evl) { ; CHECK-LABEL: load_factor3_partial: ; CHECK: # %bb.0: ; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma ; CHECK-NEXT: vlseg3e32.v v7, (a0) ; CHECK-NEXT: vmv1r.v v8, v7 ; CHECK-NEXT: ret %rvl = mul nuw i32 %evl, 3 %wide.masked.load = call @llvm.vp.load(ptr %ptr, splat (i1 true), i32 %rvl) %deinterleaved.results = call { , , } @llvm.vector.deinterleave3( %wide.masked.load) %t0 = extractvalue { , , } %deinterleaved.results, 0 %t2 = extractvalue { , , } %deinterleaved.results, 2 %res0 = insertvalue { , } poison, %t0, 0 %res1 = insertvalue { , } %res0, %t2, 1 ret { , } %res1 } ; InterleavedAccess should kick in even if the users of deinterleave intrinsic are not extractvalue. define {, } @load_factor3_no_extract(ptr %ptr, i32 zeroext %evl) { ; CHECK-LABEL: load_factor3_no_extract: ; CHECK: # %bb.0: ; CHECK-NEXT: li a2, 12 ; CHECK-NEXT: beq a1, a2, .LBB3_2 ; CHECK-NEXT: # %bb.1: # %bb0 ; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma ; CHECK-NEXT: vlseg3e32.v v7, (a0) ; CHECK-NEXT: j .LBB3_3 ; CHECK-NEXT: .LBB3_2: # %bb1 ; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma ; CHECK-NEXT: vlseg3e32.v v7, (a0) ; CHECK-NEXT: .LBB3_3: # %merge ; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, ma ; CHECK-NEXT: vmv1r.v v8, v7 ; CHECK-NEXT: ret %p = icmp ne i32 %evl, 12 br i1 %p, label %bb0, label %bb1 bb0: %rvl.0 = mul nuw i32 %evl, 3 %wide.load.0 = call @llvm.vp.load(ptr %ptr, splat (i1 true), i32 %rvl.0) %deinterleaved.results.0 = call { , , } @llvm.vector.deinterleave3( %wide.load.0) br label %merge bb1: %wide.load.1 = call @llvm.vp.load(ptr %ptr, splat (i1 true), i32 12) %deinterleaved.results.1 = call { , , } @llvm.vector.deinterleave3( %wide.load.1) br label %merge merge: %deinterleaved.results = phi { , , } [%deinterleaved.results.0, %bb0], [%deinterleaved.results.1, %bb1] %t0 = extractvalue { , , } %deinterleaved.results, 0 %t2 = extractvalue { , , } %deinterleaved.results, 2 %res0 = insertvalue { , } poison, %t0, 0 %res1 = insertvalue { , } %res0, %t2, 1 ret { , } %res1 } define {, , , } @load_factor4_v2(ptr %ptr, i32 zeroext %evl) { ; CHECK-LABEL: load_factor4_v2: ; CHECK: # %bb.0: ; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma ; CHECK-NEXT: vlseg4e32.v v8, (a0) ; CHECK-NEXT: ret %rvl = mul nuw i32 %evl, 4 %wide.masked.load = call @llvm.vp.load.nxv8i32.p0(ptr %ptr, splat (i1 true), i32 %rvl) %d = call { , , , } @llvm.vector.deinterleave4.nxv8i32( %wide.masked.load) %t0 = extractvalue { , , , } %d, 0 %t1 = extractvalue { , , , } %d, 1 %t2 = extractvalue { , , , } %d, 2 %t3 = extractvalue { , , , } %d, 3 %res0 = insertvalue { , , , } poison, %t0, 0 %res1 = insertvalue { , , , } %res0, %t1, 1 %res2 = insertvalue { , , , } %res1, %t2, 2 %res3 = insertvalue { , , , } %res2, %t3, 3 ret { , , , } %res3 } define {, , , , } @load_factor5_v2(ptr %ptr, i32 zeroext %evl) { ; CHECK-LABEL: load_factor5_v2: ; CHECK: # %bb.0: ; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma ; CHECK-NEXT: vlseg5e32.v v8, (a0) ; CHECK-NEXT: ret %rvl = mul nuw i32 %evl, 5 %wide.masked.load = call @llvm.vp.load(ptr %ptr, splat (i1 true), i32 %rvl) %deinterleaved.results = call { , , , , } @llvm.vector.deinterleave5( %wide.masked.load) %t0 = extractvalue { , , , , } %deinterleaved.results, 0 %t1 = extractvalue { , , , , } %deinterleaved.results, 1 %t2 = extractvalue { , , , , } %deinterleaved.results, 2 %t3 = extractvalue { , , , , } %deinterleaved.results, 3 %t4 = extractvalue { , , , , } %deinterleaved.results, 4 %res0 = insertvalue { , , , , } poison, %t0, 0 %res1 = insertvalue { , , , , } %res0, %t1, 1 %res2 = insertvalue { , , , , } %res1, %t2, 2 %res3 = insertvalue { , , , , } %res2, %t3, 3 %res4 = insertvalue { , , , , } %res3, %t4, 4 ret { , , , , } %res4 } define {, , , , , , } @load_factor7_v2(ptr %ptr, i32 zeroext %evl) { ; CHECK-LABEL: load_factor7_v2: ; CHECK: # %bb.0: ; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma ; CHECK-NEXT: vlseg7e32.v v8, (a0) ; CHECK-NEXT: ret %rvl = mul nuw i32 %evl, 7 %wide.masked.load = call @llvm.vp.load(ptr %ptr, splat (i1 true), i32 %rvl) %deinterleaved.results = call { , , , , , , } @llvm.vector.deinterleave7( %wide.masked.load) %t0 = extractvalue { , , , , , , } %deinterleaved.results, 0 %t1 = extractvalue { , , , , , , } %deinterleaved.results, 1 %t2 = extractvalue { , , , , , , } %deinterleaved.results, 2 %t3 = extractvalue { , , , , , , } %deinterleaved.results, 3 %t4 = extractvalue { , , , , , , } %deinterleaved.results, 4 %t5 = extractvalue { , , , , , , } %deinterleaved.results, 5 %t6 = extractvalue { , , , , , , } %deinterleaved.results, 6 %res0 = insertvalue { , , , , , , } poison, %t0, 0 %res1 = insertvalue { , , , , , , } %res0, %t1, 1 %res2 = insertvalue { , , , , , , } %res1, %t2, 2 %res3 = insertvalue { , , , , , , } %res2, %t3, 3 %res4 = insertvalue { , , , , , , } %res3, %t4, 4 %res5 = insertvalue { , , , , , , } %res4, %t5, 5 %res6 = insertvalue { , , , , , , } %res5, %t6, 6 ret { , , , , , , } %res6 } define {, , , , , , , } @load_factor8_v2(ptr %ptr, i32 zeroext %evl) { ; CHECK-LABEL: load_factor8_v2: ; CHECK: # %bb.0: ; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma ; CHECK-NEXT: vlseg8e32.v v8, (a0) ; CHECK-NEXT: ret %rvl = mul nuw i32 %evl, 8 %wide.masked.load = call @llvm.vp.load.nxv16i32.p0(ptr %ptr, splat (i1 true), i32 %rvl) %d = call { , , , , , , , } @llvm.vector.deinterleave8.nxv16i32( %wide.masked.load) %t0 = extractvalue { , , , , , , , } %d, 0 %t1 = extractvalue { , , , , , , , } %d, 1 %t2 = extractvalue { , , , , , , ,