AMDGPU/GlobalISel: Avoid illegal vector exts for add/sub/mul

When expanding scalar packed operations, we should not introduce illegal vector casts LegalizerHelper introduces. We're not in a legalizer context, and there's no RegBankSelect apply or legalize worklist.
author: Matt Arsenault <Matthew.Arsenault@amd.com> 2020-02-19 12:54:35 -0500
committer: Matt Arsenault <arsenm2@gmail.com> 2020-03-09 23:42:17 -0400
commit: 627bb31a28a53ba2952c8d0fc3d7aadb0b76c58f (patch)
tree: 7de4d039f60cba6815d07ac6f3455bb1c37f06d8 /llvm/lib
parent: ed72bcae3467f6a3874ddad13c9212ebce818150 (diff)
download: llvm-627bb31a28a53ba2952c8d0fc3d7aadb0b76c58f.zip
llvm-627bb31a28a53ba2952c8d0fc3d7aadb0b76c58f.tar.gz
llvm-627bb31a28a53ba2952c8d0fc3d7aadb0b76c58f.tar.bz2
1 files changed, 13 insertions, 9 deletions
diff --git a/llvm/lib/Target/AMDGPU/AMDGPURegisterBankInfo.cpp b/llvm/lib/Target/AMDGPU/AMDGPURegisterBankInfo.cpp
index 042fcee..abea934 100644
--- a/llvm/lib/Target/AMDGPU/AMDGPURegisterBankInfo.cpp
+++ b/llvm/lib/Target/AMDGPU/AMDGPURegisterBankInfo.cpp
@@ -2096,20 +2096,24 @@ void AMDGPURegisterBankInfo::applyMappingImpl(
     MachineIRBuilder B(MI);
     ApplyRegBankMapping ApplySALU(*this, MRI, &AMDGPU::SGPRRegBank);
     GISelObserverWrapper Observer(&ApplySALU);
-    LegalizerHelper Helper(*MF, Observer, B);
 
     if (DstTy.isVector()) {
-      // FIXME: Multi-step legalization is awkward here. We're relying on the
-      // fact that widenScalar leaves the instruction in place in this case, and
-      // we have to do it in this order.
-      if (Helper.widenScalar(MI, 0, LLT::vector(2, 32)) !=
-          LegalizerHelper::Legalized)
-        llvm_unreachable("widen scalar should have succeeded");
+      B.setChangeObserver(Observer);
 
-      if (Helper.fewerElementsVector(MI, 0, S32) != LegalizerHelper::Legalized)
-        llvm_unreachable("fewerElementsVector should have succeeded");
+      Register WideSrc0Lo, WideSrc0Hi;
+      Register WideSrc1Lo, WideSrc1Hi;
 
+      std::tie(WideSrc0Lo, WideSrc0Hi)
+        = unpackV2S16ToS32(B, MI.getOperand(1).getReg(), AMDGPU::G_ANYEXT);
+      std::tie(WideSrc1Lo, WideSrc1Hi)
+        = unpackV2S16ToS32(B, MI.getOperand(2).getReg(), AMDGPU::G_ANYEXT);
+      auto Lo = B.buildInstr(MI.getOpcode(), {S32}, {WideSrc0Lo, WideSrc1Lo});
+      auto Hi = B.buildInstr(MI.getOpcode(), {S32}, {WideSrc0Hi, WideSrc1Hi});
+      B.buildBuildVectorTrunc(DstReg, {Lo.getReg(0), Hi.getReg(0)});
+      MI.eraseFromParent();
     } else {
+      LegalizerHelper Helper(*MF, Observer, B);
+
       if (Helper.widenScalar(MI, 0, S32) != LegalizerHelper::Legalized)
         llvm_unreachable("widen scalar should have succeeded");
     }
author	Matt Arsenault <Matthew.Arsenault@amd.com>	2020-02-19 12:54:35 -0500
committer	Matt Arsenault <arsenm2@gmail.com>	2020-03-09 23:42:17 -0400
commit	627bb31a28a53ba2952c8d0fc3d7aadb0b76c58f (patch)
tree	7de4d039f60cba6815d07ac6f3455bb1c37f06d8 /llvm/lib
parent	ed72bcae3467f6a3874ddad13c9212ebce818150 (diff)
download	llvm-627bb31a28a53ba2952c8d0fc3d7aadb0b76c58f.zip llvm-627bb31a28a53ba2952c8d0fc3d7aadb0b76c58f.tar.gz llvm-627bb31a28a53ba2952c8d0fc3d7aadb0b76c58f.tar.bz2