doxygen/AMDGPURegBankLegalize_8cpp_source.html

//===-- AMDGPURegBankLegalize.cpp -----------------------------------------===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

//

/// Lower G_ instructions that can't be inst-selected with register bank

/// assignment from AMDGPURegBankSelect based on machine uniformity info.

/// Given types on all operands, some register bank assignments require lowering

/// while others do not.

/// Note: cases where all register bank assignments would require lowering are

/// lowered in legalizer.

/// For example vgpr S64 G_AND requires lowering to S32 while sgpr S64 does not.

/// Eliminate sgpr S1 by lowering to sgpr S32.

//

//===----------------------------------------------------------------------===//


#include "AMDGPU.h"

#include "AMDGPUGlobalISelUtils.h"

#include "AMDGPURegBankLegalizeHelper.h"

#include "GCNSubtarget.h"

#include "llvm/CodeGen/GlobalISel/CSEInfo.h"

#include "llvm/CodeGen/GlobalISel/CSEMIRBuilder.h"

#include "llvm/CodeGen/GlobalISel/GenericMachineInstrs.h"

#include "llvm/CodeGen/GlobalISel/MIPatternMatch.h"

#include "llvm/CodeGen/GlobalISel/Utils.h"

#include "llvm/CodeGen/MachineFunctionPass.h"

#include "llvm/CodeGen/MachineUniformityAnalysis.h"

#include "llvm/CodeGen/TargetPassConfig.h"

#include "llvm/InitializePasses.h"


#define DEBUG_TYPE "amdgpu-regbanklegalize"


using namespace llvm;

using namespace AMDGPU;

using namespace llvm::MIPatternMatch;


namespace {


// AMDGPU-specific pattern matchers

template <typename SrcTy>

inline UnaryOp_match<SrcTy, AMDGPU::G_AMDGPU_READANYLANE>

m_GAMDGPUReadAnyLane(const SrcTy &Src) {

  return UnaryOp_match<SrcTy, AMDGPU::G_AMDGPU_READANYLANE>(Src);

}


class AMDGPURegBankLegalize : public MachineFunctionPass {

public:

  static char ID;


public:

  AMDGPURegBankLegalize() : MachineFunctionPass(ID) {}


  bool runOnMachineFunction(MachineFunction &MF) override;


  StringRef getPassName() const override {

    return "AMDGPU Register Bank Legalize";

  }


  void getAnalysisUsage(AnalysisUsage &AU) const override {

    AU.addRequired<TargetPassConfig>();

    AU.addRequired<GISelCSEAnalysisWrapperPass>();

    AU.addRequired<MachineUniformityAnalysisPass>();

    MachineFunctionPass::getAnalysisUsage(AU);

  }


  // If there were no phis and we do waterfall expansion machine verifier would

  // fail.

  MachineFunctionProperties getClearedProperties() const override {

    return MachineFunctionProperties().setNoPHIs();

  }

};


} // End anonymous namespace.


INITIALIZE_PASS_BEGIN(AMDGPURegBankLegalize, DEBUG_TYPE,

                      "AMDGPU Register Bank Legalize", false, false)

INITIALIZE_PASS_DEPENDENCY(TargetPassConfig)

INITIALIZE_PASS_DEPENDENCY(GISelCSEAnalysisWrapperPass)

INITIALIZE_PASS_DEPENDENCY(MachineUniformityAnalysisPass)

INITIALIZE_PASS_END(AMDGPURegBankLegalize, DEBUG_TYPE,

                    "AMDGPU Register Bank Legalize", false, false)


char AMDGPURegBankLegalize::ID = 0;


char &llvm::AMDGPURegBankLegalizeID = AMDGPURegBankLegalize::ID;


FunctionPass *llvm::createAMDGPURegBankLegalizePass() {

  return new AMDGPURegBankLegalize();

}


const RegBankLegalizeRules &getRules(const GCNSubtarget &ST,

                                     MachineRegisterInfo &MRI) {

  static std::mutex GlobalMutex;

  static SmallDenseMap<unsigned, std::unique_ptr<RegBankLegalizeRules>>

      CacheForRuleSet;

  std::lock_guard<std::mutex> Lock(GlobalMutex);

  auto [It, Inserted] = CacheForRuleSet.try_emplace(ST.getGeneration());

  if (Inserted)

    It->second = std::make_unique<RegBankLegalizeRules>(ST, MRI);

  else

    It->second->refreshRefs(ST, MRI);

  return *It->second;

}


class AMDGPURegBankLegalizeCombiner {

  MachineIRBuilder &B;

  MachineRegisterInfo &MRI;

  const SIRegisterInfo &TRI;

  const RegisterBank *SgprRB;

  const RegisterBank *VgprRB;

  const RegisterBank *VccRB;


  static constexpr LLT S1 = LLT::scalar(1);

  static constexpr LLT S16 = LLT::scalar(16);

  static constexpr LLT S32 = LLT::scalar(32);

  static constexpr LLT S64 = LLT::scalar(64);


public:


  AMDGPURegBankLegalizeCombiner(MachineIRBuilder &B, const SIRegisterInfo &TRI,

                                const RegisterBankInfo &RBI)

      : B(B), MRI(*B.getMRI()), TRI(TRI),

        SgprRB(&RBI.getRegBank(AMDGPU::SGPRRegBankID)),

        VgprRB(&RBI.getRegBank(AMDGPU::VGPRRegBankID)),

        VccRB(&RBI.getRegBank(AMDGPU::VCCRegBankID)) {};


  bool isLaneMask(Register Reg);

  std::pair<MachineInstr *, Register> tryMatch(Register Src, unsigned Opcode);

  Register tryMatchUnmergeDefs(SmallVectorImpl<Register> &DefRegs);

  SmallVector<Register> tryMatchMergeReadAnyLane(GMergeLikeInstr *Merge);

  SmallVector<Register> getReadAnyLaneSrcs(Register Src);

  void replaceRegWithOrBuildCopy(Register Dst, Register Src);


  bool tryEliminateReadAnyLane(MachineInstr &Copy);

  void tryCombineCopy(MachineInstr &MI);

  void tryCombineS1AnyExt(MachineInstr &MI);

};


bool AMDGPURegBankLegalizeCombiner::isLaneMask(Register Reg) {

  const RegisterBank *RB = MRI.getRegBankOrNull(Reg);

  if (RB && RB->getID() == AMDGPU::VCCRegBankID)

    return true;


  const TargetRegisterClass *RC = MRI.getRegClassOrNull(Reg);

  return RC && TRI.isSGPRClass(RC) && MRI.getType(Reg) == LLT::scalar(1);

}


std::pair<MachineInstr *, Register>


AMDGPURegBankLegalizeCombiner::tryMatch(Register Src, unsigned Opcode) {

  MachineInstr *MatchMI = MRI.getVRegDef(Src);

  if (MatchMI->getOpcode() != Opcode)

    return {nullptr, Register()};

  return {MatchMI, MatchMI->getOperand(1).getReg()};

}


// Check if all registers are from same unmerge and there is no shuffling.

// Returns the unmerge source if both conditions are met.


Register AMDGPURegBankLegalizeCombiner::tryMatchUnmergeDefs(

    SmallVectorImpl<Register> &DefRegs) {

  auto *UnMerge = getOpcodeDef<GUnmerge>(DefRegs[0], MRI);

  if (!UnMerge || UnMerge->getNumDefs() != DefRegs.size())

    return {};

  for (unsigned I = 1; I < DefRegs.size(); ++I) {

    if (UnMerge->getReg(I) != DefRegs[I])

      return {};

  }

  return UnMerge->getSourceReg();

}


// Check if all merge sources are readanylanes and return the readanylane

// sources if they are.


SmallVector<Register> AMDGPURegBankLegalizeCombiner::tryMatchMergeReadAnyLane(

    GMergeLikeInstr *Merge) {

  SmallVector<Register> ReadAnyLaneSrcs;

  for (unsigned i = 0; i < Merge->getNumSources(); ++i) {

    Register Src;

    if (!mi_match(Merge->getSourceReg(i), MRI,

                  m_GAMDGPUReadAnyLane(m_Reg(Src))))

      return {};

    ReadAnyLaneSrcs.push_back(Src);

  }

  return ReadAnyLaneSrcs;

}


SmallVector<Register>


AMDGPURegBankLegalizeCombiner::getReadAnyLaneSrcs(Register Src) {

  // Src = G_AMDGPU_READANYLANE RALSrc

  Register RALSrc;

  if (mi_match(Src, MRI, m_GAMDGPUReadAnyLane(m_Reg(RALSrc))))

    return {RALSrc};


  // RALSrc = G_ANYEXT S16Src

  // TruncSrc = G_AMDGPU_READANYLANE RALSrc

  // Src = G_TRUNC TruncSrc

  if (mi_match(Src, MRI,

               m_GTrunc(m_GAMDGPUReadAnyLane(m_GAnyExt(m_Reg(RALSrc)))))) {

    return {RALSrc};

  }


  // TruncSrc = G_AMDGPU_READANYLANE RALSrc

  // AextSrc = G_TRUNC TruncSrc

  // Src = G_ANYEXT AextSrc

  if (mi_match(Src, MRI,

               m_GAnyExt(m_GTrunc(m_GAMDGPUReadAnyLane(m_Reg(RALSrc)))))) {

    return {RALSrc};

  }


  // Sgpr0 = G_AMDGPU_READANYLANE Vgpr0

  // Sgpr1 = G_AMDGPU_READANYLANE Vgpr1

  // ...

  // Src = G_MERGE_LIKE Sgpr0, Sgpr1, ...

  // Dst = COPY Src

  if (auto *Merge = getOpcodeDef<GMergeLikeInstr>(Src, MRI)) {

    SmallVector<Register> ReadAnyLaneSrcs = tryMatchMergeReadAnyLane(Merge);

    if (ReadAnyLaneSrcs.empty())

      return {};


    // Vgpr0, Vgpr1, ... = G_UNMERGE_VALUES UnmergeSrc

    if (Register UnmergeSrc = tryMatchUnmergeDefs(ReadAnyLaneSrcs))

      return {UnmergeSrc};


    // Multiple ReadAnyLane vgpr sources, need to merge Vgpr0, Vgpr1, ...

    return ReadAnyLaneSrcs;

  }


  // SrcRegIdx = G_AMDGPU_READANYLANE RALElSrc

  // SourceReg G_MERGE_VALUES ..., SrcRegIdx, ...

  // ..., Src, ... = G_UNMERGE_VALUES SourceReg

  auto *UnMerge = getOpcodeDef<GUnmerge>(Src, MRI);

  if (!UnMerge)

    return {};


  int Idx = UnMerge->findRegisterDefOperandIdx(Src, nullptr);

  auto *Merge = getOpcodeDef<GMergeLikeInstr>(UnMerge->getSourceReg(), MRI);

  if (!Merge || UnMerge->getNumDefs() != Merge->getNumSources())

    return {};


  Register SrcRegIdx = Merge->getSourceReg(Idx);

  if (MRI.getType(Src) != MRI.getType(SrcRegIdx))

    return {};


  auto [RALEl, RALElSrc] = tryMatch(SrcRegIdx, AMDGPU::G_AMDGPU_READANYLANE);

  if (RALEl)

    return {RALElSrc};


  return {};

}


void AMDGPURegBankLegalizeCombiner::replaceRegWithOrBuildCopy(Register Dst,

                                                              Register Src) {

  if (Dst.isVirtual())

    MRI.replaceRegWith(Dst, Src);

  else

    B.buildCopy(Dst, Src);

}


bool AMDGPURegBankLegalizeCombiner::tryEliminateReadAnyLane(

    MachineInstr &Copy) {

  Register Dst = Copy.getOperand(0).getReg();

  Register Src = Copy.getOperand(1).getReg();


  // Skip non-vgpr Dst

  if (Dst.isVirtual() ? (MRI.getRegBankOrNull(Dst) != VgprRB)

                      : !TRI.isVGPR(MRI, Dst))

    return false;


  // Skip physical source registers and source registers with register class

  if (!Src.isVirtual() || MRI.getRegClassOrNull(Src))

    return false;


  Register RALDst = Src;

  MachineInstr &SrcMI = *MRI.getVRegDef(Src);

  if (SrcMI.getOpcode() == AMDGPU::G_BITCAST)

    RALDst = SrcMI.getOperand(1).getReg();


  B.setInstrAndDebugLoc(Copy);

  SmallVector<Register> ReadAnyLaneSrcRegs = getReadAnyLaneSrcs(RALDst);

  if (ReadAnyLaneSrcRegs.empty())

    return false;


  Register ReadAnyLaneSrc;

  if (ReadAnyLaneSrcRegs.size() == 1) {

    ReadAnyLaneSrc = ReadAnyLaneSrcRegs[0];

  } else {

    // Multiple readanylane sources without a common unmerge, merge them.

    auto Merge = B.buildMergeLikeInstr({VgprRB, MRI.getType(RALDst)},

                                       ReadAnyLaneSrcRegs);

    ReadAnyLaneSrc = Merge.getReg(0);

  }


  if (SrcMI.getOpcode() != AMDGPU::G_BITCAST) {

    // Src = READANYLANE RALSrc     Src = READANYLANE RALSrc

    // Dst = Copy Src               $Dst = Copy Src

    // ->                           ->

    // Dst = RALSrc                 $Dst = Copy RALSrc

    replaceRegWithOrBuildCopy(Dst, ReadAnyLaneSrc);

  } else {

    // RALDst = READANYLANE RALSrc  RALDst = READANYLANE RALSrc

    // Src = G_BITCAST RALDst       Src = G_BITCAST RALDst

    // Dst = Copy Src               Dst = Copy Src

    // ->                          ->

    // NewVgpr = G_BITCAST RALDst   NewVgpr = G_BITCAST RALDst

    // Dst = NewVgpr                $Dst = Copy NewVgpr

    auto Bitcast = B.buildBitcast({VgprRB, MRI.getType(Src)}, ReadAnyLaneSrc);

    replaceRegWithOrBuildCopy(Dst, Bitcast.getReg(0));

  }


  eraseInstr(Copy, MRI);

  return true;

}


void AMDGPURegBankLegalizeCombiner::tryCombineCopy(MachineInstr &MI) {

  if (tryEliminateReadAnyLane(MI))

    return;


  Register Dst = MI.getOperand(0).getReg();

  Register Src = MI.getOperand(1).getReg();

  // Skip copies of physical registers.

  if (!Dst.isVirtual() || !Src.isVirtual())

    return;


  // This is a cross bank copy, sgpr S1 to lane mask.

  //

  // %Src:sgpr(s1) = G_TRUNC %TruncS32Src:sgpr(s32)

  // %Dst:lane-mask(s1) = COPY %Src:sgpr(s1)

  // ->

  // %BoolSrc:sgpr(s32) = G_AND %TruncS32Src:sgpr(s32), 1

  // %Dst:lane-mask(s1) = G_AMDGPU_COPY_VCC_SCC %BoolSrc:sgpr(s32)

  if (isLaneMask(Dst) && MRI.getRegBankOrNull(Src) == SgprRB) {

    auto [Trunc, TruncS32Src] = tryMatch(Src, AMDGPU::G_TRUNC);

    assert(Trunc && MRI.getType(TruncS32Src) == S32 &&

           "sgpr S1 must be result of G_TRUNC of sgpr S32");


    B.setInstr(MI);

    // Ensure that truncated bits in BoolSrc are 0.

    auto One = B.buildConstant({SgprRB, S32}, 1);

    auto BoolSrc = B.buildAnd({SgprRB, S32}, TruncS32Src, One);

    B.buildInstr(AMDGPU::G_AMDGPU_COPY_VCC_SCC, {Dst}, {BoolSrc});

    eraseInstr(MI, MRI);

  }

}


void AMDGPURegBankLegalizeCombiner::tryCombineS1AnyExt(MachineInstr &MI) {

  // %Src:sgpr(S1) = G_TRUNC %TruncSrc

  // %Dst = G_ANYEXT %Src:sgpr(S1)

  // ->

  // %Dst = G_... %TruncSrc

  Register Dst = MI.getOperand(0).getReg();

  Register Src = MI.getOperand(1).getReg();

  if (MRI.getType(Src) != S1)

    return;


  auto [Trunc, TruncSrc] = tryMatch(Src, AMDGPU::G_TRUNC);

  if (!Trunc)

    return;


  LLT DstTy = MRI.getType(Dst);

  LLT TruncSrcTy = MRI.getType(TruncSrc);


  if (DstTy == TruncSrcTy) {

    MRI.replaceRegWith(Dst, TruncSrc);

    eraseInstr(MI, MRI);

    return;

  }


  B.setInstr(MI);


  if (DstTy == S32 && TruncSrcTy == S64) {

    auto Unmerge = B.buildUnmerge({SgprRB, S32}, TruncSrc);

    MRI.replaceRegWith(Dst, Unmerge.getReg(0));

    eraseInstr(MI, MRI);

    return;

  }


  if (DstTy == S64 && TruncSrcTy == S32) {

    B.buildMergeLikeInstr(MI.getOperand(0).getReg(),

                          {TruncSrc, B.buildUndef({SgprRB, S32})});

    eraseInstr(MI, MRI);

    return;

  }


  if (DstTy == S32 && TruncSrcTy == S16) {

    B.buildAnyExt(Dst, TruncSrc);

    eraseInstr(MI, MRI);

    return;

  }


  if (DstTy == S16 && TruncSrcTy == S32) {

    B.buildTrunc(Dst, TruncSrc);

    eraseInstr(MI, MRI);

    return;

  }


  llvm_unreachable("missing anyext + trunc combine");

}


// Search through MRI for virtual registers with sgpr register bank and S1 LLT.


[[maybe_unused]] static Register getAnySgprS1(const MachineRegisterInfo &MRI) {

  const LLT S1 = LLT::scalar(1);

  for (unsigned i = 0; i < MRI.getNumVirtRegs(); ++i) {

    Register Reg = Register::index2VirtReg(i);

    if (MRI.def_empty(Reg) || MRI.getType(Reg) != S1)

      continue;


    const RegisterBank *RB = MRI.getRegBankOrNull(Reg);

    if (RB && RB->getID() == AMDGPU::SGPRRegBankID) {

      LLVM_DEBUG(dbgs() << "Warning: detected sgpr S1 register in: ";

                 MRI.getVRegDef(Reg)->dump(););

      return Reg;

    }

  }


  return {};

}


bool AMDGPURegBankLegalize::runOnMachineFunction(MachineFunction &MF) {

  if (MF.getProperties().hasFailedISel())

    return false;


  // Setup the instruction builder with CSE.

  const TargetPassConfig &TPC = getAnalysis<TargetPassConfig>();

  GISelCSEAnalysisWrapper &Wrapper =

      getAnalysis<GISelCSEAnalysisWrapperPass>().getCSEWrapper();

  GISelCSEInfo &CSEInfo = Wrapper.get(TPC.getCSEConfig());

  GISelObserverWrapper Observer;

  Observer.addObserver(&CSEInfo);


  CSEMIRBuilder B(MF);

  B.setCSEInfo(&CSEInfo);

  B.setChangeObserver(Observer);


  RAIIDelegateInstaller DelegateInstaller(MF, &Observer);

  RAIIMFObserverInstaller MFObserverInstaller(MF, Observer);


  const GCNSubtarget &ST = MF.getSubtarget<GCNSubtarget>();

  MachineRegisterInfo &MRI = MF.getRegInfo();

  const RegisterBankInfo &RBI = *ST.getRegBankInfo();

  const MachineUniformityInfo &MUI =

      getAnalysis<MachineUniformityAnalysisPass>().getUniformityInfo();


  // RegBankLegalizeRules is initialized with assigning sets of IDs to opcodes.

  const RegBankLegalizeRules &RBLRules = getRules(ST, MRI);


  // Logic that does legalization based on IDs assigned to Opcode.

  RegBankLegalizeHelper RBLHelper(B, MUI, RBI, RBLRules);


  SmallVector<MachineInstr *> AllInst;


  for (MachineBasicBlock &MBB : MF) {

    for (MachineInstr &MI : MBB) {

      AllInst.push_back(&MI);

    }

  }


  for (MachineInstr *MI : AllInst) {

    if (!MI->isPreISelOpcode())

      continue;


    unsigned Opc = MI->getOpcode();

    // Insert point for use operands needs some calculation.

    if (Opc == AMDGPU::G_PHI) {

      if (!RBLHelper.applyMappingPHI(*MI))

        return false;

      continue;

    }


    // Opcodes that support pretty much all combinations of reg banks and LLTs

    // (except S1). There is no point in writing rules for them.

    if (Opc == AMDGPU::G_BUILD_VECTOR || Opc == AMDGPU::G_UNMERGE_VALUES ||

        Opc == AMDGPU::G_MERGE_VALUES || Opc == AMDGPU::G_CONCAT_VECTORS ||

        Opc == AMDGPU::G_BITCAST) {

      RBLHelper.applyMappingTrivial(*MI);

      continue;

    }


    // Opcodes that also support S1.

    if (Opc == G_FREEZE &&

        MRI.getType(MI->getOperand(0).getReg()) != LLT::scalar(1)) {

      RBLHelper.applyMappingTrivial(*MI);

      continue;

    }


    if ((Opc == AMDGPU::G_CONSTANT || Opc == AMDGPU::G_FCONSTANT ||

         Opc == AMDGPU::G_IMPLICIT_DEF)) {

      Register Dst = MI->getOperand(0).getReg();

      // Non S1 types are trivially accepted.

      if (MRI.getType(Dst) != LLT::scalar(1)) {

        assert(MRI.getRegBank(Dst)->getID() == AMDGPU::SGPRRegBankID);

        continue;

      }


      // S1 rules are in RegBankLegalizeRules.

    }


    if (!RBLHelper.findRuleAndApplyMapping(*MI))

      return false;

  }


  // Sgpr S1 clean up combines:

  // - Sgpr S1(S32) to sgpr S1(S32) Copy: anyext + trunc combine.

  //   In RegBankLegalize 'S1 Dst' are legalized into S32 as

  //   'S1Dst = Trunc S32Dst' and 'S1 Src' into 'S32Src = Anyext S1Src'.

  //   S1 Truncs and Anyexts that come from legalizer, that can have non-S32

  //   types e.g. S16 = Anyext S1 or S1 = Trunc S64, will also be cleaned up.

  // - Sgpr S1(S32) to vcc Copy: G_AMDGPU_COPY_VCC_SCC combine.

  //   Divergent instruction uses sgpr S1 as input that should be lane mask(vcc)

  //   Legalizing this use creates sgpr S1(S32) to vcc Copy.


  // Note: Remaining S1 copies, S1s are either sgpr S1(S32) or vcc S1:

  // - Vcc to vcc Copy: nothing to do here, just a regular copy.

  // - Vcc to sgpr S1 Copy: Should not exist in a form of COPY instruction(*).

  //   Note: For 'uniform-in-vcc to sgpr-S1 copy' G_AMDGPU_COPY_SCC_VCC is used

  //   instead. When only available instruction creates vcc result, use of

  //   UniformInVcc results in creating G_AMDGPU_COPY_SCC_VCC.


  // (*)Explanation for 'sgpr S1(uniform) = COPY vcc(divergent)':

  // Copy from divergent to uniform register indicates an error in either:

  // - Uniformity analysis: Uniform instruction has divergent input. If one of

  //   the inputs is divergent, instruction should be divergent!

  // - RegBankLegalizer not executing in waterfall loop (missing implementation)


  AMDGPURegBankLegalizeCombiner Combiner(B, *ST.getRegisterInfo(), RBI);


  for (MachineBasicBlock &MBB : MF) {

    for (MachineInstr &MI : make_early_inc_range(MBB)) {

      if (MI.getOpcode() == AMDGPU::COPY) {

        Combiner.tryCombineCopy(MI);

        continue;

      }

      if (MI.getOpcode() == AMDGPU::G_ANYEXT) {

        Combiner.tryCombineS1AnyExt(MI);

        continue;

      }

    }

  }


  assert(!getAnySgprS1(MRI).isValid() &&

         "Registers with sgpr reg bank and S1 LLT are not legal after "

         "AMDGPURegBankLegalize. Should lower to sgpr S32");


  return true;

}

MRI
unsigned const MachineRegisterInfo * MRI
Definition AArch64AdvSIMDScalarPass.cpp:103

assert
assert(UImm &&(UImm !=~static_cast< T >(0)) &&"Invalid immediate!")

Wrapper
amdgpu aa AMDGPU Address space based Alias Analysis Wrapper
Definition AMDGPUAliasAnalysis.cpp:31

AMDGPUGlobalISelUtils.h

S16
constexpr LLT S16
Definition AMDGPULegalizerInfo.cpp:297

S1
constexpr LLT S1
Definition AMDGPULegalizerInfo.cpp:295

S32
constexpr LLT S32
Definition AMDGPULegalizerInfo.cpp:298

AMDGPURegBankLegalizeHelper.h

getAnySgprS1
static Register getAnySgprS1(const MachineRegisterInfo &MRI)
Definition AMDGPURegBankLegalize.cpp:400

getRules
const RegBankLegalizeRules & getRules(const GCNSubtarget &ST, MachineRegisterInfo &MRI)
Definition AMDGPURegBankLegalize.cpp:94

AMDGPU.h

MBB
MachineBasicBlock & MBB
Definition ARMSLSHardening.cpp:71

B
static GCRegistry::Add< OcamlGC > B("ocaml", "ocaml 3.10-compatible GC")

CSEInfo.h
Provides analysis for continuously CSEing during GISel passes.

CSEMIRBuilder.h
This file implements a version of MachineIRBuilder which CSEs insts within a MachineBasicBlock.

Utils.h

GCNSubtarget.h
AMD GCN specific subclass of TargetSubtarget.

DEBUG_TYPE
#define DEBUG_TYPE
Definition GenericCycleImpl.h:31

GenericMachineInstrs.h
Declares convenience wrapper classes for interpreting MachineInstr instances as specific generic oper...

MI
IRTranslator LLVM IR MI
Definition IRTranslator.cpp:110

InitializePasses.h

I
#define I(x, y, z)
Definition MD5.cpp:57

MIPatternMatch.h
Contains matchers for matching SSA Machine Instructions.

MachineFunctionPass.h

Reg
Register Reg
Definition MachineSink.cpp:2119

MachineUniformityAnalysis.h
Machine IR instance of the generic uniformity analysis.

Register
Promote Memory to Register
Definition Mem2Reg.cpp:110

INITIALIZE_PASS_DEPENDENCY
#define INITIALIZE_PASS_DEPENDENCY(depName)
Definition PassSupport.h:42

INITIALIZE_PASS_END
#define INITIALIZE_PASS_END(passName, arg, name, cfg, analysis)
Definition PassSupport.h:44

INITIALIZE_PASS_BEGIN
#define INITIALIZE_PASS_BEGIN(passName, arg, name, cfg, analysis)
Definition PassSupport.h:39

Merge
R600 Clause Merge
Definition R600ClauseMergePass.cpp:70

Opc
auto Opc
Definition RISCVRedundantCopyElimination.cpp:77

isValid
static bool isValid(const char C)
Returns true if C is a valid mangled character: <0-9a-zA-Z_>.
Definition RustDemangle.cpp:181

LLVM_DEBUG
#define LLVM_DEBUG(...)
Definition Debug.h:114

TargetPassConfig.h
Target-Independent Code Generator Pass Configuration Options pass.

AMDGPURegBankLegalizeCombiner::tryMatchUnmergeDefs
Register tryMatchUnmergeDefs(SmallVectorImpl< Register > &DefRegs)
Definition AMDGPURegBankLegalize.cpp:160

AMDGPURegBankLegalizeCombiner::replaceRegWithOrBuildCopy
void replaceRegWithOrBuildCopy(Register Dst, Register Src)
Definition AMDGPURegBankLegalize.cpp:251

AMDGPURegBankLegalizeCombiner::AMDGPURegBankLegalizeCombiner
AMDGPURegBankLegalizeCombiner(MachineIRBuilder &B, const SIRegisterInfo &TRI, const RegisterBankInfo &RBI)
Definition AMDGPURegBankLegalize.cpp:122

AMDGPURegBankLegalizeCombiner::isLaneMask
bool isLaneMask(Register Reg)
Definition AMDGPURegBankLegalize.cpp:141

AMDGPURegBankLegalizeCombiner::tryCombineS1AnyExt
void tryCombineS1AnyExt(MachineInstr &MI)
Definition AMDGPURegBankLegalize.cpp:345

AMDGPURegBankLegalizeCombiner::tryMatch
std::pair< MachineInstr *, Register > tryMatch(Register Src, unsigned Opcode)
Definition AMDGPURegBankLegalize.cpp:151

AMDGPURegBankLegalizeCombiner::tryMatchMergeReadAnyLane
SmallVector< Register > tryMatchMergeReadAnyLane(GMergeLikeInstr *Merge)
Definition AMDGPURegBankLegalize.cpp:174

AMDGPURegBankLegalizeCombiner::tryCombineCopy
void tryCombineCopy(MachineInstr &MI)
Definition AMDGPURegBankLegalize.cpp:314

AMDGPURegBankLegalizeCombiner::tryEliminateReadAnyLane
bool tryEliminateReadAnyLane(MachineInstr &Copy)
Definition AMDGPURegBankLegalize.cpp:259

AMDGPURegBankLegalizeCombiner::getReadAnyLaneSrcs
SmallVector< Register > getReadAnyLaneSrcs(Register Src)
Definition AMDGPURegBankLegalize.cpp:188

llvm::AMDGPU::RegBankLegalizeRules
Definition AMDGPURegBankLegalizeRules.h:323

llvm::AnalysisUsage
Represent the analysis usage information of a pass.
Definition PassAnalysisSupport.h:48

llvm::AnalysisUsage::addRequired
AnalysisUsage & addRequired()
Definition PassAnalysisSupport.h:76

llvm::DenseMapBase::try_emplace
std::pair< iterator, bool > try_emplace(KeyT &&Key, Ts &&...Args)
Definition DenseMap.h:256

llvm::FunctionPass
FunctionPass class - This class is used to implement most global optimizations.
Definition Pass.h:314

llvm::GCNSubtarget
Definition GCNSubtarget.h:34

llvm::GISelCSEAnalysisWrapperPass
The actual analysis pass wrapper.
Definition CSEInfo.h:229

llvm::GISelObserverWrapper::addObserver
void addObserver(GISelChangeObserver *O)
Definition GISelChangeObserver.h:75

llvm::GMergeLikeInstr
Represents G_BUILD_VECTOR, G_CONCAT_VECTORS or G_MERGE_VALUES.
Definition GenericMachineInstrs.h:267

llvm::LLT
Definition LowLevelType.h:40

llvm::LLT::scalar
static constexpr LLT scalar(unsigned SizeInBits)
Get a low-level scalar or aggregate "bag of bits".
Definition LowLevelType.h:43

llvm::MachineFunctionPass
MachineFunctionPass - This class adapts the FunctionPass interface to allow convenient creation of pa...
Definition MachineFunctionPass.h:31

llvm::MachineFunctionPass::getAnalysisUsage
void getAnalysisUsage(AnalysisUsage &AU) const override
getAnalysisUsage - Subclasses that override getAnalysisUsage must call this.
Definition MachineFunctionPass.cpp:184

llvm::MachineFunctionProperties
Properties which a MachineFunction may have at a given point in time.
Definition MachineFunction.h:137

llvm::MachineFunction
Definition MachineFunction.h:294

llvm::MachineFunction::getSubtarget
const TargetSubtargetInfo & getSubtarget() const
getSubtarget - Return the subtarget for which this machine code is being compiled.
Definition MachineFunction.h:770

llvm::MachineFunction::getRegInfo
MachineRegisterInfo & getRegInfo()
getRegInfo - Return information about the registers currently in use.
Definition MachineFunction.h:780

llvm::MachineFunction::getProperties
const MachineFunctionProperties & getProperties() const
Get the function properties.
Definition MachineFunction.h:861

llvm::MachineIRBuilder
Helper class to build MachineInstr.
Definition MachineIRBuilder.h:237

llvm::MachineInstr
Representation of each machine instruction.
Definition MachineInstr.h:72

llvm::MachineInstr::getOpcode
unsigned getOpcode() const
Returns the opcode of this MachineInstr.
Definition MachineInstr.h:599

llvm::MachineInstr::getOperand
const MachineOperand & getOperand(unsigned i) const
Definition MachineInstr.h:607

llvm::MachineOperand::getReg
Register getReg() const
getReg - Returns the register number.
Definition MachineOperand.h:372

llvm::MachineRegisterInfo
MachineRegisterInfo - Keep track of information for virtual and physical registers,...
Definition MachineRegisterInfo.h:53

llvm::MachineUniformityAnalysisPass
Legacy analysis pass which computes a MachineUniformityInfo.
Definition MachineUniformityAnalysis.h:37

llvm::RegisterBankInfo
Holds all the information related to register banks.
Definition RegisterBankInfo.h:40

llvm::RegisterBank
This class implements the register bank concept.
Definition RegisterBank.h:29

llvm::RegisterBank::getID
unsigned getID() const
Get the identifier of this register bank.
Definition RegisterBank.h:46

llvm::Register
Wrapper class representing virtual and physical registers.
Definition Register.h:20

llvm::Register::index2VirtReg
static Register index2VirtReg(unsigned Index)
Convert a 0-based index to a virtual register number.
Definition Register.h:72

llvm::SIRegisterInfo
Definition SIRegisterInfo.h:40

llvm::SmallDenseMap
Definition DenseMap.h:877

llvm::SmallVectorImpl
This class consists of common code factored out of the SmallVector class to reduce code duplication b...
Definition SmallVector.h:576

llvm::SmallVectorTemplateBase::push_back
void push_back(const T &Elt)
Definition SmallVector.h:419

llvm::SmallVectorTemplateCommon::size
size_t size() const
Definition SmallVector.h:80

llvm::SmallVectorTemplateCommon::empty
bool empty() const
Definition SmallVector.h:83

llvm::SmallVector
This is a 'vector' (really, a variable-sized array), optimized for the case when the array is small.
Definition SmallVector.h:1205

llvm::StringRef
StringRef - Represent a constant reference to a string, i.e.
Definition StringRef.h:55

llvm::TargetPassConfig
Target-Independent Code Generator Pass Configuration Options.
Definition TargetPassConfig.h:84

llvm::TargetPassConfig::getCSEConfig
virtual std::unique_ptr< CSEConfigBase > getCSEConfig() const
Returns the CSEConfig object to use for the current optimization level.
Definition TargetPassConfig.cpp:1605

llvm::TargetRegisterClass
Definition TargetRegisterInfo.h:45

llvm_unreachable
#define llvm_unreachable(msg)
Marks that the current location is not supposed to be reachable.
Definition ErrorHandling.h:164

false
Definition MachinePipeliner.cpp:245

llvm::AMDGPU
Definition AMDGPUMetadataVerifier.h:34

llvm::ARM_MB::ST
@ ST
Definition ARMBaseInfo.h:73

llvm::CallingConv::ID
unsigned ID
LLVM IR allows to use arbitrary numbers as calling convention identifiers.
Definition CallingConv.h:24

llvm::MIPatternMatch
Definition MIPatternMatch.h:25

llvm::MIPatternMatch::m_Reg
operand_type_match m_Reg()
Definition MIPatternMatch.h:311

llvm::MIPatternMatch::mi_match
bool mi_match(Reg R, const MachineRegisterInfo &MRI, Pattern &&P)
Definition MIPatternMatch.h:28

llvm::MIPatternMatch::m_GAnyExt
UnaryOp_match< SrcTy, TargetOpcode::G_ANYEXT > m_GAnyExt(const SrcTy &Src)
Definition MIPatternMatch.h:696

llvm::MIPatternMatch::m_GTrunc
UnaryOp_match< SrcTy, TargetOpcode::G_TRUNC > m_GTrunc(const SrcTy &Src)
Definition MIPatternMatch.h:716

llvm
This is an optimization pass for GlobalISel generic memory operations.
Definition Types.h:26

llvm::MachineUniformityInfo
GenericUniformityInfo< MachineSSAContext > MachineUniformityInfo
Definition MachineUniformityAnalysis.h:26

llvm::dump
void dump(const SparseBitVector< ElementSize > &LHS, raw_ostream &out)
Definition SparseBitVector.h:874

llvm::getOpcodeDef
LLVM_ABI MachineInstr * getOpcodeDef(unsigned Opcode, Register Reg, const MachineRegisterInfo &MRI)
See if Reg is defined by an single def instruction that is Opcode.
Definition Utils.cpp:654

llvm::make_early_inc_range
iterator_range< early_inc_iterator_impl< detail::IterOfRange< RangeT > > > make_early_inc_range(RangeT &&Range)
Make a range that does early increment to allow mutation of the underlying range without disrupting i...
Definition STLExtras.h:632

llvm::dbgs
LLVM_ABI raw_ostream & dbgs()
dbgs() - This returns a reference to a raw_ostream for debugging messages.
Definition Debug.cpp:207

llvm::SmallVector
class LLVM_GSL_OWNER SmallVector
Forward declaration of SmallVector so that calculateSmallVectorDefaultInlinedElements can reference s...
Definition SmallVector.h:1131

llvm::createAMDGPURegBankLegalizePass
FunctionPass * createAMDGPURegBankLegalizePass()
Definition AMDGPURegBankLegalize.cpp:90

llvm::eraseInstr
LLVM_ABI void eraseInstr(MachineInstr &MI, MachineRegisterInfo &MRI, LostDebugLocObserver *LocObserver=nullptr)
Definition Utils.cpp:1726

llvm::AMDGPURegBankLegalizeID
char & AMDGPURegBankLegalizeID
Definition AMDGPURegBankLegalize.cpp:88

llvm::MIPatternMatch::UnaryOp_match
Definition MIPatternMatch.h:678