GPU/Transforms/ParallelLoopMapper.cpp

*7a7eacc7SStephan Herhut//===- ParallelLoopMapper.cpp - Utilities for mapping parallel loops to GPU =//
*7a7eacc7SStephan Herhut//
*7a7eacc7SStephan Herhut// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
*7a7eacc7SStephan Herhut// See https://llvm.org/LICENSE.txt for license information.
*7a7eacc7SStephan Herhut// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
*7a7eacc7SStephan Herhut//
*7a7eacc7SStephan Herhut//===----------------------------------------------------------------------===//
*7a7eacc7SStephan Herhut//
*7a7eacc7SStephan Herhut// This file implements utilities to generate mappings for parallel loops to
*7a7eacc7SStephan Herhut// GPU devices.
*7a7eacc7SStephan Herhut//
*7a7eacc7SStephan Herhut//===----------------------------------------------------------------------===//
*7a7eacc7SStephan Herhut
*7a7eacc7SStephan Herhut#include "mlir/Dialect/GPU/ParallelLoopMapper.h"
*7a7eacc7SStephan Herhut
*7a7eacc7SStephan Herhut#include "mlir/Dialect/GPU/GPUDialect.h"
*7a7eacc7SStephan Herhut#include "mlir/Dialect/GPU/Passes.h"
*7a7eacc7SStephan Herhut#include "mlir/Dialect/LoopOps/LoopOps.h"
*7a7eacc7SStephan Herhut#include "mlir/IR/AffineMap.h"
*7a7eacc7SStephan Herhut#include "mlir/Pass/Pass.h"
*7a7eacc7SStephan Herhut
*7a7eacc7SStephan Herhutusing namespace mlir;
*7a7eacc7SStephan Herhutusing namespace mlir::gpu;
*7a7eacc7SStephan Herhutusing namespace mlir::loop;
*7a7eacc7SStephan Herhut
*7a7eacc7SStephan Herhutnamespace {
*7a7eacc7SStephan Herhut
*7a7eacc7SStephan Herhutenum MappingLevel { MapGrid = 0, MapBlock = 1, Sequential = 2 };
*7a7eacc7SStephan Herhut
*7a7eacc7SStephan Herhutstatic constexpr int kNumHardwareIds = 3;
*7a7eacc7SStephan Herhut
*7a7eacc7SStephan Herhut} // namespace
*7a7eacc7SStephan Herhut
*7a7eacc7SStephan Herhut/// Bounded increment on MappingLevel. Increments to the next
*7a7eacc7SStephan Herhut/// level unless Sequential was already reached.
*7a7eacc7SStephan HerhutMappingLevel &operator++(MappingLevel &mappingLevel) {
*7a7eacc7SStephan Herhut  if (mappingLevel < Sequential) {
*7a7eacc7SStephan Herhut    mappingLevel = static_cast<MappingLevel>(mappingLevel + 1);
*7a7eacc7SStephan Herhut  }
*7a7eacc7SStephan Herhut  return mappingLevel;
*7a7eacc7SStephan Herhut}
*7a7eacc7SStephan Herhut
*7a7eacc7SStephan Herhut/// Computed the hardware id to use for a given mapping level. Will
*7a7eacc7SStephan Herhut/// assign x,y and z hardware ids for the first 3 dimensions and use
*7a7eacc7SStephan Herhut/// sequential after.
*7a7eacc7SStephan Herhutstatic int64_t getHardwareIdForMapping(MappingLevel level, int dimension) {
*7a7eacc7SStephan Herhut  if (dimension >= kNumHardwareIds || level == Sequential)
*7a7eacc7SStephan Herhut    return Sequential * kNumHardwareIds;
*7a7eacc7SStephan Herhut  return (level * kNumHardwareIds) + dimension;
*7a7eacc7SStephan Herhut}
*7a7eacc7SStephan Herhut
*7a7eacc7SStephan Herhut/// Add mapping information to the given parallel loop. Do not add
*7a7eacc7SStephan Herhut/// mapping information if the loop already has it. Also, don't
*7a7eacc7SStephan Herhut/// start a mapping at a nested loop.
*7a7eacc7SStephan Herhutstatic void mapParallelOp(ParallelOp parallelOp,
*7a7eacc7SStephan Herhut                          MappingLevel mappingLevel = MapGrid) {
*7a7eacc7SStephan Herhut  // Do not try to add a mapping to already mapped loops or nested loops.
*7a7eacc7SStephan Herhut  if (parallelOp.getAttr(gpu::kMappingAttributeName) ||
*7a7eacc7SStephan Herhut      ((mappingLevel == MapGrid) && parallelOp.getParentOfType<ParallelOp>()))
*7a7eacc7SStephan Herhut    return;
*7a7eacc7SStephan Herhut
*7a7eacc7SStephan Herhut  MLIRContext *ctx = parallelOp.getContext();
*7a7eacc7SStephan Herhut  Builder b(ctx);
*7a7eacc7SStephan Herhut  SmallVector<Attribute, 4> attrs;
*7a7eacc7SStephan Herhut  attrs.reserve(parallelOp.getNumInductionVars());
*7a7eacc7SStephan Herhut  for (int i = 0, e = parallelOp.getNumInductionVars(); i < e; ++i) {
*7a7eacc7SStephan Herhut    SmallVector<NamedAttribute, 3> entries;
*7a7eacc7SStephan Herhut    entries.emplace_back(b.getNamedAttr(
*7a7eacc7SStephan Herhut        kProcessorEntryName,
*7a7eacc7SStephan Herhut        b.getI64IntegerAttr(getHardwareIdForMapping(mappingLevel, i))));
*7a7eacc7SStephan Herhut    entries.emplace_back(b.getNamedAttr(
*7a7eacc7SStephan Herhut        kIndexMapEntryName, AffineMapAttr::get(b.getDimIdentityMap())));
*7a7eacc7SStephan Herhut    entries.emplace_back(b.getNamedAttr(
*7a7eacc7SStephan Herhut        kBoundMapEntryName, AffineMapAttr::get(b.getDimIdentityMap())));
*7a7eacc7SStephan Herhut    attrs.push_back(DictionaryAttr::get(entries, ctx));
*7a7eacc7SStephan Herhut  }
*7a7eacc7SStephan Herhut  parallelOp.setAttr(kMappingAttributeName, ArrayAttr::get(attrs, ctx));
*7a7eacc7SStephan Herhut  ++mappingLevel;
*7a7eacc7SStephan Herhut  // Parallel loop operations are immediately nested, so do not use
*7a7eacc7SStephan Herhut  // walk but just iterate over the operations.
*7a7eacc7SStephan Herhut  for (Operation &op : *parallelOp.getBody()) {
*7a7eacc7SStephan Herhut    if (ParallelOp nested = dyn_cast<ParallelOp>(op))
*7a7eacc7SStephan Herhut      mapParallelOp(nested, mappingLevel);
*7a7eacc7SStephan Herhut  }
*7a7eacc7SStephan Herhut}
*7a7eacc7SStephan Herhut
*7a7eacc7SStephan Herhutvoid mlir::greedilyMapParallelLoopsToGPU(Region &region) {
*7a7eacc7SStephan Herhut  region.walk([](ParallelOp parallelOp) { mapParallelOp(parallelOp); });
*7a7eacc7SStephan Herhut}