Math/Transforms/ExpandPatterns.cpp

f3bdb56dSRob Suderman//===- ExpandTanh.cpp - Code to perform expanding tanh op -----------------===//
f3bdb56dSRob Suderman//
f3bdb56dSRob Suderman// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
f3bdb56dSRob Suderman// See https://llvm.org/LICENSE.txt for license information.
f3bdb56dSRob Suderman// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
f3bdb56dSRob Suderman//
f3bdb56dSRob Suderman//===----------------------------------------------------------------------===//
f3bdb56dSRob Suderman//
f3bdb56dSRob Suderman// This file implements expansion of tanh op.
f3bdb56dSRob Suderman//
f3bdb56dSRob Suderman//===----------------------------------------------------------------------===//
f3bdb56dSRob Suderman
f3bdb56dSRob Suderman#include "mlir/Dialect/Arithmetic/IR/Arithmetic.h"
f3bdb56dSRob Suderman#include "mlir/Dialect/Math/IR/Math.h"
f3bdb56dSRob Suderman#include "mlir/Dialect/Math/Transforms/Passes.h"
*8b68da2cSAlex Zinenko#include "mlir/Dialect/SCF/IR/SCF.h"
f3bdb56dSRob Suderman#include "mlir/IR/Builders.h"
f3bdb56dSRob Suderman#include "mlir/Transforms/DialectConversion.h"
f3bdb56dSRob Suderman
f3bdb56dSRob Sudermanusing namespace mlir;
f3bdb56dSRob Suderman
f3bdb56dSRob Suderman/// Expands tanh op into
f3bdb56dSRob Suderman///   1) 1-exp^{-2x} / 1+exp^{-2x}, if x => 0
f3bdb56dSRob Suderman///   2) exp^{2x}-1 / exp^{2x}+1  , if x < 0
f3bdb56dSRob Sudermanstatic LogicalResult convertTanhOp(math::TanhOp op, PatternRewriter &rewriter) {
f3bdb56dSRob Suderman  auto floatType = op.getOperand().getType();
f3bdb56dSRob Suderman  Location loc = op.getLoc();
f3bdb56dSRob Suderman  auto floatOne = rewriter.getFloatAttr(floatType, 1.0);
f3bdb56dSRob Suderman  auto floatTwo = rewriter.getFloatAttr(floatType, 2.0);
f3bdb56dSRob Suderman  Value one = rewriter.create<arith::ConstantOp>(loc, floatOne);
f3bdb56dSRob Suderman  Value two = rewriter.create<arith::ConstantOp>(loc, floatTwo);
f3bdb56dSRob Suderman  Value doubledX = rewriter.create<arith::MulFOp>(loc, op.getOperand(), two);
f3bdb56dSRob Suderman
f3bdb56dSRob Suderman  // Case 1: tanh(x) = 1-exp^{-2x} / 1+exp^{-2x}
f3bdb56dSRob Suderman  Value negDoubledX = rewriter.create<arith::NegFOp>(loc, doubledX);
f3bdb56dSRob Suderman  Value exp2x = rewriter.create<math::ExpOp>(loc, negDoubledX);
f3bdb56dSRob Suderman  Value dividend = rewriter.create<arith::SubFOp>(loc, one, exp2x);
f3bdb56dSRob Suderman  Value divisor = rewriter.create<arith::AddFOp>(loc, one, exp2x);
f3bdb56dSRob Suderman  Value positiveRes = rewriter.create<arith::DivFOp>(loc, dividend, divisor);
f3bdb56dSRob Suderman
f3bdb56dSRob Suderman  // Case 2: tanh(x) = exp^{2x}-1 / exp^{2x}+1
f3bdb56dSRob Suderman  exp2x = rewriter.create<math::ExpOp>(loc, doubledX);
f3bdb56dSRob Suderman  dividend = rewriter.create<arith::SubFOp>(loc, exp2x, one);
f3bdb56dSRob Suderman  divisor = rewriter.create<arith::AddFOp>(loc, exp2x, one);
f3bdb56dSRob Suderman  Value negativeRes = rewriter.create<arith::DivFOp>(loc, dividend, divisor);
f3bdb56dSRob Suderman
f3bdb56dSRob Suderman  // tanh(x) = x >= 0 ? positiveRes : negativeRes
f3bdb56dSRob Suderman  auto floatZero = rewriter.getFloatAttr(floatType, 0.0);
f3bdb56dSRob Suderman  Value zero = rewriter.create<arith::ConstantOp>(loc, floatZero);
f3bdb56dSRob Suderman  Value cmpRes = rewriter.create<arith::CmpFOp>(loc, arith::CmpFPredicate::OGE,
f3bdb56dSRob Suderman                                                op.getOperand(), zero);
f3bdb56dSRob Suderman  rewriter.replaceOpWithNewOp<arith::SelectOp>(op, cmpRes, positiveRes,
f3bdb56dSRob Suderman                                               negativeRes);
f3bdb56dSRob Suderman  return success();
f3bdb56dSRob Suderman}
f3bdb56dSRob Suderman
f3bdb56dSRob Sudermanstatic LogicalResult convertCtlzOp(math::CountLeadingZerosOp op,
f3bdb56dSRob Suderman                                   PatternRewriter &rewriter) {
f3bdb56dSRob Suderman  auto operand = op.getOperand();
f3bdb56dSRob Suderman  auto elementTy = operand.getType();
f3bdb56dSRob Suderman  auto resultTy = op.getType();
f3bdb56dSRob Suderman  Location loc = op.getLoc();
f3bdb56dSRob Suderman
f3bdb56dSRob Suderman  int bitWidth = elementTy.getIntOrFloatBitWidth();
f3bdb56dSRob Suderman  auto zero =
f3bdb56dSRob Suderman      rewriter.create<arith::ConstantOp>(loc, IntegerAttr::get(elementTy, 0));
f3bdb56dSRob Suderman  auto leadingZeros = rewriter.create<arith::ConstantOp>(
f3bdb56dSRob Suderman      loc, IntegerAttr::get(elementTy, bitWidth));
f3bdb56dSRob Suderman
f3bdb56dSRob Suderman  SmallVector<Value> operands = {operand, leadingZeros, zero};
f3bdb56dSRob Suderman  SmallVector<Type> types = {elementTy, elementTy, elementTy};
f3bdb56dSRob Suderman  SmallVector<Location> locations = {loc, loc, loc};
f3bdb56dSRob Suderman
f3bdb56dSRob Suderman  auto whileOp = rewriter.create<scf::WhileOp>(loc, types, operands);
f3bdb56dSRob Suderman  Block *before =
f3bdb56dSRob Suderman      rewriter.createBlock(&whileOp.getBefore(), {}, types, locations);
f3bdb56dSRob Suderman  Block *after =
f3bdb56dSRob Suderman      rewriter.createBlock(&whileOp.getAfter(), {}, types, locations);
f3bdb56dSRob Suderman
f3bdb56dSRob Suderman  // The conditional block of the while loop.
f3bdb56dSRob Suderman  {
f3bdb56dSRob Suderman    rewriter.setInsertionPointToStart(&whileOp.getBefore().front());
f3bdb56dSRob Suderman    Value input = before->getArgument(0);
f3bdb56dSRob Suderman    Value zero = before->getArgument(2);
f3bdb56dSRob Suderman
f3bdb56dSRob Suderman    Value inputNotZero = rewriter.create<arith::CmpIOp>(
f3bdb56dSRob Suderman        loc, arith::CmpIPredicate::ne, input, zero);
f3bdb56dSRob Suderman    rewriter.create<scf::ConditionOp>(loc, inputNotZero,
f3bdb56dSRob Suderman                                      before->getArguments());
f3bdb56dSRob Suderman  }
f3bdb56dSRob Suderman
f3bdb56dSRob Suderman  // The body of the while loop: shift right until reaching a value of 0.
f3bdb56dSRob Suderman  {
f3bdb56dSRob Suderman    rewriter.setInsertionPointToStart(&whileOp.getAfter().front());
f3bdb56dSRob Suderman    Value input = after->getArgument(0);
f3bdb56dSRob Suderman    Value leadingZeros = after->getArgument(1);
f3bdb56dSRob Suderman
f3bdb56dSRob Suderman    auto one =
f3bdb56dSRob Suderman        rewriter.create<arith::ConstantOp>(loc, IntegerAttr::get(elementTy, 1));
f3bdb56dSRob Suderman    auto shifted = rewriter.create<arith::ShRUIOp>(loc, resultTy, input, one);
f3bdb56dSRob Suderman    auto leadingZerosMinusOne =
f3bdb56dSRob Suderman        rewriter.create<arith::SubIOp>(loc, resultTy, leadingZeros, one);
f3bdb56dSRob Suderman
f3bdb56dSRob Suderman    rewriter.create<scf::YieldOp>(
f3bdb56dSRob Suderman        loc,
f3bdb56dSRob Suderman        ValueRange({shifted, leadingZerosMinusOne, after->getArgument(2)}));
f3bdb56dSRob Suderman  }
f3bdb56dSRob Suderman
f3bdb56dSRob Suderman  rewriter.setInsertionPointAfter(whileOp);
f3bdb56dSRob Suderman  rewriter.replaceOp(op, whileOp->getResult(1));
f3bdb56dSRob Suderman  return success();
f3bdb56dSRob Suderman}
f3bdb56dSRob Suderman
f3bdb56dSRob Sudermanvoid mlir::populateExpandCtlzPattern(RewritePatternSet &patterns) {
f3bdb56dSRob Suderman  patterns.add(convertCtlzOp);
f3bdb56dSRob Suderman}
f3bdb56dSRob Suderman
f3bdb56dSRob Sudermanvoid mlir::populateExpandTanhPattern(RewritePatternSet &patterns) {
f3bdb56dSRob Suderman  patterns.add(convertTanhOp);
f3bdb56dSRob Suderman}