Quant/IR/QuantOps.cpp

363dd3f3SRob Suderman//===- QuantOps.cpp - Quantization Type and Ops Implementation --*- C++ -*-===//
363dd3f3SRob Suderman//
363dd3f3SRob Suderman// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
363dd3f3SRob Suderman// See https://llvm.org/LICENSE.txt for license information.
363dd3f3SRob Suderman// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
363dd3f3SRob Suderman//
363dd3f3SRob Suderman//===----------------------------------------------------------------------===//
363dd3f3SRob Suderman
363dd3f3SRob Suderman#include "mlir/Dialect/Quant/QuantOps.h"
363dd3f3SRob Suderman#include "TypeDetail.h"
363dd3f3SRob Suderman
363dd3f3SRob Suderman#include "mlir/Dialect/Quant/QuantTypes.h"
09f7a55fSRiver Riddle#include "mlir/IR/BuiltinTypes.h"
363dd3f3SRob Suderman#include "mlir/IR/MLIRContext.h"
363dd3f3SRob Suderman#include "mlir/IR/Matchers.h"
363dd3f3SRob Suderman#include "mlir/IR/PatternMatch.h"
363dd3f3SRob Suderman#include "llvm/ADT/StringRef.h"
363dd3f3SRob Suderman#include "llvm/ADT/Twine.h"
363dd3f3SRob Suderman#include "llvm/Support/MathExtras.h"
363dd3f3SRob Suderman#include <numeric>
363dd3f3SRob Suderman
363dd3f3SRob Sudermanusing namespace mlir;
363dd3f3SRob Sudermanusing namespace mlir::quant;
363dd3f3SRob Sudermanusing namespace mlir::quant::detail;
363dd3f3SRob Suderman
485cc55eSStella Laurenzo#include "mlir/Dialect/Quant/QuantOpsDialect.cpp.inc"
485cc55eSStella Laurenzo
575b22b5SMehdi Aminivoid QuantizationDialect::initialize() {
94e4ec64STei Jeong  addTypes<AnyQuantizedType, CalibratedQuantizedType, UniformQuantizedType,
363dd3f3SRob Suderman           UniformQuantizedPerAxisType>();
363dd3f3SRob Suderman  addOperations<
363dd3f3SRob Suderman#define GET_OP_LIST
363dd3f3SRob Suderman#include "mlir/Dialect/Quant/QuantOps.cpp.inc"
363dd3f3SRob Suderman      >();
363dd3f3SRob Suderman}
363dd3f3SRob Suderman
363dd3f3SRob SudermanOpFoldResult StorageCastOp::fold(ArrayRef<Attribute> operands) {
363dd3f3SRob Suderman  // Matches x -> [scast -> scast] -> y, replacing the second scast with the
363dd3f3SRob Suderman  // value of x if the casts invert each other.
*04235d07SJacques Pienaar  auto srcScastOp = getArg().getDefiningOp<StorageCastOp>();
*04235d07SJacques Pienaar  if (!srcScastOp || srcScastOp.getArg().getType() != getType())
363dd3f3SRob Suderman    return OpFoldResult();
*04235d07SJacques Pienaar  return srcScastOp.getArg();
363dd3f3SRob Suderman}
363dd3f3SRob Suderman
363dd3f3SRob Suderman/// The quantization specification should match the expressed type.
363dd3f3SRob Sudermanstatic bool isValidQuantizationSpec(Attribute quantSpec, Type expressed) {
363dd3f3SRob Suderman  if (auto typeAttr = quantSpec.dyn_cast<TypeAttr>()) {
363dd3f3SRob Suderman    Type spec = typeAttr.getValue();
ee394e68SRahul Joshi    if (spec.isa<TensorType, VectorType>())
363dd3f3SRob Suderman      return false;
363dd3f3SRob Suderman
363dd3f3SRob Suderman    // The spec should be either a quantized type which is compatible to the
363dd3f3SRob Suderman    // expressed type, or a primitive type which is as same as the
363dd3f3SRob Suderman    // (element type of) the expressed type.
363dd3f3SRob Suderman    if (auto quantizedType = spec.dyn_cast<QuantizedType>())
363dd3f3SRob Suderman      return quantizedType.isCompatibleExpressedType(expressed);
363dd3f3SRob Suderman
363dd3f3SRob Suderman    if (auto tensorType = expressed.dyn_cast<TensorType>())
363dd3f3SRob Suderman      return spec == tensorType.getElementType();
363dd3f3SRob Suderman
363dd3f3SRob Suderman    if (auto vectorType = expressed.dyn_cast<VectorType>())
363dd3f3SRob Suderman      return spec == vectorType.getElementType();
363dd3f3SRob Suderman  }
363dd3f3SRob Suderman  return false;
363dd3f3SRob Suderman}
363dd3f3SRob Suderman
1be88f5aSRiver RiddleLogicalResult QuantizeRegionOp::verify() {
363dd3f3SRob Suderman  // There are specifications for both inputs and outputs.
*04235d07SJacques Pienaar  if (getNumOperands() != getInputSpecs().size() ||
*04235d07SJacques Pienaar      getNumResults() != getOutputSpecs().size())
1be88f5aSRiver Riddle    return emitOpError(
363dd3f3SRob Suderman        "has unmatched operands/results number and spec attributes number");
363dd3f3SRob Suderman
363dd3f3SRob Suderman  // Verify that quantization specifications are valid.
*04235d07SJacques Pienaar  for (auto input : llvm::zip(getOperandTypes(), getInputSpecs())) {
363dd3f3SRob Suderman    Type inputType = std::get<0>(input);
363dd3f3SRob Suderman    Attribute inputSpec = std::get<1>(input);
363dd3f3SRob Suderman    if (!isValidQuantizationSpec(inputSpec, inputType)) {
1be88f5aSRiver Riddle      return emitOpError() << "has incompatible specification " << inputSpec
363dd3f3SRob Suderman                           << " and input type " << inputType;
363dd3f3SRob Suderman    }
363dd3f3SRob Suderman  }
363dd3f3SRob Suderman
*04235d07SJacques Pienaar  for (auto result : llvm::zip(getResultTypes(), getOutputSpecs())) {
363dd3f3SRob Suderman    Type outputType = std::get<0>(result);
363dd3f3SRob Suderman    Attribute outputSpec = std::get<1>(result);
363dd3f3SRob Suderman    if (!isValidQuantizationSpec(outputSpec, outputType)) {
1be88f5aSRiver Riddle      return emitOpError() << "has incompatible specification " << outputSpec
363dd3f3SRob Suderman                           << " and output type " << outputType;
363dd3f3SRob Suderman    }
363dd3f3SRob Suderman  }
363dd3f3SRob Suderman  return success();
363dd3f3SRob Suderman}
363dd3f3SRob Suderman
1be88f5aSRiver RiddleLogicalResult StatisticsOp::verify() {
*04235d07SJacques Pienaar  auto tensorArg = getArg().getType().dyn_cast<TensorType>();
1be88f5aSRiver Riddle  if (!tensorArg)
1be88f5aSRiver Riddle    return emitOpError("arg needs to be tensor type.");
1be88f5aSRiver Riddle
1be88f5aSRiver Riddle  // Verify layerStats attribute.
1be88f5aSRiver Riddle  {
*04235d07SJacques Pienaar    auto layerStatsType = getLayerStats().getType();
1be88f5aSRiver Riddle    if (!layerStatsType.getElementType().isa<FloatType>()) {
1be88f5aSRiver Riddle      return emitOpError("layerStats must have a floating point element type");
1be88f5aSRiver Riddle    }
1be88f5aSRiver Riddle    if (layerStatsType.getRank() != 1 || layerStatsType.getDimSize(0) != 2) {
1be88f5aSRiver Riddle      return emitOpError("layerStats must have shape [2]");
1be88f5aSRiver Riddle    }
1be88f5aSRiver Riddle  }
1be88f5aSRiver Riddle  // Verify axisStats (optional) attribute.
*04235d07SJacques Pienaar  if (getAxisStats()) {
*04235d07SJacques Pienaar    if (!getAxis())
1be88f5aSRiver Riddle      return emitOpError("axis must be specified for axisStats");
1be88f5aSRiver Riddle
1be88f5aSRiver Riddle    auto shape = tensorArg.getShape();
1be88f5aSRiver Riddle    auto argSliceSize =
*04235d07SJacques Pienaar        std::accumulate(std::next(shape.begin(), *getAxis()), shape.end(), 1,
1be88f5aSRiver Riddle                        std::multiplies<int64_t>());
1be88f5aSRiver Riddle
*04235d07SJacques Pienaar    auto axisStatsType = getAxisStats()->getType();
1be88f5aSRiver Riddle    if (!axisStatsType.getElementType().isa<FloatType>()) {
1be88f5aSRiver Riddle      return emitOpError("axisStats must have a floating point element type");
1be88f5aSRiver Riddle    }
1be88f5aSRiver Riddle    if (axisStatsType.getRank() != 2 || axisStatsType.getDimSize(1) != 2 ||
1be88f5aSRiver Riddle        axisStatsType.getDimSize(0) != argSliceSize) {
1be88f5aSRiver Riddle      return emitOpError("axisStats must have shape [N,2] "
1be88f5aSRiver Riddle                         "where N = the slice size defined by the axis dim");
1be88f5aSRiver Riddle    }
1be88f5aSRiver Riddle  }
1be88f5aSRiver Riddle  return success();
1be88f5aSRiver Riddle}
1be88f5aSRiver Riddle
363dd3f3SRob Suderman#define GET_OP_CLASSES
363dd3f3SRob Suderman#include "mlir/Dialect/Quant/QuantOps.cpp.inc"