Quant/Utils/UniformSupport.cpp

363dd3f3SRob Suderman//===- UniformSupport.cpp - Support utilities for uniform quant -----------===//
363dd3f3SRob Suderman//
363dd3f3SRob Suderman// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
363dd3f3SRob Suderman// See https://llvm.org/LICENSE.txt for license information.
363dd3f3SRob Suderman// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
363dd3f3SRob Suderman//
363dd3f3SRob Suderman//===----------------------------------------------------------------------===//
363dd3f3SRob Suderman
363dd3f3SRob Suderman#include "mlir/Dialect/Quant/UniformSupport.h"
09f7a55fSRiver Riddle#include "mlir/IR/BuiltinTypes.h"
363dd3f3SRob Suderman#include <numeric>
363dd3f3SRob Suderman
363dd3f3SRob Sudermanusing namespace mlir;
363dd3f3SRob Sudermanusing namespace mlir::quant;
363dd3f3SRob Suderman
363dd3f3SRob Sudermanstatic bool isQuantizablePrimitiveType(Type inputType) {
363dd3f3SRob Suderman  return inputType.isa<FloatType>();
363dd3f3SRob Suderman}
363dd3f3SRob Suderman
*ad5d7aceSMehdi AminiExpressedToQuantizedConverter
363dd3f3SRob SudermanExpressedToQuantizedConverter::forInputType(Type inputType) {
c8c45985SRiver Riddle  if (inputType.isa<TensorType, VectorType>()) {
363dd3f3SRob Suderman    Type elementType = inputType.cast<ShapedType>().getElementType();
c8c45985SRiver Riddle    if (!isQuantizablePrimitiveType(elementType))
c8c45985SRiver Riddle      return ExpressedToQuantizedConverter{inputType, nullptr};
c8c45985SRiver Riddle    return ExpressedToQuantizedConverter{inputType, elementType};
c8c45985SRiver Riddle  }
c8c45985SRiver Riddle  // Supported primitive type (which just is the expressed type).
c8c45985SRiver Riddle  if (isQuantizablePrimitiveType(inputType))
c8c45985SRiver Riddle    return ExpressedToQuantizedConverter{inputType, inputType};
363dd3f3SRob Suderman  // Unsupported.
363dd3f3SRob Suderman  return ExpressedToQuantizedConverter{inputType, nullptr};
363dd3f3SRob Suderman}
363dd3f3SRob Suderman
363dd3f3SRob SudermanType ExpressedToQuantizedConverter::convert(QuantizedType elementalType) const {
363dd3f3SRob Suderman  assert(expressedType && "convert() on unsupported conversion");
c8c45985SRiver Riddle  if (auto tensorType = inputType.dyn_cast<RankedTensorType>())
c8c45985SRiver Riddle    return RankedTensorType::get(tensorType.getShape(), elementalType);
c8c45985SRiver Riddle  if (auto tensorType = inputType.dyn_cast<UnrankedTensorType>())
c8c45985SRiver Riddle    return UnrankedTensorType::get(elementalType);
c8c45985SRiver Riddle  if (auto vectorType = inputType.dyn_cast<VectorType>())
c8c45985SRiver Riddle    return VectorType::get(vectorType.getShape(), elementalType);
363dd3f3SRob Suderman
942afe0cSFeng Liu  // If the expressed types match, just use the new elemental type.
c8c45985SRiver Riddle  if (elementalType.getExpressedType() == expressedType)
363dd3f3SRob Suderman    return elementalType;
363dd3f3SRob Suderman  // Unsupported.
363dd3f3SRob Suderman  return nullptr;
363dd3f3SRob Suderman}
363dd3f3SRob Suderman
363dd3f3SRob SudermanElementsAttr
363dd3f3SRob SudermanUniformQuantizedPerAxisValueConverter::convert(Attribute realValue) {
363dd3f3SRob Suderman  if (auto attr = realValue.dyn_cast<DenseFPElementsAttr>()) {
363dd3f3SRob Suderman    return convert(attr);
363dd3f3SRob Suderman  }
9db53a18SRiver Riddle  // TODO: handles sparse elements attribute
363dd3f3SRob Suderman  return nullptr;
363dd3f3SRob Suderman}
363dd3f3SRob Suderman
363dd3f3SRob SudermanDenseElementsAttr
363dd3f3SRob SudermanUniformQuantizedPerAxisValueConverter::convert(DenseFPElementsAttr attr) {
363dd3f3SRob Suderman  // Creates the converter for each chunk. Normally the size of the
363dd3f3SRob Suderman  // quantization dim is 3, so we can cache all the converters.
363dd3f3SRob Suderman  ShapedType type = attr.getType();
363dd3f3SRob Suderman  size_t dimSize = type.getDimSize(quantizationDim);
363dd3f3SRob Suderman  if (dimSize != scales.size()) {
363dd3f3SRob Suderman    return {};
363dd3f3SRob Suderman  }
363dd3f3SRob Suderman  SmallVector<UniformQuantizedValueConverter, 4> converters;
363dd3f3SRob Suderman  converters.reserve(dimSize);
363dd3f3SRob Suderman  for (int i = 0, e = dimSize; i != e; ++i) {
363dd3f3SRob Suderman    converters.push_back(getPerChunkConverter(i));
363dd3f3SRob Suderman  }
363dd3f3SRob Suderman
363dd3f3SRob Suderman  // Scan the elements of the dense elements attributes and quantize them by
363dd3f3SRob Suderman  // using the right quantization parameters.
363dd3f3SRob Suderman  int64_t flattenIndex = 0;
363dd3f3SRob Suderman  auto shape = type.getShape();
363dd3f3SRob Suderman  int64_t chunkSize =
363dd3f3SRob Suderman      std::accumulate(std::next(shape.begin(), quantizationDim + 1),
363dd3f3SRob Suderman                      shape.end(), 1, std::multiplies<int64_t>());
1b97cdf8SRiver Riddle  Type newElementType = IntegerType::get(attr.getContext(), storageBitWidth);
363dd3f3SRob Suderman  return attr.mapValues(newElementType, [&](const APFloat &old) {
363dd3f3SRob Suderman    int chunkIndex = (flattenIndex++) / chunkSize;
363dd3f3SRob Suderman    return converters[chunkIndex % dimSize].quantizeFloatToInt(old);
363dd3f3SRob Suderman  });
363dd3f3SRob Suderman}