Dialect/SparseTensor/MergerTest.cpp

40843347SGus Smith#include "mlir/Dialect/SparseTensor/Utils/Merger.h"
*66ae1d60SPeiming Liu#include "llvm/Support/Compiler.h"
40843347SGus Smith#include "gmock/gmock.h"
40843347SGus Smith#include "gtest/gtest.h"
40843347SGus Smith#include <memory>
40843347SGus Smith
6842ec42SRiver Riddleusing namespace mlir;
40843347SGus Smithusing namespace mlir::sparse_tensor;
40843347SGus Smith
*66ae1d60SPeiming Liu// Silence 'warning C4002: 'too many arguments for function-liked macro
*66ae1d60SPeiming Liu//                          invocation'
*66ae1d60SPeiming Liu// as MSVC handles ##__VA_ARGS__ differently as gcc/clang
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu#if defined(_MSC_VER) && !defined(__clang__)
*66ae1d60SPeiming Liu#pragma warning(push)
*66ae1d60SPeiming Liu#pragma warning(disable : 4002)
*66ae1d60SPeiming Liu#endif
*66ae1d60SPeiming Liu
40843347SGus Smithnamespace {
40843347SGus Smith
*66ae1d60SPeiming Liu///
*66ae1d60SPeiming Liu/// Defines macros to iterate binary and the combination of binary operations.
*66ae1d60SPeiming Liu///
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu#define FOREVERY_BINOP(DO)                                                     \
*66ae1d60SPeiming Liu  DO(mulf, Kind::kMulF)                                                        \
*66ae1d60SPeiming Liu  DO(mulc, Kind::kMulC)                                                        \
*66ae1d60SPeiming Liu  DO(muli, Kind::kMulI)                                                        \
*66ae1d60SPeiming Liu  DO(addf, Kind::kAddF)                                                        \
*66ae1d60SPeiming Liu  DO(addc, Kind::kAddC)                                                        \
*66ae1d60SPeiming Liu  DO(addi, Kind::kAddI)                                                        \
*66ae1d60SPeiming Liu  DO(subf, Kind::kSubF)                                                        \
*66ae1d60SPeiming Liu  DO(subc, Kind::kSubC)                                                        \
*66ae1d60SPeiming Liu  DO(subi, Kind::kSubI)                                                        \
*66ae1d60SPeiming Liu  DO(andi, Kind::kAndI)                                                        \
*66ae1d60SPeiming Liu  DO(xori, Kind::kXorI)                                                        \
*66ae1d60SPeiming Liu  DO(ori, Kind::kOrI)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu// TODO: Disjunctive binary operations that need special handling are not
*66ae1d60SPeiming Liu// included, e.g., Division are not tested (for now) as it need a constant
*66ae1d60SPeiming Liu// non-zero dividend.
*66ae1d60SPeiming Liu// ##__VA_ARGS__ handles cases when __VA_ARGS__ is empty.
*66ae1d60SPeiming Liu#define FOREVERY_COMMON_DISJ_BINOP(TEST, ...)                                  \
*66ae1d60SPeiming Liu  TEST(addf, ##__VA_ARGS__)                                                    \
*66ae1d60SPeiming Liu  TEST(addc, ##__VA_ARGS__)                                                    \
*66ae1d60SPeiming Liu  TEST(addi, ##__VA_ARGS__)                                                    \
*66ae1d60SPeiming Liu  TEST(xori, ##__VA_ARGS__)                                                    \
*66ae1d60SPeiming Liu  TEST(ori, ##__VA_ARGS__)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu// TODO: Conjunctive binary operations that need special handling are not
*66ae1d60SPeiming Liu// included, e.g., substraction yields a different pattern as it is mapped to
*66ae1d60SPeiming Liu// negate operation.
*66ae1d60SPeiming Liu#define FOREVERY_COMMON_CONJ_BINOP(TEST, ...)                                  \
*66ae1d60SPeiming Liu  TEST(mulf, ##__VA_ARGS__)                                                    \
*66ae1d60SPeiming Liu  TEST(mulc, ##__VA_ARGS__)                                                    \
*66ae1d60SPeiming Liu  TEST(muli, ##__VA_ARGS__)                                                    \
*66ae1d60SPeiming Liu  TEST(andi, ##__VA_ARGS__)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu#define FOREVERY_PAIR_OF_COMMON_CONJ_DISJ_BINOP(TEST)                          \
*66ae1d60SPeiming Liu  FOREVERY_COMMON_CONJ_BINOP(TEST, addf)                                       \
*66ae1d60SPeiming Liu  FOREVERY_COMMON_CONJ_BINOP(TEST, addc)                                       \
*66ae1d60SPeiming Liu  FOREVERY_COMMON_CONJ_BINOP(TEST, addi)                                       \
*66ae1d60SPeiming Liu  FOREVERY_COMMON_CONJ_BINOP(TEST, xori)                                       \
*66ae1d60SPeiming Liu  FOREVERY_COMMON_CONJ_BINOP(TEST, ori)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu#define FOREVERY_PAIR_OF_COMMON_CONJ_CONJ_BINOP(TEST)                          \
*66ae1d60SPeiming Liu  FOREVERY_COMMON_CONJ_BINOP(TEST, mulf)                                       \
*66ae1d60SPeiming Liu  FOREVERY_COMMON_CONJ_BINOP(TEST, mulc)                                       \
*66ae1d60SPeiming Liu  FOREVERY_COMMON_CONJ_BINOP(TEST, muli)                                       \
*66ae1d60SPeiming Liu  FOREVERY_COMMON_CONJ_BINOP(TEST, andi)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu#define FOREVERY_PAIR_OF_COMMON_DISJ_DISJ_BINOP(TEST)                          \
*66ae1d60SPeiming Liu  FOREVERY_COMMON_DISJ_BINOP(TEST, addf)                                       \
*66ae1d60SPeiming Liu  FOREVERY_COMMON_DISJ_BINOP(TEST, addc)                                       \
*66ae1d60SPeiming Liu  FOREVERY_COMMON_DISJ_BINOP(TEST, addi)                                       \
*66ae1d60SPeiming Liu  FOREVERY_COMMON_DISJ_BINOP(TEST, ori)                                        \
*66ae1d60SPeiming Liu  FOREVERY_COMMON_DISJ_BINOP(TEST, xori)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu///
*66ae1d60SPeiming Liu/// Helper classes/functions for testing Merger.
*66ae1d60SPeiming Liu///
*66ae1d60SPeiming Liu
40843347SGus Smith/// Simple recursive data structure used to match expressions in Mergers.
40843347SGus Smithstruct Pattern {
40843347SGus Smith  Kind kind;
40843347SGus Smith
40843347SGus Smith  /// Expressions representing tensors simply have a tensor number.
40843347SGus Smith  unsigned tensorNum;
40843347SGus Smith
40843347SGus Smith  /// Tensor operations point to their children.
40843347SGus Smith  std::shared_ptr<Pattern> e0;
40843347SGus Smith  std::shared_ptr<Pattern> e1;
40843347SGus Smith
40843347SGus Smith  /// Constructors.
40843347SGus Smith  /// Rather than using these, please use the readable helper constructor
40843347SGus Smith  /// functions below to make tests more readable.
40843347SGus Smith  Pattern(unsigned tensorNum) : kind(Kind::kTensor), tensorNum(tensorNum) {}
1fc096afSMehdi Amini  Pattern(Kind kind, const std::shared_ptr<Pattern> &e0,
1fc096afSMehdi Amini          const std::shared_ptr<Pattern> &e1)
40843347SGus Smith      : kind(kind), e0(e0), e1(e1) {
40843347SGus Smith    assert(kind >= Kind::kMulF);
40843347SGus Smith    assert(e0 && e1);
40843347SGus Smith  }
40843347SGus Smith};
40843347SGus Smith
40843347SGus Smith///
40843347SGus Smith/// Readable Pattern builder functions.
40843347SGus Smith/// These should be preferred over the actual constructors.
40843347SGus Smith///
40843347SGus Smith
40843347SGus Smithstatic std::shared_ptr<Pattern> tensorPattern(unsigned tensorNum) {
40843347SGus Smith  return std::make_shared<Pattern>(tensorNum);
40843347SGus Smith}
40843347SGus Smith
*66ae1d60SPeiming Liu#define IMPL_BINOP_PATTERN(OP, KIND)                                           \
*66ae1d60SPeiming Liu  LLVM_ATTRIBUTE_UNUSED static std::shared_ptr<Pattern> OP##Pattern(           \
*66ae1d60SPeiming Liu      const std::shared_ptr<Pattern> &e0,                                      \
*66ae1d60SPeiming Liu      const std::shared_ptr<Pattern> &e1) {                                    \
*66ae1d60SPeiming Liu    return std::make_shared<Pattern>(KIND, e0, e1);                            \
40843347SGus Smith  }
40843347SGus Smith
*66ae1d60SPeiming LiuFOREVERY_BINOP(IMPL_BINOP_PATTERN)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu#undef IMPL_BINOP_PATTERN
40843347SGus Smith
40843347SGus Smithclass MergerTestBase : public ::testing::Test {
40843347SGus Smithprotected:
40843347SGus Smith  MergerTestBase(unsigned numTensors, unsigned numLoops)
40843347SGus Smith      : numTensors(numTensors), numLoops(numLoops),
40843347SGus Smith        merger(numTensors, numLoops) {}
40843347SGus Smith
40843347SGus Smith  ///
40843347SGus Smith  /// Expression construction helpers.
40843347SGus Smith  ///
40843347SGus Smith
40843347SGus Smith  unsigned tensor(unsigned tensor) {
40843347SGus Smith    return merger.addExp(Kind::kTensor, tensor);
40843347SGus Smith  }
40843347SGus Smith
*66ae1d60SPeiming Liu#define IMPL_BINOP_EXPR(OP, KIND)                                              \
*66ae1d60SPeiming Liu  LLVM_ATTRIBUTE_UNUSED unsigned OP##Expr(unsigned e0, unsigned e1) {          \
*66ae1d60SPeiming Liu    return merger.addExp(KIND, e0, e1);                                        \
40843347SGus Smith  }
40843347SGus Smith
*66ae1d60SPeiming Liu  FOREVERY_BINOP(IMPL_BINOP_EXPR)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu#undef IMPL_BINOP_EXPR
40843347SGus Smith
40843347SGus Smith  ///
40843347SGus Smith  /// Comparison helpers.
40843347SGus Smith  ///
40843347SGus Smith
40843347SGus Smith  /// For readability of tests.
40843347SGus Smith  unsigned lat(unsigned lat) { return lat; }
40843347SGus Smith
40843347SGus Smith  /// Returns true if a lattice point with an expression matching the given
40843347SGus Smith  /// pattern and bits matching the given bits is present in lattice points
40843347SGus Smith  /// [p, p+n) of lattice set s. This is useful for testing partial ordering
40843347SGus Smith  /// constraints between lattice points. We generally know how contiguous
40843347SGus Smith  /// groups of lattice points should be ordered with respect to other groups,
40843347SGus Smith  /// but there is no required ordering within groups.
*66ae1d60SPeiming Liu  /// If simple is true, then compare the lat.simple field instead to test the
*66ae1d60SPeiming Liu  /// result after optimization
40843347SGus Smith  bool latPointWithinRange(unsigned s, unsigned p, unsigned n,
1fc096afSMehdi Amini                           const std::shared_ptr<Pattern> &pattern,
*66ae1d60SPeiming Liu                           const BitVector &bits, bool simple) {
40843347SGus Smith    for (unsigned i = p; i < p + n; ++i) {
40843347SGus Smith      if (compareExpression(merger.lat(merger.set(s)[i]).exp, pattern) &&
*66ae1d60SPeiming Liu          compareBits(s, i, bits, simple))
40843347SGus Smith        return true;
40843347SGus Smith    }
40843347SGus Smith    return false;
40843347SGus Smith  }
40843347SGus Smith
40843347SGus Smith  /// Wrapper over latPointWithinRange for readability of tests.
40843347SGus Smith  void expectLatPointWithinRange(unsigned s, unsigned p, unsigned n,
4f415216SMehdi Amini                                 const std::shared_ptr<Pattern> &pattern,
*66ae1d60SPeiming Liu                                 const BitVector &bits, bool simple = false) {
*66ae1d60SPeiming Liu    EXPECT_TRUE(latPointWithinRange(s, p, n, pattern, bits, simple));
40843347SGus Smith  }
40843347SGus Smith
40843347SGus Smith  /// Wrapper over expectLatPointWithinRange for a single lat point.
4f415216SMehdi Amini  void expectLatPoint(unsigned s, unsigned p,
4f415216SMehdi Amini                      const std::shared_ptr<Pattern> &pattern,
*66ae1d60SPeiming Liu                      const BitVector &bits, bool simple = false) {
*66ae1d60SPeiming Liu    EXPECT_TRUE(latPointWithinRange(s, p, 1, pattern, bits, simple));
40843347SGus Smith  }
40843347SGus Smith
40843347SGus Smith  /// Converts a vector of (loop, tensor) pairs to a bitvector with the
40843347SGus Smith  /// corresponding bits set.
d10d49dcSRiver Riddle  BitVector
1fc096afSMehdi Amini  loopsToBits(const std::vector<std::pair<unsigned, unsigned>> &loops) {
d10d49dcSRiver Riddle    BitVector testBits = BitVector(numTensors + 1, false);
40843347SGus Smith    for (auto l : loops) {
40843347SGus Smith      auto loop = std::get<0>(l);
40843347SGus Smith      auto tensor = std::get<1>(l);
40843347SGus Smith      testBits.set(numTensors * loop + tensor);
40843347SGus Smith    }
40843347SGus Smith    return testBits;
40843347SGus Smith  }
40843347SGus Smith
40843347SGus Smith  /// Returns true if the bits of lattice point p in set s match the given bits.
*66ae1d60SPeiming Liu  /// If simple is true, then compare the lat.simple field instead to test the
*66ae1d60SPeiming Liu  /// result after optimization
*66ae1d60SPeiming Liu  bool compareBits(unsigned s, unsigned p, const BitVector &bits, bool simple) {
*66ae1d60SPeiming Liu    if (simple)
*66ae1d60SPeiming Liu      return merger.lat(merger.set(s)[p]).simple == bits;
40843347SGus Smith    return merger.lat(merger.set(s)[p]).bits == bits;
40843347SGus Smith  }
40843347SGus Smith
40843347SGus Smith  /// Check that there are n lattice points in set s.
40843347SGus Smith  void expectNumLatPoints(unsigned s, unsigned n) {
40843347SGus Smith    EXPECT_THAT(merger.set(s).size(), n);
40843347SGus Smith  }
40843347SGus Smith
40843347SGus Smith  /// Compares expressions for equality. Equality is defined recursively as:
06aa6ec8SAart Bik  /// - Operations are equal if they have the same kind and children.
06aa6ec8SAart Bik  /// - Leaf tensors are equal if they refer to the same tensor.
1fc096afSMehdi Amini  bool compareExpression(unsigned e, const std::shared_ptr<Pattern> &pattern) {
40843347SGus Smith    auto tensorExp = merger.exp(e);
40843347SGus Smith    if (tensorExp.kind != pattern->kind)
40843347SGus Smith      return false;
40843347SGus Smith    switch (tensorExp.kind) {
06aa6ec8SAart Bik    // Leaf.
06aa6ec8SAart Bik    case kTensor:
40843347SGus Smith      return tensorExp.tensor == pattern->tensorNum;
06aa6ec8SAart Bik    case kInvariant:
06aa6ec8SAart Bik    case kIndex:
06aa6ec8SAart Bik      llvm_unreachable("invariant not handled yet");
06aa6ec8SAart Bik    // Unary operations.
06aa6ec8SAart Bik    case kAbsF:
06aa6ec8SAart Bik    case kAbsC:
06aa6ec8SAart Bik    case kCeilF:
06aa6ec8SAart Bik    case kFloorF:
06aa6ec8SAart Bik    case kSqrtF:
06aa6ec8SAart Bik    case kSqrtC:
06aa6ec8SAart Bik    case kExpm1F:
06aa6ec8SAart Bik    case kExpm1C:
06aa6ec8SAart Bik    case kLog1pF:
06aa6ec8SAart Bik    case kLog1pC:
06aa6ec8SAart Bik    case kSinF:
06aa6ec8SAart Bik    case kSinC:
06aa6ec8SAart Bik    case kTanhF:
06aa6ec8SAart Bik    case kTanhC:
06aa6ec8SAart Bik    case kNegF:
06aa6ec8SAart Bik    case kNegC:
06aa6ec8SAart Bik    case kNegI:
06aa6ec8SAart Bik    case kTruncF:
06aa6ec8SAart Bik    case kExtF:
06aa6ec8SAart Bik    case kCastFS:
06aa6ec8SAart Bik    case kCastFU:
06aa6ec8SAart Bik    case kCastSF:
06aa6ec8SAart Bik    case kCastUF:
06aa6ec8SAart Bik    case kCastS:
06aa6ec8SAart Bik    case kCastU:
06aa6ec8SAart Bik    case kCastIdx:
06aa6ec8SAart Bik    case kTruncI:
06aa6ec8SAart Bik    case kCIm:
06aa6ec8SAart Bik    case kCRe:
06aa6ec8SAart Bik    case kBitCast:
06aa6ec8SAart Bik    case kBinaryBranch:
06aa6ec8SAart Bik    case kUnary:
06aa6ec8SAart Bik    case kShlI:
06aa6ec8SAart Bik    case kBinary:
123e8dfcSAart Bik      return compareExpression(tensorExp.children.e0, pattern->e0);
06aa6ec8SAart Bik    // Binary operations.
06aa6ec8SAart Bik    case kMulF:
06aa6ec8SAart Bik    case kMulC:
06aa6ec8SAart Bik    case kMulI:
06aa6ec8SAart Bik    case kDivF:
06aa6ec8SAart Bik    case kDivC:
06aa6ec8SAart Bik    case kDivS:
06aa6ec8SAart Bik    case kDivU:
06aa6ec8SAart Bik    case kAddF:
06aa6ec8SAart Bik    case kAddC:
06aa6ec8SAart Bik    case kAddI:
06aa6ec8SAart Bik    case kSubF:
06aa6ec8SAart Bik    case kSubC:
06aa6ec8SAart Bik    case kSubI:
06aa6ec8SAart Bik    case kAndI:
06aa6ec8SAart Bik    case kOrI:
06aa6ec8SAart Bik    case kXorI:
06aa6ec8SAart Bik    case kShrS:
06aa6ec8SAart Bik    case kShrU:
40843347SGus Smith      return compareExpression(tensorExp.children.e0, pattern->e0) &&
40843347SGus Smith             compareExpression(tensorExp.children.e1, pattern->e1);
40843347SGus Smith    }
06aa6ec8SAart Bik    llvm_unreachable("unexpected kind");
40843347SGus Smith  }
40843347SGus Smith
40843347SGus Smith  unsigned numTensors;
40843347SGus Smith  unsigned numLoops;
40843347SGus Smith  Merger merger;
40843347SGus Smith};
40843347SGus Smith
*66ae1d60SPeiming Liu///
*66ae1d60SPeiming Liu/// Tests with all sparse inputs.
*66ae1d60SPeiming Liu///
*66ae1d60SPeiming Liu
40843347SGus Smithclass MergerTest3T1L : public MergerTestBase {
40843347SGus Smithprotected:
40843347SGus Smith  // Our three tensors (two inputs, one output).
40843347SGus Smith  const unsigned t0 = 0, t1 = 1, t2 = 2;
40843347SGus Smith
40843347SGus Smith  // Our single loop.
40843347SGus Smith  const unsigned l0 = 0;
40843347SGus Smith
40843347SGus Smith  MergerTest3T1L() : MergerTestBase(3, 1) {
40843347SGus Smith    // Tensor 0: sparse input vector.
40843347SGus Smith    merger.addExp(Kind::kTensor, t0, -1u);
40843347SGus Smith    merger.setDim(t0, l0, Dim::kSparse);
40843347SGus Smith
40843347SGus Smith    // Tensor 1: sparse input vector.
40843347SGus Smith    merger.addExp(Kind::kTensor, t1, -1u);
40843347SGus Smith    merger.setDim(t1, l0, Dim::kSparse);
40843347SGus Smith
40843347SGus Smith    // Tensor 2: dense output vector.
40843347SGus Smith    merger.addExp(Kind::kTensor, t2, -1u);
40843347SGus Smith    merger.setDim(t2, l0, Dim::kDense);
40843347SGus Smith  }
40843347SGus Smith};
40843347SGus Smith
*66ae1d60SPeiming Liuclass MergerTest4T1L : public MergerTestBase {
*66ae1d60SPeiming Liuprotected:
*66ae1d60SPeiming Liu  // Our four tensors (three inputs, one output).
*66ae1d60SPeiming Liu  const unsigned t0 = 0, t1 = 1, t2 = 2, t3 = 3;
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu  // Our single loop.
*66ae1d60SPeiming Liu  const unsigned l0 = 0;
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu  MergerTest4T1L() : MergerTestBase(4, 1) {
*66ae1d60SPeiming Liu    // Tensor 0: sparse input vector.
*66ae1d60SPeiming Liu    merger.addExp(Kind::kTensor, t0, -1u);
*66ae1d60SPeiming Liu    merger.setDim(t0, l0, Dim::kSparse);
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu    // Tensor 1: sparse input vector.
*66ae1d60SPeiming Liu    merger.addExp(Kind::kTensor, t1, -1u);
*66ae1d60SPeiming Liu    merger.setDim(t1, l0, Dim::kSparse);
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu    // Tensor 2: sparse input vector
*66ae1d60SPeiming Liu    merger.addExp(Kind::kTensor, t2, -1u);
*66ae1d60SPeiming Liu    merger.setDim(t2, l0, Dim::kSparse);
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu    // Tensor 3: dense output vector
*66ae1d60SPeiming Liu    merger.addExp(Kind::kTensor, t3, -1u);
*66ae1d60SPeiming Liu    merger.setDim(t3, l0, Dim::kDense);
*66ae1d60SPeiming Liu  }
*66ae1d60SPeiming Liu};
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu///
*66ae1d60SPeiming Liu/// Tests with both sparse and dense input.
*66ae1d60SPeiming Liu///
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liuclass MergerTest3T1LD : public MergerTestBase {
*66ae1d60SPeiming Liuprotected:
*66ae1d60SPeiming Liu  // Our three tensors (two inputs, one output).
*66ae1d60SPeiming Liu  const unsigned t0 = 0, t1 = 1, t2 = 2;
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu  // Our single loop.
*66ae1d60SPeiming Liu  const unsigned l0 = 0;
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu  MergerTest3T1LD() : MergerTestBase(3, 1) {
*66ae1d60SPeiming Liu    // Tensor 0: sparse input vector.
*66ae1d60SPeiming Liu    merger.addExp(Kind::kTensor, t0, -1u);
*66ae1d60SPeiming Liu    merger.setDim(t0, l0, Dim::kSparse);
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu    // Tensor 1: dense input vector.
*66ae1d60SPeiming Liu    merger.addExp(Kind::kTensor, t1, -1u);
*66ae1d60SPeiming Liu    merger.setDim(t1, l0, Dim::kDense);
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu    // Tensor 2: dense output vector.
*66ae1d60SPeiming Liu    merger.addExp(Kind::kTensor, t2, -1u);
*66ae1d60SPeiming Liu    merger.setDim(t2, l0, Dim::kDense);
*66ae1d60SPeiming Liu  }
*66ae1d60SPeiming Liu};
*66ae1d60SPeiming Liu
be0a7e9fSMehdi Amini} // namespace
40843347SGus Smith
*66ae1d60SPeiming Liu/// Vector addition (disjunction) of 2 vectors. i.e.;
40843347SGus Smith///   a(i) = b(i) + c(i)
40843347SGus Smith/// which should form the 3 lattice points
40843347SGus Smith/// {
40843347SGus Smith///   lat( i_00 i_01 / (tensor_0 + tensor_1) )
40843347SGus Smith///   lat( i_00 / tensor_0 )
40843347SGus Smith///   lat( i_01 / tensor_1 )
40843347SGus Smith/// }
*66ae1d60SPeiming Liu/// and after optimization, the lattice points do not change (as there is no
*66ae1d60SPeiming Liu/// duplicated point and all input vectors are sparse vector).
40843347SGus Smith/// {
40843347SGus Smith///   lat( i_00 i_01 / (tensor_0 + tensor_1) )
40843347SGus Smith///   lat( i_00 / tensor_0 )
*66ae1d60SPeiming Liu///   lat( i_01 / tensor_1 )
40843347SGus Smith/// }
*66ae1d60SPeiming Liu#define IMPL_MERGER_TEST_DISJ(OP)                                              \
*66ae1d60SPeiming Liu  TEST_F(MergerTest3T1L, vector_##OP) {                                        \
*66ae1d60SPeiming Liu    auto e = OP##Expr(tensor(t0), tensor(t1));                                 \
*66ae1d60SPeiming Liu    auto p0 = tensorPattern(t0);                                               \
*66ae1d60SPeiming Liu    auto p1 = tensorPattern(t1);                                               \
*66ae1d60SPeiming Liu    auto s = merger.buildLattices(e, l0);                                      \
*66ae1d60SPeiming Liu                                                                               \
*66ae1d60SPeiming Liu    expectNumLatPoints(s, 3);                                                  \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(0), OP##Pattern(p0, p1),                             \
*66ae1d60SPeiming Liu                   loopsToBits({{l0, t0}, {l0, t1}}));                         \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 2, p0, loopsToBits({{l0, t0}}));      \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 2, p1, loopsToBits({{l0, t1}}));      \
*66ae1d60SPeiming Liu                                                                               \
*66ae1d60SPeiming Liu    s = merger.optimizeSet(s);                                                 \
*66ae1d60SPeiming Liu    expectNumLatPoints(s, 3);                                                  \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(0), OP##Pattern(p0, p1),                             \
*66ae1d60SPeiming Liu                   loopsToBits({{l0, t0}, {l0, t1}}), true);                   \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 2, p0, loopsToBits({{l0, t0}}),       \
*66ae1d60SPeiming Liu                              true);                                           \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 2, p1, loopsToBits({{l0, t1}}),       \
*66ae1d60SPeiming Liu                              true);                                           \
40843347SGus Smith  }
40843347SGus Smith
*66ae1d60SPeiming LiuFOREVERY_COMMON_DISJ_BINOP(IMPL_MERGER_TEST_DISJ)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu#undef IMPL_MERGER_TEST_DISJ
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu/// Vector multiplication (conjunction) of 2 vectors, i.e.;
40843347SGus Smith///   a(i) = b(i) * c(i)
40843347SGus Smith/// which should form the single lattice point
40843347SGus Smith/// {
40843347SGus Smith///   lat( i_00 i_01 / (tensor_0 * tensor_1) )
40843347SGus Smith/// }
*66ae1d60SPeiming Liu#define IMPL_MERGER_TEST_CONJ(OP)                                              \
*66ae1d60SPeiming Liu  TEST_F(MergerTest3T1L, vector_##OP) {                                        \
*66ae1d60SPeiming Liu    auto e = OP##Expr(t0, t1);                                                 \
*66ae1d60SPeiming Liu    auto p0 = tensorPattern(t0);                                               \
*66ae1d60SPeiming Liu    auto p1 = tensorPattern(t1);                                               \
*66ae1d60SPeiming Liu    auto s = merger.buildLattices(e, l0);                                      \
*66ae1d60SPeiming Liu                                                                               \
*66ae1d60SPeiming Liu    expectNumLatPoints(s, 1);                                                  \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(0), OP##Pattern(p0, p1),                             \
*66ae1d60SPeiming Liu                   loopsToBits({{l0, t0}, {l0, t1}}));                         \
*66ae1d60SPeiming Liu                                                                               \
*66ae1d60SPeiming Liu    s = merger.optimizeSet(s);                                                 \
*66ae1d60SPeiming Liu    expectNumLatPoints(s, 1);                                                  \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(0), OP##Pattern(p0, p1),                             \
*66ae1d60SPeiming Liu                   loopsToBits({{l0, t0}, {l0, t1}}), true);                   \
40843347SGus Smith  }
*66ae1d60SPeiming Liu
*66ae1d60SPeiming LiuFOREVERY_COMMON_CONJ_BINOP(IMPL_MERGER_TEST_CONJ)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu#undef IMPL_MERGER_TEST_CONJ
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu/// Vector multiplication (conjunction) then addition (disjunction), i.e.;
*66ae1d60SPeiming Liu///   a(i) = b(i) * c(i) + d(i);
*66ae1d60SPeiming Liu/// which should form
*66ae1d60SPeiming Liu/// {
*66ae1d60SPeiming Liu///    lat( i_00 i_01 i_02 / (tensor_0 * tensor_1) + tensor_2 )
*66ae1d60SPeiming Liu///    lat( i_00 i_01 / tensor_0 * tensor_1
*66ae1d60SPeiming Liu///    lat( i_02 / tensor_2 )
*66ae1d60SPeiming Liu/// }
*66ae1d60SPeiming Liu#define IMPL_MERGER_TEST_CONJ_DISJ(CONJ, DISJ)                                 \
*66ae1d60SPeiming Liu  TEST_F(MergerTest4T1L, vector_##CONJ##_##DISJ) {                             \
*66ae1d60SPeiming Liu    auto em = CONJ##Expr(t0, t1);                                              \
*66ae1d60SPeiming Liu    auto e = DISJ##Expr(em, t2);                                               \
*66ae1d60SPeiming Liu    auto p0 = tensorPattern(t0);                                               \
*66ae1d60SPeiming Liu    auto p1 = tensorPattern(t1);                                               \
*66ae1d60SPeiming Liu    auto p2 = tensorPattern(t2);                                               \
*66ae1d60SPeiming Liu    auto s = merger.buildLattices(e, l0);                                      \
*66ae1d60SPeiming Liu                                                                               \
*66ae1d60SPeiming Liu    expectNumLatPoints(s, 3);                                                  \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(0), DISJ##Pattern(CONJ##Pattern(p0, p1), p2),        \
*66ae1d60SPeiming Liu                   loopsToBits({{l0, t0}, {l0, t1}, {l0, t2}}));               \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 2, CONJ##Pattern(p0, p1),             \
*66ae1d60SPeiming Liu                              loopsToBits({{l0, t0}, {l0, t1}}));              \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 2, p2, loopsToBits({{l0, t2}}));      \
*66ae1d60SPeiming Liu                                                                               \
*66ae1d60SPeiming Liu    s = merger.optimizeSet(s);                                                 \
*66ae1d60SPeiming Liu    expectNumLatPoints(s, 3);                                                  \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(0), DISJ##Pattern(CONJ##Pattern(p0, p1), p2),        \
*66ae1d60SPeiming Liu                   loopsToBits({{l0, t0}, {l0, t1}, {l0, t2}}));               \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 2, CONJ##Pattern(p0, p1),             \
*66ae1d60SPeiming Liu                              loopsToBits({{l0, t0}, {l0, t1}}));              \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 2, p2, loopsToBits({{l0, t2}}));      \
*66ae1d60SPeiming Liu  }
*66ae1d60SPeiming Liu
*66ae1d60SPeiming LiuFOREVERY_PAIR_OF_COMMON_CONJ_DISJ_BINOP(IMPL_MERGER_TEST_CONJ_DISJ)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu#undef IMPL_MERGER_TEST_CONJ_DISJ
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu/// Vector addition (disjunction) then addition (disjunction), i.e.;
*66ae1d60SPeiming Liu///   a(i) = b(i) + c(i) + d(i)
*66ae1d60SPeiming Liu/// which should form
*66ae1d60SPeiming Liu/// {
*66ae1d60SPeiming Liu///   lat( i_00 i_01 i_02 / (tensor_0 + tensor_1) + tensor_2 )
*66ae1d60SPeiming Liu///   lat( i_02 i_01 / tensor_2 + tensor_1 )
*66ae1d60SPeiming Liu///   lat( i_02 i_00 / tensor_2 + tensor_0 )
*66ae1d60SPeiming Liu///   lat( i_01 i_00 / tensor_1 + tensor_0 )
*66ae1d60SPeiming Liu///   lat( i_02 / tensor_2 )
*66ae1d60SPeiming Liu///   lat( i_01 / tensor_1 )
*66ae1d60SPeiming Liu///   lat( i_00 / tensor_0 )
*66ae1d60SPeiming Liu/// }
*66ae1d60SPeiming Liu#define IMPL_MERGER_TEST_DISJ_DISJ(DISJ1, DISJ2)                               \
*66ae1d60SPeiming Liu  TEST_F(MergerTest4T1L, Vector_##DISJ1##_##DISJ2) {                           \
*66ae1d60SPeiming Liu    auto em = DISJ1##Expr(t0, t1);                                             \
*66ae1d60SPeiming Liu    auto e = DISJ2##Expr(em, t2);                                              \
*66ae1d60SPeiming Liu    auto p0 = tensorPattern(t0);                                               \
*66ae1d60SPeiming Liu    auto p1 = tensorPattern(t1);                                               \
*66ae1d60SPeiming Liu    auto p2 = tensorPattern(t2);                                               \
*66ae1d60SPeiming Liu    auto s = merger.buildLattices(e, l0);                                      \
*66ae1d60SPeiming Liu                                                                               \
*66ae1d60SPeiming Liu    expectNumLatPoints(s, 7);                                                  \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(0), DISJ2##Pattern(DISJ1##Pattern(p0, p1), p2),      \
*66ae1d60SPeiming Liu                   loopsToBits({{l0, t0}, {l0, t1}, {l0, t2}}));               \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 6, DISJ2##Pattern(p1, p2),            \
*66ae1d60SPeiming Liu                              loopsToBits({{l0, t1}, {l0, t2}}));              \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 6, DISJ2##Pattern(p0, p2),            \
*66ae1d60SPeiming Liu                              loopsToBits({{l0, t0}, {l0, t2}}));              \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 6, DISJ1##Pattern(p0, p1),            \
*66ae1d60SPeiming Liu                              loopsToBits({{l0, t0}, {l0, t1}}));              \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 6, p2, loopsToBits({{l0, t2}}));      \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 6, p1, loopsToBits({{l0, t1}}));      \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 6, p0, loopsToBits({{l0, t0}}));      \
*66ae1d60SPeiming Liu                                                                               \
*66ae1d60SPeiming Liu    s = merger.optimizeSet(s);                                                 \
*66ae1d60SPeiming Liu    expectNumLatPoints(s, 7);                                                  \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(0), DISJ2##Pattern(DISJ1##Pattern(p0, p1), p2),      \
*66ae1d60SPeiming Liu                   loopsToBits({{l0, t0}, {l0, t1}, {l0, t2}}));               \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 6, DISJ2##Pattern(p1, p2),            \
*66ae1d60SPeiming Liu                              loopsToBits({{l0, t1}, {l0, t2}}));              \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 6, DISJ2##Pattern(p0, p2),            \
*66ae1d60SPeiming Liu                              loopsToBits({{l0, t0}, {l0, t2}}));              \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 6, DISJ1##Pattern(p0, p1),            \
*66ae1d60SPeiming Liu                              loopsToBits({{l0, t0}, {l0, t1}}));              \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 6, p2, loopsToBits({{l0, t2}}));      \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 6, p1, loopsToBits({{l0, t1}}));      \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 6, p0, loopsToBits({{l0, t0}}));      \
*66ae1d60SPeiming Liu  }
*66ae1d60SPeiming Liu
*66ae1d60SPeiming LiuFOREVERY_PAIR_OF_COMMON_DISJ_DISJ_BINOP(IMPL_MERGER_TEST_DISJ_DISJ)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu#undef IMPL_MERGER_TEST_DISJ_DISJ
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu/// Vector multiplication (conjunction) then multiplication (conjunction), i.e.;
*66ae1d60SPeiming Liu///   a(i) = b(i) * c(i) * d(i);
*66ae1d60SPeiming Liu/// which should form
*66ae1d60SPeiming Liu/// {
*66ae1d60SPeiming Liu///    lat( i_00 i_01 i_02 / tensor_0 * tensor_1 * tensor_2 )
*66ae1d60SPeiming Liu/// }
*66ae1d60SPeiming Liu#define IMPL_MERGER_TEST_CONJ_CONJ(CONJ1, CONJ2)                               \
*66ae1d60SPeiming Liu  TEST_F(MergerTest4T1L, vector_##CONJ1##_##CONJ2) {                           \
*66ae1d60SPeiming Liu    auto em = CONJ1##Expr(t0, t1);                                             \
*66ae1d60SPeiming Liu    auto e = CONJ2##Expr(em, t2);                                              \
*66ae1d60SPeiming Liu    auto p0 = tensorPattern(t0);                                               \
*66ae1d60SPeiming Liu    auto p1 = tensorPattern(t1);                                               \
*66ae1d60SPeiming Liu    auto p2 = tensorPattern(t2);                                               \
*66ae1d60SPeiming Liu    auto s = merger.buildLattices(e, l0);                                      \
*66ae1d60SPeiming Liu    expectNumLatPoints(s, 1);                                                  \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(0), CONJ2##Pattern(CONJ1##Pattern(p0, p1), p2),      \
*66ae1d60SPeiming Liu                   loopsToBits({{l0, t0}, {l0, t1}, {l0, t2}}));               \
*66ae1d60SPeiming Liu    s = merger.optimizeSet(s);                                                 \
*66ae1d60SPeiming Liu    expectNumLatPoints(s, 1);                                                  \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(0), CONJ2##Pattern(CONJ1##Pattern(p0, p1), p2),      \
*66ae1d60SPeiming Liu                   loopsToBits({{l0, t0}, {l0, t1}, {l0, t2}}), true);         \
*66ae1d60SPeiming Liu  }
*66ae1d60SPeiming Liu
*66ae1d60SPeiming LiuFOREVERY_PAIR_OF_COMMON_CONJ_CONJ_BINOP(IMPL_MERGER_TEST_CONJ_CONJ)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu#undef IMPL_MERGER_TEST_CONJ_CONJ
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu/// Vector addition (disjunction) of 2 vectors, i.e.;
*66ae1d60SPeiming Liu///   a(i) = b(i) + c(i)
*66ae1d60SPeiming Liu/// which should form the 3 lattice points
*66ae1d60SPeiming Liu/// {
*66ae1d60SPeiming Liu///   lat( i_00 i_01 / (sparse_tensor_0 + dense_tensor_1) )
*66ae1d60SPeiming Liu///   lat( i_00 / sparse_tensor_0 )
*66ae1d60SPeiming Liu///   lat( i_01 / dense_tensor_1 )
*66ae1d60SPeiming Liu/// }
*66ae1d60SPeiming Liu/// which should be optimized to
*66ae1d60SPeiming Liu/// {
*66ae1d60SPeiming Liu///   lat( i_00 i_01 / (sparse_tensor_0 + dense_tensor_1) ) (not singleton)
*66ae1d60SPeiming Liu///   lat( i_01 / dense_tensor_0 ) (no sparse dimension)
*66ae1d60SPeiming Liu/// }
*66ae1d60SPeiming Liu///
*66ae1d60SPeiming Liu/// lat( i_00 / sparse_tensor_0 ) should be opted out as it only has dense diff
*66ae1d60SPeiming Liu/// with lat( i_00 i_01 / (sparse_tensor_0 + dense_tensor_1) ).
*66ae1d60SPeiming Liu#define IMPL_MERGER_TEST_OPTIMIZED_DISJ(OP)                                    \
*66ae1d60SPeiming Liu  TEST_F(MergerTest3T1LD, vector_opted_##OP) {                                 \
*66ae1d60SPeiming Liu    auto e = OP##Expr(tensor(t0), tensor(t1));                                 \
*66ae1d60SPeiming Liu    auto p0 = tensorPattern(t0);                                               \
*66ae1d60SPeiming Liu    auto p1 = tensorPattern(t1);                                               \
*66ae1d60SPeiming Liu    auto s = merger.buildLattices(e, l0);                                      \
*66ae1d60SPeiming Liu                                                                               \
*66ae1d60SPeiming Liu    expectNumLatPoints(s, 3);                                                  \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(0), OP##Pattern(p0, p1),                             \
*66ae1d60SPeiming Liu                   loopsToBits({{l0, t0}, {l0, t1}}));                         \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 2, p0, loopsToBits({{l0, t0}}));      \
*66ae1d60SPeiming Liu    expectLatPointWithinRange(s, lat(1), 2, p1, loopsToBits({{l0, t1}}));      \
*66ae1d60SPeiming Liu                                                                               \
*66ae1d60SPeiming Liu    s = merger.optimizeSet(s);                                                 \
*66ae1d60SPeiming Liu    expectNumLatPoints(s, 2);                                                  \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(0), OP##Pattern(p0, p1),                             \
*66ae1d60SPeiming Liu                   loopsToBits({{l0, t0}, {l0, t1}}), true);                   \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(1), p1, loopsToBits({{l0, t1}}), true);              \
*66ae1d60SPeiming Liu  }
*66ae1d60SPeiming Liu
*66ae1d60SPeiming LiuFOREVERY_COMMON_DISJ_BINOP(IMPL_MERGER_TEST_OPTIMIZED_DISJ)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu#undef IMPL_MERGER_TEST_OPTIMIZED_CONJ
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu/// Vector multiplication (conjunction) of 2 vectors, i.e.:
*66ae1d60SPeiming Liu///   a(i) = b(i) * c(i)
*66ae1d60SPeiming Liu/// which should form the single lattice point
*66ae1d60SPeiming Liu/// {
*66ae1d60SPeiming Liu///   lat( i_00 i_01 / (sparse_tensor_0 * dense_tensor_1) )
*66ae1d60SPeiming Liu/// }
*66ae1d60SPeiming Liu/// it should be optimized to
*66ae1d60SPeiming Liu/// {
*66ae1d60SPeiming Liu///   lat( i_00 / (sparse_tensor_0 * dense_tensor_1) )
*66ae1d60SPeiming Liu/// }
*66ae1d60SPeiming Liu/// since i_01 is a dense dimension.
*66ae1d60SPeiming Liu#define IMPL_MERGER_TEST_OPTIMIZED_CONJ(OP)                                    \
*66ae1d60SPeiming Liu  TEST_F(MergerTest3T1LD, vector_opted_##OP) {                                 \
*66ae1d60SPeiming Liu    auto e = OP##Expr(t0, t1);                                                 \
*66ae1d60SPeiming Liu    auto p0 = tensorPattern(t0);                                               \
*66ae1d60SPeiming Liu    auto p1 = tensorPattern(t1);                                               \
*66ae1d60SPeiming Liu    auto s = merger.buildLattices(e, l0);                                      \
*66ae1d60SPeiming Liu                                                                               \
*66ae1d60SPeiming Liu    expectNumLatPoints(s, 1);                                                  \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(0), OP##Pattern(p0, p1),                             \
*66ae1d60SPeiming Liu                   loopsToBits({{l0, t0}, {l0, t1}}));                         \
*66ae1d60SPeiming Liu                                                                               \
*66ae1d60SPeiming Liu    s = merger.optimizeSet(s);                                                 \
*66ae1d60SPeiming Liu    expectNumLatPoints(s, 1);                                                  \
*66ae1d60SPeiming Liu    expectLatPoint(s, lat(0), OP##Pattern(p0, p1), loopsToBits({{l0, t0}}),    \
*66ae1d60SPeiming Liu                   true);                                                      \
*66ae1d60SPeiming Liu  }
*66ae1d60SPeiming Liu
*66ae1d60SPeiming LiuFOREVERY_COMMON_CONJ_BINOP(IMPL_MERGER_TEST_OPTIMIZED_CONJ)
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu#undef IMPL_MERGER_TEST_OPTIMIZED_CONJ
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu// TODO: mult-dim tests
*66ae1d60SPeiming Liu
*66ae1d60SPeiming Liu// restore warning status
*66ae1d60SPeiming Liu#if defined(_MSC_VER) && !defined(__clang__)
*66ae1d60SPeiming Liu#pragma warning(pop)
*66ae1d60SPeiming Liu#endif