SparseTensor/python/test_SpMM.py

4748cc69Swren romano# RUN: SUPPORT_LIB=%mlir_runner_utils_dir/libmlir_c_runner_utils%shlibext \
4748cc69Swren romano# RUN:   %PYTHON %s | FileCheck %s
286248dbSwren romano
286248dbSwren romanoimport ctypes
286248dbSwren romanoimport numpy as np
286248dbSwren romanoimport os
8b83b8f1SAart Bikimport sys
286248dbSwren romano
286248dbSwren romanofrom mlir import ir
286248dbSwren romanofrom mlir import runtime as rt
286248dbSwren romano
286248dbSwren romanofrom mlir.dialects import sparse_tensor as st
286248dbSwren romanofrom mlir.dialects import builtin
36550692SRiver Riddlefrom mlir.dialects import func
286248dbSwren romanofrom mlir.dialects.linalg.opdsl import lang as dsl
286248dbSwren romano
8b83b8f1SAart Bik_SCRIPT_PATH = os.path.dirname(os.path.abspath(__file__))
8b83b8f1SAart Biksys.path.append(_SCRIPT_PATH)
8b83b8f1SAart Bikfrom tools import sparse_compiler
286248dbSwren romano
286248dbSwren romano@dsl.linalg_structured_op
286248dbSwren romanodef matmul_dsl(
286248dbSwren romano    A=dsl.TensorDef(dsl.T, dsl.S.M, dsl.S.K),
286248dbSwren romano    B=dsl.TensorDef(dsl.T, dsl.S.K, dsl.S.N),
286248dbSwren romano    C=dsl.TensorDef(dsl.T, dsl.S.M, dsl.S.N, output=True)):
286248dbSwren romano    C[dsl.D.m, dsl.D.n] += A[dsl.D.m, dsl.D.k] * B[dsl.D.k, dsl.D.n]
286248dbSwren romano
286248dbSwren romano
286248dbSwren romanodef build_SpMM(attr: st.EncodingAttr):
286248dbSwren romano    """Build SpMM kernel.
286248dbSwren romano
286248dbSwren romano  This method generates a linalg op with for matrix multiplication using
286248dbSwren romano  just the Python API. Effectively, a generic linalg op is constructed
286248dbSwren romano  that computes C(i,j) += A(i,k) * B(k,j) for annotated matrix A.
286248dbSwren romano  """
286248dbSwren romano    module = ir.Module.create()
286248dbSwren romano    f64 = ir.F64Type.get()
286248dbSwren romano    a = ir.RankedTensorType.get([3, 4], f64, attr)
286248dbSwren romano    b = ir.RankedTensorType.get([4, 2], f64)
286248dbSwren romano    c = ir.RankedTensorType.get([3, 2], f64)
286248dbSwren romano    arguments = [a, b, c]
286248dbSwren romano    with ir.InsertionPoint(module.body):
286248dbSwren romano
36550692SRiver Riddle        @func.FuncOp.from_py_func(*arguments)
286248dbSwren romano        def spMxM(*args):
286248dbSwren romano            return matmul_dsl(args[0], args[1], outs=[args[2]])
286248dbSwren romano
286248dbSwren romano    return module
286248dbSwren romano
286248dbSwren romano
286248dbSwren romanodef boilerplate(attr: st.EncodingAttr):
286248dbSwren romano    """Returns boilerplate main method.
286248dbSwren romano
286248dbSwren romano  This method sets up a boilerplate main method that takes three tensors
286248dbSwren romano  (a, b, c), converts the first tensor a into s sparse tensor, and then
286248dbSwren romano  calls the sparse kernel for matrix multiplication. For convenience,
286248dbSwren romano  this part is purely done as string input.
286248dbSwren romano  """
286248dbSwren romano    return f"""
2310ced8SRiver Riddlefunc.func @main(%ad: tensor<3x4xf64>, %b: tensor<4x2xf64>, %c: tensor<3x2xf64>) -> tensor<3x2xf64>
286248dbSwren romano  attributes {{ llvm.emit_c_interface }} {{
286248dbSwren romano  %a = sparse_tensor.convert %ad : tensor<3x4xf64> to tensor<3x4xf64, {attr}>
286248dbSwren romano  %0 = call @spMxM(%a, %b, %c) : (tensor<3x4xf64, {attr}>,
286248dbSwren romano                                  tensor<4x2xf64>,
286248dbSwren romano                                  tensor<3x2xf64>) -> tensor<3x2xf64>
286248dbSwren romano  return %0 : tensor<3x2xf64>
286248dbSwren romano}}
286248dbSwren romano"""
286248dbSwren romano
286248dbSwren romano
28063a28SAart Bikdef build_compile_and_run_SpMM(attr: st.EncodingAttr, compiler):
286248dbSwren romano    # Build.
286248dbSwren romano    module = build_SpMM(attr)
286248dbSwren romano    func = str(module.operation.regions[0].blocks[0].operations[0].operation)
286248dbSwren romano    module = ir.Module.parse(func + boilerplate(attr))
286248dbSwren romano
286248dbSwren romano    # Compile.
28063a28SAart Bik    engine = compiler.compile_and_jit(module)
286248dbSwren romano
286248dbSwren romano    # Set up numpy input and buffer for output.
286248dbSwren romano    a = np.array(
286248dbSwren romano        [[1.1, 0.0, 0.0, 1.4], [0.0, 0.0, 0.0, 0.0], [0.0, 0.0, 3.3, 0.0]],
286248dbSwren romano        np.float64)
286248dbSwren romano    b = np.array([[1.0, 2.0], [4.0, 3.0], [5.0, 6.0], [8.0, 7.0]], np.float64)
286248dbSwren romano    c = np.zeros((3, 2), np.float64)
286248dbSwren romano
286248dbSwren romano    mem_a = ctypes.pointer(ctypes.pointer(rt.get_ranked_memref_descriptor(a)))
286248dbSwren romano    mem_b = ctypes.pointer(ctypes.pointer(rt.get_ranked_memref_descriptor(b)))
286248dbSwren romano    mem_c = ctypes.pointer(ctypes.pointer(rt.get_ranked_memref_descriptor(c)))
64e171c2SBixia Zheng    # Allocate a MemRefDescriptor to receive the output tensor.
64e171c2SBixia Zheng    # The buffer itself is allocated inside the MLIR code generation.
64e171c2SBixia Zheng    ref_out = rt.make_nd_memref_descriptor(2, ctypes.c_double)()
64e171c2SBixia Zheng    mem_out = ctypes.pointer(ctypes.pointer(ref_out))
286248dbSwren romano
286248dbSwren romano    # Invoke the kernel and get numpy output.
286248dbSwren romano    # Built-in bufferization uses in-out buffers.
286248dbSwren romano    # TODO: replace with inplace comprehensive bufferization.
286248dbSwren romano    engine.invoke('main', mem_out, mem_a, mem_b, mem_c)
286248dbSwren romano
286248dbSwren romano    # Sanity check on computed result.
286248dbSwren romano    expected = np.matmul(a, b);
286248dbSwren romano    c = rt.ranked_memref_to_numpy(mem_out[0])
286248dbSwren romano    if np.allclose(c, expected):
286248dbSwren romano        pass
286248dbSwren romano    else:
286248dbSwren romano        quit(f'FAILURE')
286248dbSwren romano
286248dbSwren romano
4748cc69Swren romanodef main():
286248dbSwren romano    support_lib = os.getenv('SUPPORT_LIB')
4748cc69Swren romano    assert support_lib is not None, 'SUPPORT_LIB is undefined'
4748cc69Swren romano    if not os.path.exists(support_lib):
4748cc69Swren romano        raise FileNotFoundError(errno.ENOENT, os.strerror(errno.ENOENT), support_lib)
286248dbSwren romano
4748cc69Swren romano    # CHECK-LABEL: TEST: testSpMM
4748cc69Swren romano    print('\nTEST: testSpMM')
286248dbSwren romano    with ir.Context() as ctx, ir.Location.unknown():
286248dbSwren romano        count = 0
286248dbSwren romano        # Loop over various ways to compile and annotate the SpMM kernel with
286248dbSwren romano        # a *single* sparse tensor. Note that we deliberate do not exhaustively
286248dbSwren romano        # search the full state space to reduce runtime of the test. It is
286248dbSwren romano        # straightforward to adapt the code below to explore more combinations.
*4620032eSNick Kreeger        par = 0
*4620032eSNick Kreeger        vec = 0
286248dbSwren romano        vl = 1
286248dbSwren romano        e = False
*4620032eSNick Kreeger        opt = (f'parallelization-strategy={par} '
*4620032eSNick Kreeger               f'vectorization-strategy={vec} '
286248dbSwren romano               f'vl={vl} enable-simd-index32={e}')
286248dbSwren romano        levels = [[st.DimLevelType.dense, st.DimLevelType.dense],
286248dbSwren romano                  [st.DimLevelType.dense, st.DimLevelType.compressed],
286248dbSwren romano                  [st.DimLevelType.compressed, st.DimLevelType.dense],
286248dbSwren romano                  [st.DimLevelType.compressed, st.DimLevelType.compressed]]
286248dbSwren romano        orderings = [
286248dbSwren romano            ir.AffineMap.get_permutation([0, 1]),
286248dbSwren romano            ir.AffineMap.get_permutation([1, 0])
286248dbSwren romano        ]
286248dbSwren romano        bitwidths = [0]
28063a28SAart Bik        compiler = sparse_compiler.SparseCompiler(
28063a28SAart Bik            options=opt, opt_level=0, shared_libs=[support_lib])
286248dbSwren romano        for level in levels:
286248dbSwren romano            for ordering in orderings:
286248dbSwren romano                for pwidth in bitwidths:
286248dbSwren romano                    for iwidth in bitwidths:
286248dbSwren romano                        attr = st.EncodingAttr.get(level, ordering, pwidth, iwidth)
28063a28SAart Bik                        build_compile_and_run_SpMM(attr, compiler)
286248dbSwren romano                        count = count + 1
4748cc69Swren romano        # CHECK: Passed 8 tests
286248dbSwren romano        print('Passed ', count, 'tests')
4748cc69Swren romano
312c5140SAart Bik
4748cc69Swren romanoif __name__ == '__main__':
4748cc69Swren romano    main()