math/generic/hypotf.cpp

bbb75554SSiva Chandra//===-- Implementation of hypotf function ---------------------------------===//
bbb75554SSiva Chandra//
bbb75554SSiva Chandra// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
bbb75554SSiva Chandra// See https://llvm.org/LICENSE.txt for license information.
bbb75554SSiva Chandra// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
bbb75554SSiva Chandra//
bbb75554SSiva Chandra//===----------------------------------------------------------------------===//
bbb75554SSiva Chandra#include "src/math/hypotf.h"
*f1ec99f9STue Ly#include "src/__support/FPUtil/BasicOperations.h"
*f1ec99f9STue Ly#include "src/__support/FPUtil/FPBits.h"
*f1ec99f9STue Ly#include "src/__support/FPUtil/sqrt.h"
bbb75554SSiva Chandra#include "src/__support/common.h"
bbb75554SSiva Chandra
bbb75554SSiva Chandranamespace __llvm_libc {
bbb75554SSiva Chandra
bbb75554SSiva ChandraLLVM_LIBC_FUNCTION(float, hypotf, (float x, float y)) {
*f1ec99f9STue Ly  using DoubleBits = fputil::FPBits<double>;
*f1ec99f9STue Ly  using FPBits = fputil::FPBits<float>;
*f1ec99f9STue Ly
*f1ec99f9STue Ly  FPBits x_bits(x), y_bits(y);
*f1ec99f9STue Ly
*f1ec99f9STue Ly  uint16_t x_exp = x_bits.get_unbiased_exponent();
*f1ec99f9STue Ly  uint16_t y_exp = y_bits.get_unbiased_exponent();
*f1ec99f9STue Ly  uint16_t exp_diff = (x_exp > y_exp) ? (x_exp - y_exp) : (y_exp - x_exp);
*f1ec99f9STue Ly
*f1ec99f9STue Ly  if (exp_diff >= fputil::MantissaWidth<float>::VALUE + 2) {
*f1ec99f9STue Ly    return fputil::abs(x) + fputil::abs(y);
*f1ec99f9STue Ly  }
*f1ec99f9STue Ly
*f1ec99f9STue Ly  double xd = static_cast<double>(x);
*f1ec99f9STue Ly  double yd = static_cast<double>(y);
*f1ec99f9STue Ly
*f1ec99f9STue Ly  // These squares are exact.
*f1ec99f9STue Ly  double x_sq = xd * xd;
*f1ec99f9STue Ly  double y_sq = yd * yd;
*f1ec99f9STue Ly
*f1ec99f9STue Ly  // Compute the sum of squares.
*f1ec99f9STue Ly  double sum_sq = x_sq + y_sq;
*f1ec99f9STue Ly
*f1ec99f9STue Ly  // Compute the rounding error with Fast2Sum algorithm:
*f1ec99f9STue Ly  // x_sq + y_sq = sum_sq - err
*f1ec99f9STue Ly  double err = (x_sq >= y_sq) ? (sum_sq - x_sq) - y_sq : (sum_sq - y_sq) - x_sq;
*f1ec99f9STue Ly
*f1ec99f9STue Ly  // Take sqrt in double precision.
*f1ec99f9STue Ly  DoubleBits result(fputil::sqrt(sum_sq));
*f1ec99f9STue Ly
*f1ec99f9STue Ly  if (!DoubleBits(sum_sq).is_inf_or_nan()) {
*f1ec99f9STue Ly    // Correct rounding.
*f1ec99f9STue Ly    double r_sq = static_cast<double>(result) * static_cast<double>(result);
*f1ec99f9STue Ly    double diff = sum_sq - r_sq;
*f1ec99f9STue Ly    constexpr uint64_t mask = 0x0000'0000'3FFF'FFFFULL;
*f1ec99f9STue Ly    uint64_t lrs = result.uintval() & mask;
*f1ec99f9STue Ly
*f1ec99f9STue Ly    if (lrs == 0x0000'0000'1000'0000ULL && err < diff) {
*f1ec99f9STue Ly      result.bits |= 1ULL;
*f1ec99f9STue Ly    } else if (lrs == 0x0000'0000'3000'0000ULL && err > diff) {
*f1ec99f9STue Ly      result.bits -= 1ULL;
*f1ec99f9STue Ly    }
*f1ec99f9STue Ly  } else {
*f1ec99f9STue Ly    FPBits bits_x(x), bits_y(y);
*f1ec99f9STue Ly    if (bits_x.is_inf_or_nan() || bits_y.is_inf_or_nan()) {
*f1ec99f9STue Ly      if (bits_x.is_inf() || bits_y.is_inf())
*f1ec99f9STue Ly        return static_cast<float>(FPBits::inf());
*f1ec99f9STue Ly      if (bits_x.is_nan())
*f1ec99f9STue Ly        return x;
*f1ec99f9STue Ly      return y;
*f1ec99f9STue Ly    }
*f1ec99f9STue Ly  }
*f1ec99f9STue Ly
*f1ec99f9STue Ly  return static_cast<float>(static_cast<double>(result));
bbb75554SSiva Chandra}
bbb75554SSiva Chandra
bbb75554SSiva Chandra} // namespace __llvm_libc