math/generic/dp_trig.cpp

ca6b3542SSiva Chandra Reddy//===-- Utilities for double precision trigonometric functions ------------===//
ca6b3542SSiva Chandra Reddy//
ca6b3542SSiva Chandra Reddy// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
ca6b3542SSiva Chandra Reddy// See https://llvm.org/LICENSE.txt for license information.
ca6b3542SSiva Chandra Reddy// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
ca6b3542SSiva Chandra Reddy//
ca6b3542SSiva Chandra Reddy//===----------------------------------------------------------------------===//
ca6b3542SSiva Chandra Reddy
ca6b3542SSiva Chandra Reddy#include "src/__support/FPUtil/FPBits.h"
ca6b3542SSiva Chandra Reddy#include "src/__support/FPUtil/ManipulationFunctions.h"
ca6b3542SSiva Chandra Reddy#include "src/__support/FPUtil/UInt.h"
ca6b3542SSiva Chandra Reddy#include "src/__support/FPUtil/XFloat.h"
ca6b3542SSiva Chandra Reddy
ca6b3542SSiva Chandra Reddyusing FPBits = __llvm_libc::fputil::FPBits<double>;
ca6b3542SSiva Chandra Reddy
ca6b3542SSiva Chandra Reddynamespace __llvm_libc {
ca6b3542SSiva Chandra Reddy
ca6b3542SSiva Chandra Reddy// Implementation is based on the Payne and Hanek range reduction algorithm.
ca6b3542SSiva Chandra Reddy// The caller should ensure that x is positive.
ca6b3542SSiva Chandra Reddy// Consider:
ca6b3542SSiva Chandra Reddy//   x/y = x * 1/y = I + F
ca6b3542SSiva Chandra Reddy// I is the integral part and F the fractional part of the result of the
ca6b3542SSiva Chandra Reddy// division operation. Then M = mod(x, y) = F * y. In order to compute M, we
ca6b3542SSiva Chandra Reddy// first compute F. We do it by dropping bits from 1/y which would only
ca6b3542SSiva Chandra Reddy// contribute integral results in the operation x * 1/y. This helps us get
ca6b3542SSiva Chandra Reddy// accurate values of F even when x is a very large number.
ca6b3542SSiva Chandra Reddy//
ca6b3542SSiva Chandra Reddy// Internal operations are performed at 192 bits of precision.
ca6b3542SSiva Chandra Reddystatic double mod_impl(double x, const uint64_t y_bits[3],
ca6b3542SSiva Chandra Reddy                       const uint64_t inv_y_bits[20], int y_exponent,
ca6b3542SSiva Chandra Reddy                       int inv_y_exponent) {
ca6b3542SSiva Chandra Reddy  FPBits bits(x);
*1c92911eSMichael Jones  int exponent = bits.get_exponent();
ca6b3542SSiva Chandra Reddy  int bit_drop = (exponent - 52) + inv_y_exponent + 1;
ca6b3542SSiva Chandra Reddy  bit_drop = bit_drop >= 0 ? bit_drop : 0;
ca6b3542SSiva Chandra Reddy  int word_drop = bit_drop / 64;
ca6b3542SSiva Chandra Reddy  bit_drop %= 64;
ca6b3542SSiva Chandra Reddy  fputil::UInt<256> man4;
ca6b3542SSiva Chandra Reddy  for (size_t i = 0; i < 4; ++i) {
ca6b3542SSiva Chandra Reddy    man4[3 - i] = inv_y_bits[word_drop + i];
ca6b3542SSiva Chandra Reddy  }
ca6b3542SSiva Chandra Reddy  man4.shift_left(bit_drop);
ca6b3542SSiva Chandra Reddy  fputil::UInt<192> man_bits;
ca6b3542SSiva Chandra Reddy  for (size_t i = 0; i < 3; ++i)
ca6b3542SSiva Chandra Reddy    man_bits[i] = man4[i + 1];
ca6b3542SSiva Chandra Reddy  fputil::XFloat<192> result(inv_y_exponent - word_drop * 64 - bit_drop,
ca6b3542SSiva Chandra Reddy                             man_bits);
ca6b3542SSiva Chandra Reddy  result.mul(x);
ca6b3542SSiva Chandra Reddy  result.drop_int(); // |result| now holds fractional part of x/y.
ca6b3542SSiva Chandra Reddy
ca6b3542SSiva Chandra Reddy  fputil::UInt<192> y_man;
ca6b3542SSiva Chandra Reddy  for (size_t i = 0; i < 3; ++i)
ca6b3542SSiva Chandra Reddy    y_man[i] = y_bits[2 - i];
ca6b3542SSiva Chandra Reddy  fputil::XFloat<192> y_192(y_exponent, y_man);
ca6b3542SSiva Chandra Reddy  return result.mul(y_192);
ca6b3542SSiva Chandra Reddy}
ca6b3542SSiva Chandra Reddy
ca6b3542SSiva Chandra Reddystatic constexpr int TwoPIExponent = 2;
ca6b3542SSiva Chandra Reddy
ca6b3542SSiva Chandra Reddy// The mantissa bits of 2 * PI.
ca6b3542SSiva Chandra Reddy// The most signification bits are in the first uint64_t word
ca6b3542SSiva Chandra Reddy// and the least signification bits are in the last word. The
ca6b3542SSiva Chandra Reddy// first word includes the implicit '1' bit.
ca6b3542SSiva Chandra Reddystatic constexpr uint64_t TwoPI[] = {0xc90fdaa22168c234, 0xc4c6628b80dc1cd1,
ca6b3542SSiva Chandra Reddy                                     0x29024e088a67cc74};
ca6b3542SSiva Chandra Reddy
ca6b3542SSiva Chandra Reddystatic constexpr int InvTwoPIExponent = -3;
ca6b3542SSiva Chandra Reddy
ca6b3542SSiva Chandra Reddy// The mantissa bits of 1/(2 * PI).
ca6b3542SSiva Chandra Reddy// The most signification bits are in the first uint64_t word
ca6b3542SSiva Chandra Reddy// and the least signification bits are in the last word. The
ca6b3542SSiva Chandra Reddy// first word includes the implicit '1' bit.
ca6b3542SSiva Chandra Reddystatic constexpr uint64_t InvTwoPI[] = {
ca6b3542SSiva Chandra Reddy    0xa2f9836e4e441529, 0xfc2757d1f534ddc0, 0xdb6295993c439041,
ca6b3542SSiva Chandra Reddy    0xfe5163abdebbc561, 0xb7246e3a424dd2e0, 0x6492eea09d1921c,
ca6b3542SSiva Chandra Reddy    0xfe1deb1cb129a73e, 0xe88235f52ebb4484, 0xe99c7026b45f7e41,
ca6b3542SSiva Chandra Reddy    0x3991d639835339f4, 0x9c845f8bbdf9283b, 0x1ff897ffde05980f,
ca6b3542SSiva Chandra Reddy    0xef2f118b5a0a6d1f, 0x6d367ecf27cb09b7, 0x4f463f669e5fea2d,
ca6b3542SSiva Chandra Reddy    0x7527bac7ebe5f17b, 0x3d0739f78a5292ea, 0x6bfb5fb11f8d5d08,
ca6b3542SSiva Chandra Reddy    0x56033046fc7b6bab, 0xf0cfbc209af4361e};
ca6b3542SSiva Chandra Reddy
ca6b3542SSiva Chandra Reddydouble mod_2pi(double x) {
ca6b3542SSiva Chandra Reddy  static constexpr double _2pi = 6.283185307179586;
ca6b3542SSiva Chandra Reddy  if (x < _2pi)
ca6b3542SSiva Chandra Reddy    return x;
ca6b3542SSiva Chandra Reddy  return mod_impl(x, TwoPI, InvTwoPI, TwoPIExponent, InvTwoPIExponent);
ca6b3542SSiva Chandra Reddy}
ca6b3542SSiva Chandra Reddy
ca6b3542SSiva Chandra Reddy// Returns mod(x, pi/2)
ca6b3542SSiva Chandra Reddydouble mod_pi_over_2(double x) {
ca6b3542SSiva Chandra Reddy  static constexpr double pi_over_2 = 1.5707963267948966;
ca6b3542SSiva Chandra Reddy  if (x < pi_over_2)
ca6b3542SSiva Chandra Reddy    return x;
ca6b3542SSiva Chandra Reddy  return mod_impl(x, TwoPI, InvTwoPI, TwoPIExponent - 2, InvTwoPIExponent + 2);
ca6b3542SSiva Chandra Reddy}
ca6b3542SSiva Chandra Reddy
ca6b3542SSiva Chandra Reddy// Returns mod(x, pi/4)
ca6b3542SSiva Chandra Reddydouble mod_pi_over_4(double x) {
ca6b3542SSiva Chandra Reddy  static constexpr double pi_over_4 = 0.7853981633974483;
ca6b3542SSiva Chandra Reddy  if (x < pi_over_4)
ca6b3542SSiva Chandra Reddy    return x;
ca6b3542SSiva Chandra Reddy  return mod_impl(x, TwoPI, InvTwoPI, TwoPIExponent - 3, InvTwoPIExponent + 3);
ca6b3542SSiva Chandra Reddy}
ca6b3542SSiva Chandra Reddy
ca6b3542SSiva Chandra Reddy} // namespace __llvm_libc