math/generic/sincosf.cpp

bbb75554SSiva Chandra//===-- Single-precision sincos function ----------------------------------===//
bbb75554SSiva Chandra//
bbb75554SSiva Chandra// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
bbb75554SSiva Chandra// See https://llvm.org/LICENSE.txt for license information.
bbb75554SSiva Chandra// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
bbb75554SSiva Chandra//
bbb75554SSiva Chandra//===----------------------------------------------------------------------===//
bbb75554SSiva Chandra
bbb75554SSiva Chandra#include "src/math/sincosf.h"
bbb75554SSiva Chandra#include "math_utils.h"
bbb75554SSiva Chandra#include "sincosf_utils.h"
bbb75554SSiva Chandra
bbb75554SSiva Chandra#include "src/__support/common.h"
bbb75554SSiva Chandra#include <math.h>
bbb75554SSiva Chandra
bbb75554SSiva Chandra#include <stdint.h>
bbb75554SSiva Chandra
bbb75554SSiva Chandranamespace __llvm_libc {
bbb75554SSiva Chandra
bbb75554SSiva Chandra// Fast sincosf implementation. Worst-case ULP is 0.5607, maximum relative
bbb75554SSiva Chandra// error is 0.5303 * 2^-23. A single-step range reduction is used for
bbb75554SSiva Chandra// small values. Large inputs have their range reduced using fast integer
bbb75554SSiva Chandra// arithmetic.
bbb75554SSiva ChandraLLVM_LIBC_FUNCTION(void, sincosf, (float y, float *sinp, float *cosp)) {
bbb75554SSiva Chandra  double x = y;
bbb75554SSiva Chandra  double s;
bbb75554SSiva Chandra  int n;
*75d2fcb0SSiva Chandra Reddy  const sincos_t *p = &SINCOSF_TABLE[0];
bbb75554SSiva Chandra
*75d2fcb0SSiva Chandra Reddy  if (abstop12(y) < abstop12(PIO4)) {
bbb75554SSiva Chandra    double x2 = x * x;
bbb75554SSiva Chandra
bbb75554SSiva Chandra    if (unlikely(abstop12(y) < abstop12(as_float(0x39800000)))) {
bbb75554SSiva Chandra      if (unlikely(abstop12(y) < abstop12(as_float(0x800000))))
bbb75554SSiva Chandra        // Force underflow for tiny y.
bbb75554SSiva Chandra        force_eval<float>(x2);
bbb75554SSiva Chandra      *sinp = y;
bbb75554SSiva Chandra      *cosp = 1.0f;
bbb75554SSiva Chandra      return;
bbb75554SSiva Chandra    }
bbb75554SSiva Chandra
bbb75554SSiva Chandra    sincosf_poly(x, x2, p, 0, sinp, cosp);
bbb75554SSiva Chandra  } else if (abstop12(y) < abstop12(120.0f)) {
bbb75554SSiva Chandra    x = reduce_fast(x, p, &n);
bbb75554SSiva Chandra
bbb75554SSiva Chandra    // Setup the signs for sin and cos.
bbb75554SSiva Chandra    s = p->sign[n & 3];
bbb75554SSiva Chandra
bbb75554SSiva Chandra    if (n & 2)
*75d2fcb0SSiva Chandra Reddy      p = &SINCOSF_TABLE[1];
bbb75554SSiva Chandra
bbb75554SSiva Chandra    sincosf_poly(x * s, x * x, p, n, sinp, cosp);
bbb75554SSiva Chandra  } else if (likely(abstop12(y) < abstop12(INFINITY))) {
bbb75554SSiva Chandra    uint32_t xi = as_uint32_bits(y);
bbb75554SSiva Chandra    int sign = xi >> 31;
bbb75554SSiva Chandra
bbb75554SSiva Chandra    x = reduce_large(xi, &n);
bbb75554SSiva Chandra
bbb75554SSiva Chandra    // Setup signs for sin and cos - include original sign.
bbb75554SSiva Chandra    s = p->sign[(n + sign) & 3];
bbb75554SSiva Chandra
bbb75554SSiva Chandra    if ((n + sign) & 2)
*75d2fcb0SSiva Chandra Reddy      p = &SINCOSF_TABLE[1];
bbb75554SSiva Chandra
bbb75554SSiva Chandra    sincosf_poly(x * s, x * x, p, n, sinp, cosp);
bbb75554SSiva Chandra  } else {
bbb75554SSiva Chandra    // Return NaN if Inf or NaN for both sin and cos.
bbb75554SSiva Chandra    *sinp = *cosp = y - y;
bbb75554SSiva Chandra
bbb75554SSiva Chandra    // Needed to set errno for +-Inf, the add is a hack to work
bbb75554SSiva Chandra    // around a gcc register allocation issue: just passing y
bbb75554SSiva Chandra    // affects code generation in the fast path.
bbb75554SSiva Chandra    invalid(y + y);
bbb75554SSiva Chandra  }
bbb75554SSiva Chandra}
bbb75554SSiva Chandra
bbb75554SSiva Chandra} // namespace __llvm_libc