Operators /= and %= plus function div() for QofInt128.

2025-02-25 18:55:30 -06:00 · 2014-11-17 12:13:34 -08:00 · 2014-11-17 12:13:34 -08:00 · 810a6bc8ae
commit 810a6bc8ae
parent 1c83db5896
3 changed files with 240 additions and 3 deletions
--- a/src/libqof/qof/qofint128.cpp
+++ b/src/libqof/qof/qofint128.cpp
@ -30,12 +30,20 @@ extern "C"
 #include "qofint128.hpp"

 #include <iomanip>
+#include <utility>
+#include <cassert>

 /* All algorithms from Donald E. Knuth, "The Art of Computer
 * Programming, Volume 2: Seminumerical Algorithms", 3rd Ed.,
 * Addison-Wesley, 1998.
 */

+namespace {
+    static const uint sublegs = QofInt128::numlegs * 2;
+    static const uint sublegbits = QofInt128::legbits / 2;
+    static const uint64_t sublegmask = (UINT64_C(1) << sublegbits) - 1;
+}
+
 QofInt128::QofInt128 () : m_flags {}, m_hi {0}, m_lo {0}{}

 QofInt128::QofInt128 (int64_t lower) :
@ -340,9 +348,6 @@ QofInt128::operator*= (const QofInt128& b) noexcept
 * algorithms.
 */

-    static const uint sublegs = numlegs * 2;
-    static const uint sublegbits = legbits / 2;
-    static const uint sublegmask = (UINT64_C(1) << sublegbits) - 1;
    uint64_t av[sublegs] {(m_lo & sublegmask), (m_lo >> sublegbits),
            (m_hi & sublegmask), (m_hi >> sublegbits)};
    uint64_t bv[sublegs] {(b.m_lo & sublegmask), (b.m_lo >> sublegbits),
@ -390,15 +395,185 @@ QofInt128::operator*= (const QofInt128& b) noexcept
    return *this;
 }

+namespace {
+/* Algorithm from Knuth (full citation at operator*=) p272ff.  Again, there
+ * are faster algorithms out there, but they require much larger numbers to
+ * be of benefit.
+ */
+/* We're using arrays here instead of vectors to avoid an alloc. */
+void
+div_multi_leg (uint64_t* u, size_t m, uint64_t* v, size_t n, QofInt128& q, QofInt128& r) noexcept
+{
+/* D1, Normalization */
+    uint64_t qv[sublegs] {};
+    uint64_t d {(UINT64_C(1) << sublegbits)/(v[n - 1] + UINT64_C(1))};
+    uint64_t carry {UINT64_C(0)};
+    for (auto i = 0; i < m; ++i)
+    {
+        u[i] = u[i] * d + carry;
+        if (u[i] > sublegmask)
+        {
+            carry = u[i] >> sublegbits;
+            u[i] &= sublegmask;
+        }
+        else
+            carry = UINT64_C(0);
+        assert (u[i] <= sublegmask);
+    }
+    if (carry)
+    {
+        u[m++] = carry;
+        carry = UINT64_C(0);
+    }
+    for (auto i = 0; i < n; ++i)
+    {
+        v[i] = v[i] * d + carry;
+        if (v[i] > sublegmask)
+        {
+            carry = v[i] >> sublegbits;
+            v[i] &= sublegmask;
+        }
+        else
+            carry = UINT64_C(0);
+        assert (v[i] < sublegmask);
+    }
+    assert (carry == UINT64_C(0));
+    for (int j = m - n; j >= 0; j--) //D3
+    {
+        int64_t qhat, rhat;
+        qhat = ((u[j + n] << sublegbits) + u[j + n - 1]) / v[n - 1];
+        rhat = ((u[j + n] << sublegbits) + u[j + n - 1]) % v[n - 1];
+
+        while (qhat > sublegmask ||
+               (rhat <= sublegmask &&
+                ((qhat * v[n - 2]) > ((rhat << sublegbits) + u[j + n - 2]))))
+        {
+            --qhat;
+            rhat += v[n - 1];
+        }
+        carry = UINT64_C(0);
+        uint64_t borrow {};
+        for (auto k = 0; k < n; ++k) //D4
+        {
+            auto subend = qhat * v[k] + carry;
+            carry = subend >> sublegbits;
+            subend &= sublegmask;
+            if (u[j + k] >= subend)
+            {
+                u[j + k] = u[j + k] - subend;
+                borrow = UINT64_C(0);
+            }
+            else
+            {
+                if (u[j + k + 1] > 0)
+                    --u[j + k + 1];
+                else
+                    ++borrow;
+                u[j + k] = u[j + k] + sublegmask + 1 - subend;
+                u[j + k] &= sublegmask;
+            }
+        }
+        u[j + n] -= carry;
+        qv[j] = qhat;
+        if (borrow) //D5
+        { //D6
+            --qv[j];
+            carry = UINT64_C(0);
+            for (auto k = 0; k < n; ++k)
+            {
+                u[j + k] += v[k] + carry;
+                if (u[j + k] > sublegmask)
+                {
+                    carry = u[j + k] >> sublegbits;
+                    u[j + k] &= sublegmask;
+                }
+            }
+            u[j + n] += carry;
+        }
+    }//D7
+    q = QofInt128 ((qv[3] << sublegbits) + qv[2], (qv[1] << sublegbits) + qv[0]);
+    r = QofInt128 ((u[3] << sublegbits) + u[2], (u[1] << sublegbits) + u[0]);
+    r /= d;
+}
+
+void
+div_single_leg (uint64_t* u, size_t m, uint64_t v, QofInt128& q, QofInt128& r) noexcept
+{
+    uint64_t qv[sublegs] {};
+    uint64_t carry {};
+    for (int i = m - 1; i >= 0; --i)
+    {
+        qv[i] = u[i] / v;
+        if (i > 0)
+        {
+            u[i - 1] += ((u[i] % v) << sublegbits);
+            u[i] = UINT64_C(0);
+        }
+        else
+            u[i] %= v;
+    }
+
+    q = QofInt128 ((qv[3] << sublegbits) + qv[2], (qv[1] << sublegbits) + qv[0]);
+    r = QofInt128 ((u[3] << sublegbits) + u[2], (u[1] << sublegbits) + u[0]);
+}
+
+}// namespace
+
+void
+QofInt128::div (const QofInt128& b, QofInt128& q, QofInt128& r) noexcept
+{
+    q.zero(), r.zero();
+    if (b.isZero())
+    {
+        q.m_flags |= NaN;
+        return;
+    }
+    if (b.isNeg())
+        q.m_flags ^= neg;
+
+    if (abs() < b.abs())
+    {
+        r = *this;
+        return;
+    }
+    if (m_hi == 0 && b.m_hi == 0) //let the hardware do it
+    {
+        q.m_lo = m_lo / b.m_lo;
+        r.m_lo = m_lo % b.m_lo;
+        return;
+    }
+
+    uint64_t u[sublegs + 2] {(m_lo & sublegmask), (m_lo >> sublegbits),
+            (m_hi & sublegmask), (m_hi >> sublegbits), 0, 0};
+    uint64_t v[sublegs] {(b.m_lo & sublegmask), (b.m_lo >> sublegbits),
+            (b.m_hi & sublegmask), (b.m_hi >> sublegbits)};
+    auto m = u[3] ? 4 : u[2] ? 3 : u[1] ? 2 : u[0] ? 1 : 0;
+    auto n = v[3] ? 4 : v[2] ? 3 : v[1] ? 2 : v[0] ? 1 : 0;
+    if (m == 0 || n == 0) //Shouldn't happen
+        return;
+    if (n == 1)
+        return div_single_leg (u, m, v[0], q, r);
+
+    return div_multi_leg (u, m, v, n, q, r);
+}
+
 QofInt128&
 QofInt128::operator/= (const QofInt128& b) noexcept
 {
+    QofInt128 q {}, r {};
+    div(b, q, r);
+    std::swap (*this, q);
    return *this;
 }

 QofInt128&
 QofInt128::operator%= (const QofInt128& b) noexcept
 {
+    QofInt128 q {}, r {};
+    div(b, q, r);
+    std::swap (*this, r);
+    if (q.isNan())
+        m_flags |= NaN;
    return *this;
 }

--- a/src/libqof/qof/qofint128.hpp
+++ b/src/libqof/qof/qofint128.hpp
@ -113,6 +113,17 @@ enum // Values for m_flags
 */
    QofInt128 pow (const QofInt128& b) const noexcept;

+/**
+ * Computes a quotient and a remainder, passed as reference parameters.
+ *
+ * 'this' is the dividend. The quotient and remainder args must be initialized
+ * to zero.
+ * @param d The divisor
+ * @param q The quotient; will be NaN if divisor = 0
+ * @param r The remainder; will be 0 if divisor = 0
+ */
+    void div (const QofInt128& d, QofInt128& q, QofInt128& r) noexcept;
+
 /**
 * Explicit conversion to int64_t.
 *
--- a/src/libqof/qof/test/gtest-qofint128.cpp
+++ b/src/libqof/qof/test/gtest-qofint128.cpp
@ -337,3 +337,54 @@ TEST(qofint128_functions, multiply)
    EXPECT_FALSE (smallest.isOverflow());

 }
+
+TEST(qofint128_functions, divide)
+{
+    int64_t barg {INT64_C(4878849681579065407)};
+    int64_t sarg {INT64_C(4344522355275710400)};
+    uint64_t uarg {UINT64_C(13567894392130486208)};
+
+    QofInt128 zero (INT64_C(0));
+    QofInt128 one (INT64_C(1));
+    QofInt128 two (INT64_C(2));
+    QofInt128 smallest (sarg);
+    QofInt128 smaller (barg);
+    QofInt128 small (uarg);
+    QofInt128 big (sarg, barg);
+    QofInt128 bigger (static_cast<uint64_t>(barg), uarg);
+
+    EXPECT_EQ (QofInt128(INT64_C(0)), zero /= smallest);
+    EXPECT_EQ (QofInt128(INT64_C(0)), zero %= smallest);
+    smallest /= zero;
+    EXPECT_TRUE (smallest.isNan());
+
+    QofInt128 r {}, q {};
+
+    small.div (smaller, q, r);
+    EXPECT_EQ (two, q);
+    EXPECT_EQ (QofInt128(INT64_C(3810195028972355394)), r);
+
+    bigger.div (bigger, q, r);
+    EXPECT_EQ (one, q);
+    EXPECT_EQ (zero, r);
+
+    bigger.div (one, q, r);
+    EXPECT_EQ (bigger, q);
+    EXPECT_EQ (zero, r);
+
+    big.div (smaller, q, r);
+    EXPECT_EQ (QofInt128(INT64_C(8213236443097627766)), q);
+    EXPECT_EQ (QofInt128(INT64_C(3162679692459777845)), r);
+
+    bigger.div (big, q, r);
+    EXPECT_EQ (two, q);
+    EXPECT_EQ (QofInt128(UINT64_C(534327326303355007),
+                         UINT64_C(3810195028972355394)), r);
+
+    big.div (bigger, q, r);
+    EXPECT_EQ (zero, q);
+    EXPECT_EQ (big, r);
+
+    EXPECT_EQ (big, big %= bigger);
+    EXPECT_EQ (two, bigger /= big);
+}