1
      2
      3
      4
      5
      6
      7
      8
      9
     10
     11
     12
     13
     14
     15
     16
     17
     18
     19
     20
     21
     22
     23
     24
     25
     26
     27
     28
     29
     30
     31
     32
     33
     34
     35
     36
     37
     38
     39
     40
     41
     42
     43
     44
     45
     46
     47
     48
     49
     50
     51
     52
     53
     54
     55
     56
     57
     58
     59
     60
     61
     62
     63
     64
     65
     66
     67
#ifndef ULMBLAS_IMPL_LEVEL1EXTENSIONS_AXPBY_TCC
#define ULMBLAS_IMPL_LEVEL1EXTENSIONS_AXPBY_TCC 1

#include <ulmblas/impl/auxiliary/conjugate.h>
#include <ulmblas/impl/level1extensions/axpby.h>

namespace ulmBLAS {

template <typename IndexType, typename Alpha, typename TX, typename Beta,
          typename TY>
void
axpby(IndexType    n,
      const Alpha  &alpha,
      const TX     *x,
      IndexType    incX,
      const Beta   &beta,
      TY           *y,
      IndexType    incY)
{
    const IndexType    UnitStride(1);

    if (n<=0) {
        return;
    }

    if (incX==UnitStride && incY==UnitStride) {
        for (IndexType i=0; i<n; ++i) {
            y[i] = beta*y[i] + alpha*x[i];
        }
    } else {
        for (IndexType i=0; i<n; ++i) {
            y[i*incY] = beta*y[i*incY] + alpha*x[i*incX];
        }
    }
}

template <typename IndexType, typename Alpha, typename TX, typename Beta,
          typename TY>
void
acxpby(IndexType    n,
       const Alpha  &alpha,
       const TX     *x,
       IndexType    incX,
       const Beta   &beta,
       TY           *y,
       IndexType    incY)
{
    const IndexType    UnitStride(1);

    if (n<=0) {
        return;
    }

    if (incX==UnitStride && incY==UnitStride) {
        for (IndexType i=0; i<n; ++i) {
            y[i] = beta*y[i] + alpha*x[i];
        }
    } else {
        for (IndexType i=0; i<n; ++i) {
            y[i*incY] = beta*y[i*incY] + alpha*conjugate(x[i*incX]);
        }
    }
}

// namespace ulmBLAS

#endif // ULMBLAS_IMPL_LEVEL1EXTENSIONS_AXPBY_TCC 1