1
      2
      3
      4
      5
      6
      7
      8
      9
     10
     11
     12
     13
     14
     15
     16
     17
     18
     19
     20
     21
     22
     23
     24
     25
     26
     27
     28
     29
     30
     31
     32
     33
     34
     35
     36
     37
     38
     39
     40
     41
     42
     43
     44
     45
     46
     47
     48
     49
     50
     51
     52
     53
     54
     55
     56
     57
     58
     59
     60
     61
     62
     63
     64
     65
     66
     67
     68
     69
     70
     71
     72
#ifndef ULMBLAS_IMPL_LEVEL1EXTENSIONS_GEHMP_TCC
#define ULMBLAS_IMPL_LEVEL1EXTENSIONS_GEHMP_TCC 1

#include <ulmblas/impl/level1extensions/gehmp.h>
#include <ulmblas/impl/level1extensions/hvp.h>

namespace ulmBLAS {

template <typename IndexType, typename Alpha, typename MA, typename MB>
void
geihmp(IndexType      m,
       IndexType      n,
       const Alpha    &alpha,
       const MA       *A,
       IndexType      incRowA,
       IndexType      incColA,
       MB             *B,
       IndexType      incRowB,
       IndexType      incColB)
{
    if (incRowA<incColA) {
        for (IndexType j=0; j<n; ++j) {
            hvp(m, alpha, &A[j*incColA], incRowA, &B[j*incColB], incRowB);
        }
    } else {
        for (IndexType i=0; i<m; ++i) {
            hvp(n, alpha, &A[i*incRowA], incColA, &B[i*incRowB], incColB);
        }
    }
}

template <typename IndexType, typename Alpha, typename MA, typename MB,
          typename Beta, typename MC>
void
gehmp(IndexType      m,
      IndexType      n,
      const Alpha    &alpha,
      const MA       *A,
      IndexType      incRowA,
      IndexType      incColA,
      const MB       *B,
      IndexType      incRowB,
      IndexType      incColB,
      const Beta     &beta,
      MC             *C,
      IndexType      incRowC,
      IndexType      incColC)
{
    if (incRowA<incColA) {
        for (IndexType j=0; j<n; ++j) {
            hvp(m,
                alpha,
                &A[j*incColA], incRowA,
                &B[j*incColB], incRowB,
                beta,
                &C[j*incColC], incRowC);
        }
    } else {
        for (IndexType i=0; i<m; ++i) {
            hvp(n,
                alpha,
                &A[i*incRowA], incColA,
                &B[i*incRowB], incColB,
                beta,
                &C[i*incRowC], incColC);
        }
    }
}

// namespace ulmBLAS

#endif // ULMBLAS_IMPL_LEVEL1EXTENSIONS_GEHMP_TCC 1