1
      2
      3
      4
      5
      6
      7
      8
      9
     10
     11
     12
     13
     14
     15
     16
     17
     18
     19
     20
     21
     22
     23
     24
     25
     26
     27
     28
     29
     30
     31
     32
     33
     34
     35
     36
     37
     38
     39
     40
     41
     42
     43
     44
     45
     46
     47
     48
     49
     50
     51
     52
     53
     54
     55
     56
     57
     58
     59
     60
     61
     62
     63
#ifndef ULMBLAS_IMPL_LEVEL1EXTENSIONS_TRLCOPY_TCC
#define ULMBLAS_IMPL_LEVEL1EXTENSIONS_TRLCOPY_TCC 1

#include <algorithm>
#include <ulmblas/impl/level1extensions/trlcopy.h>
#include <ulmblas/impl/auxiliary/conjugate.h>
#include <ulmblas/impl/level1/copy.h>

namespace ulmBLAS {

template <typename IndexType, typename MX, typename MY>
void
trlcopy(IndexType    m,
        IndexType    n,
        bool         unit,
        bool         conjA,
        MX           *X,
        IndexType    incRowX,
        IndexType    incColX,
        MY           *Y,
        IndexType    incRowY,
        IndexType    incColY)
{
    const IndexType    UnitStride(1);

    if (m<=0 || n<=0) {
        return;
    }

    if (unit) {
        trlcopy(m-1, n-1false, conjA,
                &X[1*incRowX], incRowX, incColX,
                &Y[1*incRowY], incRowY, incColY);
        return;
    }

    if (incRowX==UnitStride && incRowY==UnitStride) {
        const IndexType k = std::min(m, n);
        for (IndexType j=0; j<k; ++j) {
            copy(m-j, conjA,
                 &X[j*(incRowX+incColX)], UnitStride,
                 &Y[j*(incRowY+incColY)], UnitStride);
        }
    } else if (incColX==UnitStride && incColY==UnitStride) {
        for (IndexType i=0; i<m; ++i) {
            copy(std::min(i+1,n), conjA,
                 &X[i*incRowX], UnitStride,
                 &Y[i*incRowY], UnitStride);
        }
    } else {
        const IndexType k = std::min(m, n);
        for (IndexType j=0; j<k; ++j) {
            for (IndexType i=j; i<m; ++i) {
                Y[i*incRowY+j*incColY] = conjugate(X[i*incRowX+j*incColX],
                                                   conjA);
            }
        }
    }
}

// namespace ulmBLAS

#endif // ULMBLAS_IMPL_LEVEL1EXTENSIONS_TRLCOPY_TCC 1