plasma/docs/core__ctsmlq__corner_8c_source.html

#include <lapacke.h>

#include "common.h"

#undef REAL

#define COMPLEX


/***************************************************************************/

#if defined(PLASMA_HAVE_WEAK)

#pragma weak CORE_ctsmlq_corner = PCORE_ctsmlq_corner

#define CORE_ctsmlq_corner PCORE_ctsmlq_corner

#define CORE_ctsmlq PCORE_ctsmlq

int  CORE_ctsmlq(int side, int trans,

                 int M1, int N1, int M2, int N2, int K, int IB,

                 PLASMA_Complex32_t *A1, int LDA1,

                 PLASMA_Complex32_t *A2, int LDA2,

                 PLASMA_Complex32_t *V, int LDV,

                 PLASMA_Complex32_t *T, int LDT,

                 PLASMA_Complex32_t *WORK, int LDWORK);

#endif

int CORE_ctsmlq_corner( int m1, int n1, int m2, int n2, int m3, int n3,

                        int k, int ib, int nb,

                        PLASMA_Complex32_t *A1, int lda1,

                        PLASMA_Complex32_t *A2, int lda2,

                        PLASMA_Complex32_t *A3, int lda3,

                        PLASMA_Complex32_t *V, int ldv,

                        PLASMA_Complex32_t *T, int ldt,

                        PLASMA_Complex32_t *WORK, int ldwork)

{

    PLASMA_enum side;

    PLASMA_enum trans;

    int i, j;


    if ( m1 != n1 ) {

        coreblas_error(1, "Illegal value of M1, N1");

        return -1;

    }


    /* Rebuild the symmetric block: WORK <- A1 */

    for (i = 0; i < m1; i++)

        for (j = i; j < n1; j++){

            *(WORK + i + j*ldwork) = *(A1 + i + j*lda1);

            if (j > i){

                *(WORK + j + i*ldwork) =  conjf( *(WORK + i + j*ldwork) );

            }

        }


    /*  Copy the transpose of A2: WORK+nb*ldwork <- A2' */

    for (j = 0; j < n2; j++)

        for (i = 0; i < m2; i++){

            *(WORK + j + (i + nb) * ldwork) = conjf( *(A2 + i + j*lda2) );

        }


    side = PlasmaRight;

    trans = PlasmaConjTrans;


    /*  Right application on |A1 A2| */

    CORE_ctsmlq(side, trans, m1, n1, m2, n2, k, ib,

                WORK, ldwork, A2, lda2,

                V, ldv, T, ldt,

                WORK+3*nb*ldwork, ldwork);


    /*  Rebuild the symmetric block: WORK+2*nb*ldwork <- A3 */

    for (i = 0; i < m3; i++)

        for (j = i; j < n3; j++){

            *(WORK + i + (j + 2*nb) * ldwork) = *(A3 + i + j*lda3);

            if (j > i){

                *(WORK + j + (i + 2*nb) * ldwork) =  conjf ( *(WORK + i + (j + 2*nb) * ldwork) );

            }

        }


    /*  Right application on | A2' A3 | */

    CORE_ctsmlq(side, trans, n2, m2, m3, n3, k, ib,

                WORK+nb*ldwork, ldwork, WORK+2*nb*ldwork, ldwork,

                V, ldv, T, ldt,

                WORK + 3*nb*ldwork, ldwork);


    side = PlasmaLeft;

    trans = PlasmaNoTrans;


    /*  Left application on | A1  | */

    /*                      | A2' | */

    CORE_ctsmlq(side, trans, m1, n1, n2, m2, k, ib,

                WORK, ldwork, WORK+nb*ldwork, ldwork,

                V, ldv, T, ldt,

                WORK + 3*nb*ldwork, ldwork);


    /*  Copy back the final result to the upper part of A1 */

    /*  A1 = WORK */

    for (i = 0; i < m1; i++)

        for (j = i; j < n1; j++)

            *(A1 + i + j*lda1) = *(WORK + i + j*ldwork);


    /*  Left application on | A2 | */

    /*                      | A3 | */

    CORE_ctsmlq(side, trans, m2, n2, m3, n3, k, ib,

                A2, lda2, WORK+2*nb*ldwork, ldwork,

                V, ldv, T, ldt,

                WORK + 3*nb*ldwork, ldwork);


    /*  Copy back the final result to the upper part of A3 */

    /*  A3 = WORK+2*nb*ldwork */

    for (i = 0; i < m3; i++)

        for (j = i; j < n3; j++)

            *(A3 + i + j*lda3) = *(WORK + i + (j+ 2*nb) * ldwork);


    return PLASMA_SUCCESS;

}


/***************************************************************************/

void QUARK_CORE_ctsmlq_corner(Quark *quark, Quark_Task_Flags *task_flags,

                         int m1, int n1, int m2, int n2, int m3, int n3, int k, int ib, int nb,

                         PLASMA_Complex32_t *A1, int lda1,

                         PLASMA_Complex32_t *A2, int lda2,

                         PLASMA_Complex32_t *A3, int lda3,

                         PLASMA_Complex32_t *V, int ldv,

                         PLASMA_Complex32_t *T, int ldt)

{

    int ldwork = nb;


    QUARK_Insert_Task(quark, CORE_ctsmlq_corner_quark, task_flags,

        sizeof(int),                        &m1,    VALUE,

        sizeof(int),                        &n1,    VALUE,

        sizeof(int),                        &m2,    VALUE,

        sizeof(int),                        &n2,    VALUE,

        sizeof(int),                        &m3,    VALUE,

        sizeof(int),                        &n3,    VALUE,

        sizeof(int),                        &k,     VALUE,

        sizeof(int),                        &ib,    VALUE,

        sizeof(int),                        &nb,    VALUE,

        sizeof(PLASMA_Complex32_t)*nb*nb,    A1,            INOUT|QUARK_REGION_D|QUARK_REGION_U,

        sizeof(int),                        &lda1,  VALUE,

        sizeof(PLASMA_Complex32_t)*nb*nb,    A2,            INOUT,

        sizeof(int),                        &lda2,  VALUE,

        sizeof(PLASMA_Complex32_t)*nb*nb,    A3,            INOUT|QUARK_REGION_D|QUARK_REGION_U,

        sizeof(int),                        &lda3,  VALUE,

        sizeof(PLASMA_Complex32_t)*nb*nb,    V,             INPUT,

        sizeof(int),                        &ldv,   VALUE,

        sizeof(PLASMA_Complex32_t)*ib*nb,    T,             INPUT,

        sizeof(int),                        &ldt,   VALUE,

        sizeof(PLASMA_Complex32_t)*4*nb*nb,    NULL,          SCRATCH,

        sizeof(int),                        &ldwork, VALUE,

        0);

}


/***************************************************************************/

#if defined(PLASMA_HAVE_WEAK)

#pragma weak CORE_ctsmlq_corner_quark = PCORE_ctsmlq_corner_quark

#define CORE_ctsmlq_corner_quark PCORE_ctsmlq_corner_quark

#endif

void CORE_ctsmlq_corner_quark(Quark *quark)

{

    int m1;

    int n1;

    int m2;

    int n2;

    int m3;

    int n3;

    int k;

    int ib;

    int nb;

    PLASMA_Complex32_t *A1;

    int lda1;

    PLASMA_Complex32_t *A2;

    int lda2;

    PLASMA_Complex32_t *A3;

    int lda3;

    PLASMA_Complex32_t *V;

    int ldv;

    PLASMA_Complex32_t *T;

    int ldt;

    PLASMA_Complex32_t *WORK;

    int ldwork;


    quark_unpack_args_21(quark, m1, n1, m2, n2, m3, n3, k, ib, nb,

                         A1, lda1, A2, lda2, A3, lda3, V, ldv, T, ldt, WORK, ldwork);


    CORE_ctsmlq_corner(m1, n1, m2, n2, m3, n3, k, ib, nb,

                       A1, lda1, A2, lda2, A3, lda3, V, ldv, T, ldt, WORK, ldwork);


}