plasma/docs/core__stsmqr__corner_8c_source.html

#include <lapacke.h>

#include "common.h"

#undef COMPLEX

#define REAL


/***************************************************************************/

#if defined(PLASMA_HAVE_WEAK)

#pragma weak CORE_stsmqr_corner = PCORE_stsmqr_corner

#define CORE_stsmqr_corner PCORE_stsmqr_corner

#define CORE_stsmqr PCORE_stsmqr

int  CORE_stsmqr(int side, int trans,

                 int M1, int N1, int M2, int N2, int K, int IB,

                 float *A1, int LDA1,

                 float *A2, int LDA2,

                 float *V, int LDV,

                 float *T, int LDT,

                 float *WORK, int LDWORK);

#endif

int CORE_stsmqr_corner( int m1, int n1, int m2, int n2, int m3, int n3,

                        int k, int ib, int nb,

                        float *A1, int lda1,

                        float *A2, int lda2,

                        float *A3, int lda3,

                        float *V, int ldv,

                        float *T, int ldt,

                        float *WORK, int ldwork)

{

    int i, j;

    PLASMA_enum side, trans;


    if ( m1 != n1 ) {

        coreblas_error(1, "Illegal value of M1, N1");

        return -1;

    }


    /*  Rebuild the symmetric block: WORK <- A1 */

    for (j = 0; j < n1; j++)

        for (i = j; i < m1; i++){

            *(WORK + i + j*ldwork) = *(A1 + i + j*lda1);

            if (i > j){

                *(WORK + j + i*ldwork) =  ( *(WORK + i + j*ldwork) );

            }

        }


    /*  Copy the transpose of A2: WORK+nb*ldwork <- A2' */

    for (j = 0; j < n2; j++)

        for (i = 0; i < m2; i++){

            *(WORK + j + (i + nb) * ldwork) = ( *(A2 + i + j*lda2) );

        }


    side  = PlasmaLeft;

    trans = PlasmaTrans;


    /*  Left application on |A1| */

    /*                      |A2| */

    CORE_stsmqr(side, trans, m1, n1, m2, n2, k, ib,

                WORK, ldwork, A2, lda2,

                V, ldv, T, ldt,

                WORK + 3*nb*ldwork, ldwork);


    /*  Rebuild the symmetric block: WORK+2*nb*ldwork <- A3 */

    for (j = 0; j < n3; j++)

        for (i = j; i < m3; i++){

            *(WORK + i + (j + 2*nb) * ldwork) = *(A3 + i + j*lda3);

            if (i != j){

                *(WORK + j + (i + 2*nb) * ldwork) =  ( *(WORK + i + (j + 2*nb) * ldwork) );

            }

        }

    /*  Left application on | A2'| */

    /*                      | A3 | */

    CORE_stsmqr(side, trans, n2, m2, m3, n3, k, ib,

                WORK+nb*ldwork, ldwork, WORK+2*nb*ldwork, ldwork,

                V, ldv, T, ldt,

                WORK + 3*nb*ldwork, ldwork);


    side  = PlasmaRight;

    trans = PlasmaNoTrans;


    /*  Right application on | A1 A2' | */

    CORE_stsmqr(side, trans, m1, n1, n2, m2, k, ib,

                WORK, ldwork, WORK+nb*ldwork, ldwork,

                V, ldv, T, ldt,

                WORK + 3*nb*ldwork, ldwork);


    /*  Copy back the final result to the lower part of A1 */

    /*  A1 = WORK */

    for (j = 0; j < n1; j++)

        for (i = j; i < m1; i++)

            *(A1 + i + j*lda1) = *(WORK + i + j*ldwork);


    /*  Right application on | A2 A3 | */

    CORE_stsmqr(side, trans, m2, n2, m3, n3, k, ib,

                A2, lda2, WORK+2*nb*ldwork, ldwork,

                V,  ldv,  T, ldt,

                WORK + 3*nb*ldwork, ldwork);


    /*  Copy back the final result to the lower part of A3 */

    /*  A3 = WORK+2*nb*ldwork */

    for (j = 0; j < n3; j++)

        for (i = j; i < m3; i++)

            *(A3 + i + j*lda3) = *(WORK + i + (j+ 2*nb) * ldwork);


    return PLASMA_SUCCESS;

}

/***************************************************************************/

void QUARK_CORE_stsmqr_corner(Quark *quark, Quark_Task_Flags *task_flags,

                         int m1, int n1, int m2, int n2, int m3, int n3, int k, int ib, int nb,

                         float *A1, int lda1,

                         float *A2, int lda2,

                         float *A3, int lda3,

                         float *V, int ldv,

                         float *T, int ldt)

{

    int ldwork = nb;


    QUARK_Insert_Task(quark, CORE_stsmqr_corner_quark, task_flags,

        sizeof(int),                        &m1,    VALUE,

        sizeof(int),                        &n1,    VALUE,

        sizeof(int),                        &m2,    VALUE,

        sizeof(int),                        &n2,    VALUE,

        sizeof(int),                        &m3,    VALUE,

        sizeof(int),                        &n3,    VALUE,

        sizeof(int),                        &k,     VALUE,

        sizeof(int),                        &ib,    VALUE,

        sizeof(int),                        &nb,    VALUE,

        sizeof(float)*nb*nb,    A1,            INOUT|QUARK_REGION_D|QUARK_REGION_L,

        sizeof(int),                        &lda1,  VALUE,

        sizeof(float)*nb*nb,    A2,            INOUT,

        sizeof(int),                        &lda2,  VALUE,

        sizeof(float)*nb*nb,    A3,            INOUT|QUARK_REGION_D|QUARK_REGION_L,

        sizeof(int),                        &lda3,  VALUE,

        sizeof(float)*nb*nb,    V,             INPUT,

        sizeof(int),                        &ldv,   VALUE,

        sizeof(float)*ib*nb,    T,             INPUT,

        sizeof(int),                        &ldt,   VALUE,

        sizeof(float)*4*nb*nb,    NULL,          SCRATCH,

        sizeof(int),                        &ldwork, VALUE,

        0);

}


#if defined(PLASMA_HAVE_WEAK)

#pragma weak CORE_stsmqr_corner_quark = PCORE_stsmqr_corner_quark

#define CORE_stsmqr_corner_quark PCORE_stsmqr_corner_quark

#endif

void CORE_stsmqr_corner_quark(Quark *quark)

{

    int m1;

    int n1;

    int m2;

    int n2;

    int m3;

    int n3;

    int k;

    int ib;

    int nb;

    float *A1;

    int lda1;

    float *A2;

    int lda2;

    float *A3;

    int lda3;

    float *V;

    int ldv;

    float *T;

    int ldt;

    float *WORK;

    int ldwork;


    quark_unpack_args_21(quark, m1, n1, m2, n2, m3, n3, k, ib, nb,

                         A1, lda1, A2, lda2, A3, lda3, V, ldv, T, ldt, WORK, ldwork);

    CORE_stsmqr_corner(m1, n1, m2, n2, m3, n3, k, ib, nb,

                       A1, lda1, A2, lda2, A3, lda3, V, ldv, T, ldt, WORK, ldwork);

}