IPCC/_k_n_lanczos_method_8cpp_source.html

 #include "stdafx.h"

 #include "KNLanczosMethod.h"

 #include "KNTimeMeasurement.h"

 #include <math.h>

 #include <string.h>

 #include <algorithm>

 #include "CKNGlobal.h"

 #include "KNIPCCUtility.h"

 #include "KNMPIManager.h"

 #include "mkl.h"


 #ifdef _WIN32

 #include <direct.h>

 #else

 #include <sys/stat.h>

 #include <sys/types.h>

 #endif


 #include "XeonPhi_header.h"

 unsigned int X_largest;


 using namespace std;

 bool CKNLanczosMethod::m_bStop = false;


 CKNLanczosMethod::CKNLanczosMethod()

 {

     m_pV = NULL;

     m_pAMatrix = NULL;

     m_pAMyLocalBlock = NULL;

     m_pALeftBlock = NULL;

     m_pARightBoloc = NULL;

     m_nMatrixSize = 0;

     m_nIterationCount = 0;

     m_nEigenValueCheckInterval = 0;

     m_fEigenvalueMin = 0;

     m_fEignevalueMax = 0;

     m_bReorthogonalization = false;

     m_bCalcuEigenvector = false;

     //m_nPrevIterationCount = 0;


     m_pEigenValues = NULL;

     m_pEigenVectors = NULL;

     m_pConvergedEigenValues = NULL;

     m_pConvergedEigenVectors = NULL;

     m_pRangeCheckedEigenValues = NULL;

     m_pRangeCheckedEigenVectors = NULL;

     m_pNoneSpuriousValues = NULL;

     m_pNoneSpuriousVectors = NULL;

     m_pNonClustersValues = NULL;

     m_pNonClustersVectors = NULL;


     m_pRangecheckedIndex = NULL;

     m_pNonSpuriousValueIndex = NULL;

     m_pConvergedIndex = NULL;

     m_pNonClustersValueIndex = NULL;

     m_pCheckNonClusterValue = NULL;

     m_floadMIC = 0.0;

 }


 CKNLanczosMethod::~CKNLanczosMethod()

 {

     FinalizeTemporaryArrayAndVector();

 }


 bool CKNLanczosMethod::InitializeTemporaryArrayAndVector(int nIterationCount)

 {

     bool                bRtn = true;

     /*if (nIterationCount == m_nPrevIterationCount)

         return bRtn;*/


     //if (0 != m_nPrevIterationCount)

         FinalizeTemporaryArrayAndVector();


     bRtn = false;


     CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MALLOC);

     ALLOC_WITH_NULL_INIT(m_pEigenValues, double, nIterationCount);

     CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MALLOC);


     bRtn = true;

     return bRtn;

 }


 void CKNLanczosMethod::FinalizeTemporaryArrayAndVector()

 {

     FREE_MEM(m_pEigenValues);

     FREE_MEM(m_pEigenVectors);

     FREE_MEM(m_pConvergedEigenValues);

     FREE_MEM(m_pConvergedEigenVectors);

     FREE_MEM(m_pRangeCheckedEigenValues);

     FREE_MEM(m_pRangeCheckedEigenVectors);

     FREE_MEM(m_pNoneSpuriousValues);

     FREE_MEM(m_pNoneSpuriousVectors);

     FREE_MEM(m_pNonClustersValues);

     FREE_MEM(m_pNonClustersVectors);

     FREE_MEM(m_pRangecheckedIndex);

     FREE_MEM(m_pNonSpuriousValueIndex);

     FREE_MEM(m_pConvergedIndex);

     FREE_MEM(m_pNonClustersValueIndex);

     FREE_MEM(m_pCheckNonClusterValue);

 }


 CKNLanczosMethod::LPEIGENVALUE_RESULT CKNLanczosMethod::DoLanczosMethod(CKNMatrixOperation::CKNCSR *pAMatrix, unsigned int nIterationCount, unsigned int nEigenValueCheckInterval, unsigned int nEigenValueCount, double fEigenvalueMin, double fEignevalueMax, double fConvergenceTolerance, bool bReorthogonalization, bool bCalcuEigVector, bool bWaveFunction, double load_in_MIC, CKNMatrixOperation::CKNCSR *pmylocalblock, CKNMatrixOperation::CKNCSR *leftlocalblock, CKNMatrixOperation::CKNCSR *rightlocalblock)

 {

     LPEIGENVALUE_RESULT         lpRtn = NULL;


     if (NULL == pAMatrix)

     {

         throw ERROR_MALLOC;

         return NULL;

     }


     InitVariables();


     m_pAMatrix = pAMatrix;

     m_pAMyLocalBlock = pmylocalblock;

     m_pALeftBlock = leftlocalblock;

     m_pARightBoloc = rightlocalblock;

     m_nMatrixSize = pAMatrix->GetColumnCount();

     m_nIterationCount = nIterationCount;

     m_nEigenValueCheckInterval = nEigenValueCheckInterval;

     m_nEigenValueCount = nEigenValueCount;

     m_fEigenvalueMin = fEigenvalueMin;

     m_fEignevalueMax = fEignevalueMax;

     m_bReorthogonalization = bReorthogonalization;

     m_bCalcuEigenvector = bCalcuEigVector;

     m_fConvergenceTolerance = fConvergenceTolerance;

     m_floadMIC = load_in_MIC;


     lpRtn = LanczosIteration();

     if( bCalcuEigVector )

         DoResidualCheck(pAMatrix, lpRtn);


     //if (bWaveFunction && CKNMPIManager::IsRootRank())

     if (bWaveFunction)

         BuildWaveFunction(lpRtn);


     //m_nPrevIterationCount = nIterationCount;


     return lpRtn;

 }


 CKNLanczosMethod::LPEIGENVALUE_RESULT CKNLanczosMethod::LanczosIteration()

 {

     CKNComplex                      *pAlpha = NULL;

     double                          *pAlphaReal = NULL;

     double                          *pBeta = NULL;

     double                          *pWj = NULL;

     double                          *pWjm1 = NULL;

     double                          *pWjp1 = NULL;

     CKNMatrixOperation::CKNVector   *pW = NULL;

     CKNMatrixOperation::CKNVector   V1;

     double                          *pCalculatedEigenVector = NULL;

     unsigned int                    i;


     CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MALLOC);

     LPEIGENVALUE_RESULT             lpResult = (LPEIGENVALUE_RESULT)malloc(sizeof(EIGENVALUE_RESULT));

     CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MALLOC);


     InitLanczosIterationVariables(&pAlpha, &pAlphaReal, &pBeta, &pWj, &pWjm1, &pWjp1, &pW);

     InitLanczosVector();


     pAlphaReal[0] = pBeta[0] = pBeta[1] = 0;


 #ifdef DISABLE_MPI_ROUTINE

     V1.SetSize(m_nMatrixSize);

     V1.SetAt(0, 1, 0);

 #else //DISABLE_MPI_ROUTINE

     V1.SetSize(CKNMPIManager::GetCurrentLoadBalanceCount());

     if( CKNMPIManager::IsMultiLevelMPI())

     {

         /*V1.BuildRandomVector();

         V1.Normalize(true);*/

         if (CKNMPIManager::IsRootRank())

             V1.SetAt(CKNMPIManager::GetLanczosGroupIndex()*2, 1, 0);

     }

     else

     {

         if (CKNMPIManager::IsRootRank())

             V1.SetAt(0, 1, 0);

     }

 #endif //DISABLE_MPI_ROUTINE


     lpResult->nEigenValueCount = 0;

     lpResult->pEigenValues = NULL;

     lpResult->pDegeneratedIndex = NULL;

     lpResult->pEigenVectors = NULL;

     lpResult->nEigenValueCount = 0;

     lpResult->pEigenValueFoundIteration = NULL;

     lpResult->pEigenVectorsForAMatrix = NULL;

     lpResult->pWaveFunctions = NULL;

     lpResult->nMaxEigenValueFoundIteration = 0;

     lpResult->nDegeneratedEigenValueCount = 0;


     if (m_bReorthogonalization && CKNMPIManager::IsRootRank())

     {

         m_pV[1] = V1;


         pWj[2] = 0;

         pWj[3] = 0;

     }


     LanczosIterationLoop(lpResult, &V1, m_nIterationCount, pAlpha, pAlphaReal, pBeta, pWj, pWjm1, pWjp1);

     if (CKNLanczosMethod::m_bStop)

     {

         V1.Finalize();

         FinalLanczosVector();

         FinalizeLanczosInterationVariable(pAlpha, pAlphaReal, pBeta, pWj, pWjm1, pWjp1, pW);


         return lpResult;

     }


     if (m_bCalcuEigenvector && false == CKNLanczosMethod::m_bStop)

     {


 #ifndef DISABLE_MPI_ROUTINE

         CKNMPIManager::BroadcastLanczosResult(lpResult, lpResult->nMaxEigenValueFoundIteration);

 #endif

         if (lpResult->nEigenValueCount > 0)

         {

             CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MALLOC);

             lpResult->pEigenVectorsForAMatrix = new CKNMatrixOperation::CKNVector[lpResult->nEigenValueCount];

             CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MALLOC);

             for (i = 0; i < lpResult->nEigenValueCount; i++)

 #ifdef DISABLE_MPI_ROUTINE

                 lpResult->pEigenVectorsForAMatrix[i].SetSize(m_nMatrixSize);

 #else //DISABLE_MPI_ROUTINE

                 lpResult->pEigenVectorsForAMatrix[i].SetSize(CKNMPIManager::GetCurrentLoadBalanceCount());

 #endif


             if (m_bReorthogonalization)

             {

                 for (i = 1; i <= lpResult->nMaxEigenValueFoundIteration; i++)

                     CalculateEigenVector(lpResult, m_pV[i], i);

             }

             else

                 LanczosIterationLoop(lpResult, &V1, lpResult->nMaxEigenValueFoundIteration, pAlpha, pAlphaReal, pBeta, pWj, pWjm1, pWjp1, true);

         }


         if (CKNLanczosMethod::m_bStop)

             return lpResult;


         for (i = 0; i < lpResult->nEigenValueCount; ++i)

 #ifndef DISABLE_MPI_ROUTINE

             lpResult->pEigenVectorsForAMatrix[i].Normalize(true);

 #else //DISABLE_MPI_ROUTINE

             lpResult->pEigenVectorsForAMatrix[i].Normalize();

 #endif //DISABLE_MPI_ROUTINE

     }


     V1.Finalize();


     FinalLanczosVector();

     FinalizeLanczosInterationVariable(pAlpha, pAlphaReal, pBeta, pWj, pWjm1, pWjp1, pW);


     return lpResult;

 }


 void CKNLanczosMethod::LanczosIterationLoop(CKNLanczosMethod::LPEIGENVALUE_RESULT lpResult, CKNMatrixOperation::CKNVector *V1, unsigned int nIterationCount, CKNComplex *pAlpha, double *pAlphaReal, double *pBeta, double *pWj, double *pWjm1, double *pWjp1, bool bMakeEigvVector)

 {

 //  CKNMatrixOperation::CKNVector   vector1, vector2;

     CKNMatrixOperation::CKNVector   Vj, Vjp1, Vjm1, W, VTemp;;

     double                          fANorm = 0;

     int                             nEigenvalueSolvingCount = 0;

     int                             nEigenvalueSolvingFinal = m_nIterationCount / m_nEigenValueCheckInterval;

     unsigned int                    j;

     unsigned int                    nSizePHI;

     char                            szMsg[1024];


     Vj = *V1;


 #ifdef DISABLE_MPI_ROUTINE

     Vjp1 = *V1;

     Vjm1 = *V1;

     W = *V1;

 #else

     Vjp1.SetSize(CKNMPIManager::GetCurrentLoadBalanceCount());

     Vjm1.SetSize(CKNMPIManager::GetCurrentLoadBalanceCount());

     W.SetSize(CKNMPIManager::GetCurrentLoadBalanceCount());


     int                             nPrevRank = (CKNMPIManager::GetCurrentRank() - 1 + CKNMPIManager::GetTotalNodeCount()) % CKNMPIManager::GetTotalNodeCount();

     int                             nNextRank = (CKNMPIManager::GetCurrentRank() + 1) % CKNMPIManager::GetTotalNodeCount();

     int                 tag = 1002;

     unsigned int                    nSizeFromPrevRank, nSizeFromNextRank;

     unsigned int                    nSizetoPrevRank, nSizetoNextRank;

     MPI_Status          stat_sr[2];

     MPI_Request         req_sr[2];


     nSizetoPrevRank = m_pAMatrix->nComponentsFirstUnitCell;

     nSizetoNextRank = m_pAMatrix->nComponentsLastUnitCell;


     //printf("Rank %d: Preparing to get sizes. PrevRank %d, NextRank %d\n", CKNMPIManager::GetCurrentRank(), nPrevRank, nNextRank);


     CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::COMM);

     MPI_Irecv(&nSizeFromPrevRank, 1, MPI_INT, nPrevRank, tag, CKNMPIManager::GetMPIComm(), &req_sr[0]);

     MPI_Isend(&nSizetoNextRank, 1, MPI_INT, nNextRank, tag, CKNMPIManager::GetMPIComm(), &req_sr[1]);

     MPI_Waitall(2, req_sr, stat_sr); // now Brt has B of right neighbor


     MPI_Irecv(&nSizeFromNextRank, 1, MPI_INT, nNextRank, tag, CKNMPIManager::GetMPIComm(), &req_sr[0]);

     MPI_Isend(&nSizetoPrevRank, 1, MPI_INT, nPrevRank, tag, CKNMPIManager::GetMPIComm(), &req_sr[1]);

     MPI_Waitall(2, req_sr, stat_sr);

     CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::COMM);


     //printf("Rank %d: P=%d, M=%d, N=%d\n", CKNMPIManager::GetCurrentRank(), nSizeFromPrevRank, CKNMPIManager::GetCurrentLoadBalanceCount(), nSizeFromNextRank);


 #endif


     nSizePHI = (int)(((double)CKNMPIManager::GetCurrentLoadBalanceCount()) * m_floadMIC / 100.0);

     m_floadMIC = ((double)nSizePHI) / ((double)CKNMPIManager::GetCurrentLoadBalanceCount())*100.0;


     sprintf(szMsg, "-[Rank %03d] MIC-load adjusted to %.1f(%%). DOF(MIC, Total) = (%d, %d)\n", CKNMPIManager::GetCurrentRank(), m_floadMIC, nSizePHI, CKNMPIManager::GetCurrentLoadBalanceCount());

     CKNIPCCUtility::ShowMsg(szMsg);


     double *input_real = Vj.m_vectValueRealBuffer.data();

     double *input_imaginary = Vj.m_vectValueImaginaryBuffer.data();

     unsigned int input_real_size = Vj.m_vectValueRealBuffer.size();

     unsigned int input_imaginary_size = Vj.m_vectValueImaginaryBuffer.size();

     //#pragma offload_transfer target(mic:phi_tid) nocopy(input_real[0:input_real_size]           : ALLOC)

     //#pragma offload_transfer target(mic:phi_tid) nocopy(input_imaginary[0:input_imaginary_size] : ALLOC)


     double *output_real = W.m_vectValueRealBuffer.data();

     double *output_imaginary = W.m_vectValueImaginaryBuffer.data();

     //unsigned int output_real_size      = W.m_vectValueRealBuffer.size();

     //unsigned int output_imaginary_size = W.m_vectValueImaginaryBuffer.size();

     unsigned int output_real_size = nSizePHI;

     unsigned int output_imaginary_size = nSizePHI;


     if( 0 == nSizePHI )

     {

         output_real_size = 1;

         output_imaginary_size = 1;

     }


 #pragma offload_transfer target(mic:phi_tid) nocopy(output_real[0:output_real_size]           : ALLOC)

 #pragma offload_transfer target(mic:phi_tid) nocopy(output_imaginary[0:output_imaginary_size] : ALLOC)

     //  if(CKNMPIManager::GetTotalNodeCount() <= 3)

     VTemp.SetSize(m_nMatrixSize);

     //  else

     //VTemp.SetSize(nSizeFromPrevRank+nSizeFromNextRank+CKNMPIManager::GetCurrentLoadBalanceCount());


     double *vtemp_real = VTemp.m_vectValueRealBuffer.data();

     double *vtemp_imaginary = VTemp.m_vectValueImaginaryBuffer.data();

     unsigned int vtemp_size = VTemp.m_vectValueRealBuffer.size();


 #pragma offload_transfer target(mic:phi_tid) nocopy(vtemp_real[0:vtemp_size]      : ALLOC)

 #pragma offload_transfer target(mic:phi_tid) nocopy(vtemp_imaginary[0:vtemp_size] : ALLOC)

 #pragma offload_transfer target(mic:phi_tid) in(vtemp_real[0:vtemp_size]      : REUSE)

 #pragma offload_transfer target(mic:phi_tid) in(vtemp_imaginary[0:vtemp_size]     : REUSE)

     //  X_largest = CKNMPIManager::GetLoadBalanceCount(0);

     //  for(int i = 1; i < CKNMPIManager::GetTotalNodeCount(); i++)

     //  {

     //      unsigned int Btemp = CKNMPIManager::GetLoadBalanceCount(i);

     //      if(Btemp > X_largest)

     //          X_largest = Btemp;

     //  }


     //  CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MALLOC);

     //  double *X   = (double *)_mm_malloc(X_largest * 2 * sizeof(double), 64);

     //  double *Xrt = (double *)_mm_malloc(X_largest * 2 * sizeof(double), 64);

     //  double *Xlt = (double *)_mm_malloc(X_largest * 2 * sizeof(double), 64);

     //#pragma offload_transfer target(mic:phi_tid) nocopy(X[0:X_largest * 2]   : align(64) ALLOC)

     //#pragma offload_transfer target(mic:phi_tid) nocopy(Xrt[0:X_largest * 2] : align(64) ALLOC)

     //#pragma offload_transfer target(mic:phi_tid) nocopy(Xlt[0:X_largest * 2] : align(64) ALLOC)

     //        double *X   = new double[X_largest*2];

     //        double *Xrt = new double[X_largest*2];

     //        double *Xlt = new double[X_largest*2];

     //#pragma offload_transfer target(mic:phi_tid) nocopy(X[0:X_largest * 2]   : ALLOC)

     //#pragma offload_transfer target(mic:phi_tid) nocopy(Xrt[0:X_largest * 2] : ALLOC)

     //#pragma offload_transfer target(mic:phi_tid) nocopy(Xlt[0:X_largest * 2] : ALLOC)

     //  CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MALLOC);


     char            szBuffer[1024];

     int             nSize;

 #ifdef DISABLE_MPI_ROUTINE

     nSize = m_nMatrixSize;

 #else

     nSize = CKNMPIManager::GetCurrentLoadBalanceCount();

 #endif


     for (j = 1; j <= nIterationCount; j++)

     {


         if (0 == j % 500 && CKNMPIManager::IsRootRank())

         {

             sprintf(szMsg, "[#%8d] Lanczos interation going on\n", j);

             CKNIPCCUtility::ShowMsg(szMsg);

         }


         if (bMakeEigvVector)

             CalculateEigenVector(lpResult, Vj, j);


 #ifdef DISABLE_MPI_ROUTINE

         if (j == 1)

             CKNIPCCUtility::ShowMsg("-Using MVMulOptimal with no offload\n");

         CKNMatrixOperation::MVMulOptimal(m_pAMatrix, &Vj, &W);

 #else //DISABLE_MPI_ROUTINE

         /*  /// Using Normal MV Mul

         if (j == 1)

             if(CKNMPIManager::IsRootRank())

                 CKNIPCCUtility::ShowMsg("-Using MVMul\n");

         CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MVMUL);

         CKNMatrixOperation::MVMul(m_pAMatrix, &Vj, &W);

         CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MVMUL);

         */


         /* /// Using Async block communication

         if(CKNMPIManager::GetTotalNodeCount() <= 2)

         {

             CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MVMUL);

             CKNMatrixOperation::MVMulOptimal(m_pAMatrix, &Vj, &W);          /// wj <- Avj

             CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MVMUL);

             if (j == 1)

                 if(CKNMPIManager::IsRootRank())

                     CKNIPCCUtility::ShowMsg("-Using MVMulOptimal\n");

         }

         else

         {

             CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MVMUL);

             CKNMatrixOperation::MVMulEx_AsyncCommWithLocalBlocks(m_pAMyLocalBlock, m_pALeftBlock, m_pARightBoloc, &Vj, &W, X, Xrt, Xlt);

             CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MVMUL);

             if (j == 1)

                 if(CKNMPIManager::IsRootRank())

                     CKNIPCCUtility::ShowMsg("-Using MVMulEx_AsyncCommWithLocalBlocks\n");

         }

         */

         CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MVMUL);

         CKNMatrixOperation::MVMulEx_Optimal(m_pAMatrix, &Vj, &W, nSizeFromPrevRank, nSizeFromNextRank, &VTemp, nSizePHI);

         CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MVMUL);

         if (j == 1)

         if (CKNMPIManager::IsRootRank())

             printf("-Using MVMulEx_Optimal with %.1f(%%) offload\n", m_floadMIC);

 #endif //DISABLE_MPI_ROUTINE


         if (1 != j)

             W.ScalarMultiThanMinusVector(pBeta[j], &Vjm1);


         CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::VVDOT);

         CKNMatrixOperation::VVDot(&W, &Vj, &pAlpha[j]);

         CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::VVDOT);

         pAlphaReal[j] = pAlpha[j].GetRealNumber();

         W.ScalarMultiThanMinusVector(pAlphaReal[j], &Vj);


 #ifdef DISABLE_MPI_ROUTINE

         pBeta[j + 1] = W.GetNorm();

 #else

         pBeta[j + 1] = W.GetNorm(true);

 #endif

         Vjp1 = W;

         Vjp1.ScalarDivision(pBeta[j + 1]);


         if (m_bReorthogonalization && false == bMakeEigvVector)

         {

             if (CKNMPIManager::IsRootRank())

             {

                 if (1 == j && fANorm < fabs(pAlphaReal[1]) + pBeta[2])

                     fANorm = fabs(pAlphaReal[1]) + pBeta[2];

                 else if (fANorm < fabs(pAlphaReal[j]) + pBeta[j + 1] + pBeta[j])

                     fANorm = fabs(pAlphaReal[j]) + pBeta[j + 1] + pBeta[j];

             }


             m_pV[j + 1] = Vjp1;

             if (CheckAndDoSelectiveReorthogonalization(j-1, pAlphaReal+1, pBeta+2, pWj, pWjm1, pWjp1, fANorm))

             {

                 Vj = m_pV[j];

                 Vjp1 = m_pV[j + 1];

             }

         }


         if (CKNLanczosMethod::m_bStop)

             break;


         if (0 == j % m_nEigenValueCheckInterval && false == bMakeEigvVector)

         {

             bool        bFound = false;

             int         nPrevEVCount = lpResult->nEigenValueCount;


             if (InitializeTemporaryArrayAndVector(j))

             {

                 CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::EVALUE);

                 bFound = DoEigenValueSolving(j, pAlphaReal, pBeta, fANorm, lpResult, ++nEigenvalueSolvingCount == nEigenvalueSolvingFinal);

                 CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::EVALUE);

             }

             else

             {

                 bFound = true; // Can't alloc memeory, temporary code

                 CKNIPCCUtility::ShowMsg("\n[Warning] For memory allocation bug, can't calculate eigenvalue anymore!.\n\n");

             }


             FinalizeTemporaryArrayAndVector();


             CKNMPIManager::BroadcastBool(&bFound);

             if (bFound)

                 break;

         }


         Vjm1 = Vj;

         Vj = Vjp1;

     }


     //#pragma offload_transfer target(mic:phi_tid) nocopy(input_real      : FREE)

     //#pragma offload_transfer target(mic:phi_tid) nocopy(input_imaginary : FREE)


 #pragma offload_transfer target(mic:phi_tid) nocopy(output_real      : FREE)

 #pragma offload_transfer target(mic:phi_tid) nocopy(output_imaginary : FREE)


 #pragma offload_transfer target(mic:phi_tid) nocopy(vtemp_real      : FREE)

 #pragma offload_transfer target(mic:phi_tid) nocopy(vtemp_imaginary : FREE)


     //  CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::FREE_MEM);

     //  _mm_free(X);

     //  _mm_free(Xrt);

     //  _mm_free(Xlt);

     //  delete [] X;

     //  delete [] Xrt;

     //  delete [] Xlt;

     //#pragma offload_transfer target(mic:phi_tid) nocopy(X   : FREE)

     //#pragma offload_transfer target(mic:phi_tid) nocopy(Xrt : FREE)

     //#pragma offload_transfer target(mic:phi_tid) nocopy(Xlt : FREE)

     //  CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::FREE_MEM);


     Vj.Finalize();

     Vjp1.Finalize();

     Vjm1.Finalize();

     W.Finalize();

 }


 void CKNLanczosMethod::InitLanczosVector()

 {

     unsigned int        i;


     if (false == m_bReorthogonalization)

         return;


     CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MALLOC);

     m_pV = new CKNMatrixOperation::CKNVector[m_nIterationCount + 2];

     CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MALLOC);

     for (i = 0; i < m_nIterationCount + 2; i++)

 #ifdef DISABLE_MPI_ROUTINE

         m_pV[i].SetSize(m_nMatrixSize);

 #else //DISABLE_MPI_ROUTINE

         m_pV[i].SetSize(CKNMPIManager::GetCurrentLoadBalanceCount());

 #endif //DISABLE_MPI_ROUTINE


 }


 void CKNLanczosMethod::FinalLanczosVector()

 {

     unsigned int        i;

     if (false == m_bReorthogonalization)

         return;

     CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::FREE_MEM);

     for (i = 0; i < m_nIterationCount + 2; i++)

         m_pV[i].Finalize();


     delete[] m_pV;

     m_pV = NULL;

     CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::FREE_MEM);

 }


 void CKNLanczosMethod::InitLanczosIterationVariables(CKNComplex **pAlpha, double **pAlphaReal, double **pBeta, double **pWj, double **pWjm1, double **pWjp1, CKNMatrixOperation::CKNVector **pW)

 {

     CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MALLOC);

     *pAlpha = new CKNComplex[m_nIterationCount + 2];

     *pAlphaReal = (double*)malloc(sizeof(double)*(m_nIterationCount + 5));

     *pBeta = (double*)malloc(sizeof(double)*(m_nIterationCount + 5));


     if (m_bReorthogonalization && CKNMPIManager::IsRootRank())

     {

         *pWj = (double*)malloc(sizeof(double)*(m_nIterationCount + 3));

         *pWjm1 = (double*)malloc(sizeof(double)*(m_nIterationCount + 3));

         *pWjp1 = (double*)malloc(sizeof(double)*(m_nIterationCount + 3));


         memset(*pWj, 0, sizeof(double)*(m_nIterationCount + 3));

         memset(*pWjm1, 0, sizeof(double)*(m_nIterationCount + 3));

         memset(*pWjp1, 0, sizeof(double)*(m_nIterationCount + 3));

     }

     CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MALLOC);

 }


 void CKNLanczosMethod::FinalizeLanczosInterationVariable(CKNComplex *pAlpha, double *pAlphaReal, double *pBeta, double *pWj, double *pWjm1, double *pWjp1, CKNMatrixOperation::CKNVector *pW)

 {

     CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::FREE_MEM);

     if (m_bReorthogonalization && CKNMPIManager::IsRootRank())

     {

         FREE_MEM(pWj);

         FREE_MEM(pWjm1);

         FREE_MEM(pWjp1);

     }


     delete[] pAlpha;

     pAlpha = NULL;


     free(pAlphaReal);

     pAlphaReal = NULL;


     free(pBeta);

     pBeta = NULL;

     CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::FREE_MEM);

 }


 void CKNLanczosMethod::CalculateEigenVector(LPEIGENVALUE_RESULT lpResult, CKNMatrixOperation::CKNVector V, unsigned int nIterationIndex)

 {

     unsigned int                i, k, nRepeatCount;


     for (i = 0; i < lpResult->nEigenValueCount; i++)

     {

         if (nIterationIndex > lpResult->pEigenValueFoundIteration[i])

             continue;


 #ifdef DISABLE_MPI_ROUTINE

         nRepeatCount = m_nMatrixSize;

 #else //DISABLE_MPI_ROUTINE

         nRepeatCount = CKNMPIManager::GetCurrentLoadBalanceCount();

 #endif


         for (k = 0; k < nRepeatCount; k++)

         {

             CKNComplex          temp = lpResult->pEigenVectorsForAMatrix[i].GetAt(k);

             temp = temp + V.GetAt(k) * lpResult->pEigenVectors[i][nIterationIndex - 1];

             lpResult->pEigenVectorsForAMatrix[i].SetAt(k, temp);

         }

     }

 }


 bool CKNLanczosMethod::CheckAndDoSelectiveReorthogonalization(int nIterationCount, double *pAlpha, double *pBeta, double *pWj, double *pWjm1, double *pWjp1, double fANorm)

 {

     bool        bDoSelectiveReorthogonalization = false;


     return bDoSelectiveReorthogonalization;

 }


 void CKNLanczosMethod::DoSelectiveReorthogonalization(unsigned int nIterationCount)

 {

     return;

 }


 void thomas_alg(double **T, double *initguess, double *app_evc, int iter)

 { //[completed]


     int i;

     double temp, tbeta = T[0][0];


     double *P = (double *)malloc(sizeof(double)*iter);


     //Forward Elimination

     for (i = 0; i<iter - 1; i++)

     {

         if (fabs(T[1][i])>fabs(tbeta))

         {

             initguess[i + 1] -= initguess[i] * tbeta / T[1][i];

             T[1][i + 1] -= T[0][i] * tbeta / T[1][i];

             P[i] = 0;

             tbeta = T[0][i + 1];

         }

         else

         {

             temp = initguess[i + 1];

             initguess[i + 1] = initguess[i];

             initguess[i] = temp;


             temp = T[1][i + 1];

             T[1][i + 1] = T[0][i];

             T[0][i] = temp;


             initguess[i + 1] -= initguess[i] * T[1][i] / tbeta;


             T[1][i + 1] -= T[0][i] * T[1][i] / tbeta;


             if (i != iter - 2)

             {

                 P[i] = T[0][i + 1];

                 T[0][i + 1] = -P[i] * T[1][i] / tbeta;

             }


             T[1][i] = tbeta;


             if (i != iter - 2)

                 tbeta = P[i];

         }

     }


     //Backward Substitution

     for (i = iter - 1; i>-1; i--)

     {

         if (i == iter - 1)

             app_evc[i] = initguess[i] / T[1][i];

         else if (i == iter - 2)

         {

             app_evc[i] = initguess[i] - app_evc[i + 1] * T[0][i];

             app_evc[i] = app_evc[i] / T[1][i];

         }

         else

         {

             app_evc[i] = initguess[i] - app_evc[i + 1] * T[0][i] - app_evc[i + 2] * P[i];

             app_evc[i] = app_evc[i] / T[1][i];

         }

     }


     free(P);

 }


 void inverse_iter(double *alpha, double *beta, double *app_evc, int iter, double app_eva)

 {   //[completed]

     int i, j, k, iteration = 20;

     double temp = 0, err, etol = 1e-13;


     double *initguess = (double *)malloc(sizeof(double)*iter); // Initial Guess

     double **T = (double **)malloc(sizeof(double)* 2);


     for (i = 0; i<2; i++)

         T[i] = (double *)malloc(sizeof(double)*iter);


     for (i = 0; i<iter; i++)

         initguess[i] = 1 / sqrt((double)iter);


     for (k = 0; k<iteration; k++)

     {

         for (i = 0; i<2; i++)

         {

             if (i == 1)

             {

                 for (j = 0; j<iter; j++)

                     T[i][j] = alpha[j] - app_eva;


             }

             else

             {

                 for (j = 0; j<iter; j++)

                     T[i][j] = beta[j];

             }

         }


         thomas_alg(T, initguess, app_evc, iter);   // Solve (T-app_eva*I)*app_evc=initguess


         temp = 0;

         for (i = 0; i<iter; i++)

             temp += app_evc[i] * app_evc[i];


         for (i = 0; i<iter; i++)

             app_evc[i] = app_evc[i] / sqrt(temp);


         temp = 0;

         for (i = 0; i<iter; i++)

         {

             if (i == 0)

                 temp += app_evc[i] * (alpha[i] * app_evc[i] + beta[i] * app_evc[i + 1]);

             else if (i == iter - 1)

                 temp += app_evc[i] * (beta[i - 1] * app_evc[i - 1] + alpha[i] * app_evc[i]);

             else

                 temp += app_evc[i] * (beta[i - 1] * app_evc[i - 1] + alpha[i] * app_evc[i] + beta[i] * app_evc[i + 1]);

         }


         err = app_eva - temp;

         if (fabs(err) < etol)

             break;


         if (k<iteration - 1)

         {

             for (i = 0; i<iter; i++)

                 initguess[i] = app_evc[i];

         }

     } // Iteration k


     for (i = 0; i<2; i++)

         free(T[i]);

     free(T);

     free(initguess);

 }


 #define SET_RESULT_TO_PARAMETER(pResultValue, pResultVector, nResultCount)  \

     pCalcuResult_Value = pResultValue;          \

     pCalcuResult_Vector = pResultVector;        \

     nCalculatedEigenValueCount = nResultCount


 bool CKNLanczosMethod::DoEigenValueSolving(int nIterationCount, double *pAlpha, double *pBeta, double fANorm, LPEIGENVALUE_RESULT lpResult, bool bFinal)

 {

     double          *pCalcuResult_Value = NULL;

     double          *pCalcuResult_Vector = NULL;

     int             nConvergedEigenvalueCount = 0;

     int             nRangecheckedEigenvalueCount = 0;

     int             nNonSpuriousRitzValueCount = 0;

     int             nNonClustersValueCount = 0;

     unsigned int    nCalculatedEigenValueCount = 0, nCalculatedEigenValueCountBeforeConvergenceCheck;

     bool            bRtn = false;

     bool            *pValidEigenValue = NULL;

     unsigned int    i;


     if (NULL == lpResult)

         throw ERROR_MALLOC;


     if (!CKNMPIManager::IsRootRank())

         return false;


     nCalculatedEigenValueCount = EigenValueSolver(nIterationCount, pAlpha, pBeta, m_pEigenValues, m_pEigenVectors);

     pCalcuResult_Value = m_pEigenValues;

     pCalcuResult_Vector = m_pEigenVectors;

     nCalculatedEigenValueCountBeforeConvergenceCheck = nCalculatedEigenValueCount;


     m_pEigenVectors = (double*)malloc(sizeof(double)*nCalculatedEigenValueCount*nIterationCount);

     for (i = 0; i < nCalculatedEigenValueCount; ++i)

     {

         double          *pEigenVector = (double*)malloc(sizeof(double)*nIterationCount);


         if (NULL == pEigenVector)

             continue;


         inverse_iter(pAlpha + 1, pBeta + 2, pEigenVector, nIterationCount, m_pEigenValues[i]);

         memcpy(m_pEigenVectors + nIterationCount * i, pEigenVector, sizeof(double)*nIterationCount);


         FREE_MEM(pEigenVector);

     }


     pValidEigenValue = (bool*)malloc(sizeof(bool)*nCalculatedEigenValueCount);

     for (i = 0; i < nCalculatedEigenValueCount; ++i)

         pValidEigenValue[i] = true;


     if (DO_NOT_CONVERGENCE_CHECKING != m_fConvergenceTolerance)

     {

         nCalculatedEigenValueCount = ConvergenceCheckingEx(nCalculatedEigenValueCount, m_pEigenValues, m_pEigenVectors,

                                                             pValidEigenValue, fANorm, pBeta, nIterationCount);

     }


     {

         nCalculatedEigenValueCount = DistinguishClusterOfEigenvalueEx(nCalculatedEigenValueCount, m_pEigenValues, m_pEigenVectors,

         pValidEigenValue, nIterationCount);

     }


     if (nCalculatedEigenValueCount > 0)

     {

         IntegrateEigenvaluesEx(nIterationCount, lpResult, nCalculatedEigenValueCount, nCalculatedEigenValueCountBeforeConvergenceCheck, m_pEigenValues, m_pEigenVectors, pValidEigenValue);

     }


     FREE_MEM(pValidEigenValue);


     if (lpResult->nEigenValueCount >= m_nEigenValueCount || true == bFinal)

         bRtn = true;


     return bRtn;

 }


 void CKNLanczosMethod::IntegrateEigenvaluesEx(int nIterationCount, LPEIGENVALUE_RESULT lpResult, unsigned int nCalculatedEigenValueCount, unsigned int nCalculatedEigenValueCountBeforeConvergenceCheck, double *pCalcuResult_Value, double *pCalcuResult_Vector, bool *pbValidEigenValue)

 {

     unsigned int                i, j;

     bool                        bSame = false;


     lpResult->nEigenVectorSize = nIterationCount;

     if (0 == lpResult->nEigenValueCount)

     {

         //Initialize lpReulst members

         CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MALLOC);

         lpResult->pEigenValues = (double*)malloc(sizeof(double)*nCalculatedEigenValueCount);

         lpResult->pEigenVectors = (double**)malloc(sizeof(double*)*nCalculatedEigenValueCount);


         for (i = 0; i < nCalculatedEigenValueCount; i++)

         {

             lpResult->pEigenVectors[i] = (double*)malloc(sizeof(double)*nIterationCount);

         }


         lpResult->pEigenValueFoundIteration = (unsigned int*)malloc(sizeof(unsigned int)*nCalculatedEigenValueCount);

         CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MALLOC);

     }

     else

     {

         int             nSameCount = 0;

         for (i = 0; i < nCalculatedEigenValueCountBeforeConvergenceCheck; i++)

         {

             if (false == pbValidEigenValue[i])

                 continue;

             for (j = 0; j < lpResult->nEigenValueCount; j++)

             {

                 if (CKNMatrixOperation::IsSame(pCalcuResult_Value[i], lpResult->pEigenValues[j], GENERAL_TOLERANCE))

                 {

                     nSameCount++;

                     continue;

                 }

             }

         }


         if (0 == nCalculatedEigenValueCount - nSameCount)

         {

             for (i = 0; i < lpResult->nEigenValueCount ; i++)

                 lpResult->pEigenVectors[i] = (double*)realloc(lpResult->pEigenVectors[i], sizeof(double)*nIterationCount);

         }

         else

         {

             int         nAddSize = nCalculatedEigenValueCount - nSameCount;

             lpResult->pEigenValues = (double*)realloc(lpResult->pEigenValues, sizeof(double)*(lpResult->nEigenValueCount + nAddSize));

             lpResult->pEigenVectors = (double**)realloc(lpResult->pEigenVectors, sizeof(double*)*(lpResult->nEigenValueCount + nAddSize));

             for (i = lpResult->nEigenValueCount; i < (lpResult->nEigenValueCount + nAddSize); ++i)

                 lpResult->pEigenVectors[i] = NULL;

             for (i = 0; i < (lpResult->nEigenValueCount + nAddSize); i++)

                 lpResult->pEigenVectors[i] = (double*)realloc(lpResult->pEigenVectors[i], sizeof(double)*nIterationCount);

             lpResult->pEigenValueFoundIteration = (unsigned int*)realloc(lpResult->pEigenValueFoundIteration, sizeof(unsigned int)*(lpResult->nEigenValueCount + nAddSize));

         }

     }


     for (i = 0; i < nCalculatedEigenValueCountBeforeConvergenceCheck; i++)

     {

         if (false == pbValidEigenValue[i])

             continue;


         bSame = false;

         for (j = 0; j < lpResult->nEigenValueCount; j++)

         {

             if (CKNMatrixOperation::IsSame(pCalcuResult_Value[i], lpResult->pEigenValues[j], GENERAL_TOLERANCE))

             {

                 bSame = true;

                 break;

             }

         }


         if (!bSame)

         {

             lpResult->pEigenValues[lpResult->nEigenValueCount] = pCalcuResult_Value[i];

             lpResult->pEigenValueFoundIteration[lpResult->nEigenValueCount] = nIterationCount;

 #ifdef _WIN32

             lpResult->nMaxEigenValueFoundIteration = max((int)lpResult->nMaxEigenValueFoundIteration, (int)nIterationCount);

 #else //_WIN32

             lpResult->nMaxEigenValueFoundIteration = std::max((int)lpResult->nMaxEigenValueFoundIteration, (int)nIterationCount);

 #endif//

             memcpy(lpResult->pEigenVectors[lpResult->nEigenValueCount], pCalcuResult_Vector + (i * nIterationCount), sizeof(double)* nIterationCount);

             lpResult->nEigenValueCount++;

         }

         else

         {

             lpResult->pEigenValueFoundIteration[j] = nIterationCount;

             memcpy(lpResult->pEigenVectors[j], pCalcuResult_Vector + (i * nIterationCount), sizeof(double)* nIterationCount);

 #ifdef _WIN32

             lpResult->nMaxEigenValueFoundIteration = max((int)lpResult->nMaxEigenValueFoundIteration, (int)nIterationCount);

 #else //_WIN32

             lpResult->nMaxEigenValueFoundIteration = std::max((int)lpResult->nMaxEigenValueFoundIteration, (int)nIterationCount);

 #endif //_WIN32

         }

     }

 }


 void CKNLanczosMethod::IntegrateEigenvalues(int nIterationCount, LPEIGENVALUE_RESULT lpResult, unsigned int nCalculatedEigenValueCount, double *pCalcuResult_Value, double *pCalcuResult_Vector)

 {

     unsigned int                i, j;

     bool                        bSame = false;


     for (i = 0; i < nCalculatedEigenValueCount; i++)

     {

         bSame = false;

         for (j = 0; j < lpResult->nEigenValueCount; j++)

         {

             if (CKNMatrixOperation::IsSame(pCalcuResult_Value[i], lpResult->pEigenValues[j], GENERAL_TOLERANCE))

             {

                 bSame = true;

                 break;

             }

         }


         if (!bSame)

         {

             if (lpResult->nEigenValueCountForMemeory == lpResult->nEigenValueCount)

             {

                 lpResult->pEigenValues = (double*)realloc(lpResult->pEigenValues, sizeof(double)*(lpResult->nEigenValueCount * 2));

                 lpResult->nEigenValueCountForMemeory = lpResult->nEigenValueCount * 2;

                 lpResult->pEigenValueFoundIteration = (unsigned int*)realloc(lpResult->pEigenValueFoundIteration, sizeof(unsigned int)*(lpResult->nEigenValueCount * 2));

                 //lpResult->pEigenVectors = (double*)realloc(lpResult->pEigenVectors, sizeof(double)*lpResult->nEigenValueCount * 2 * m_nIterationCount);

                 lpResult->nEigenValueCountForMemeory = lpResult->nEigenValueCount * 2;

             }

             lpResult->pEigenValues[lpResult->nEigenValueCount] = pCalcuResult_Value[i];

             lpResult->pEigenValueFoundIteration[lpResult->nEigenValueCount] = nIterationCount;

 #ifdef _WIN32

             lpResult->nMaxEigenValueFoundIteration = max((int)lpResult->nMaxEigenValueFoundIteration, (int)nIterationCount);

 #else //_WIN32

             lpResult->nMaxEigenValueFoundIteration = std::max((int)lpResult->nMaxEigenValueFoundIteration, (int)nIterationCount);

 #endif//

             memcpy(lpResult->pEigenVectors + (lpResult->nEigenValueCount*m_nIterationCount), pCalcuResult_Vector + (i * nIterationCount), sizeof(double)* nIterationCount);

             lpResult->nEigenValueCount++;

         }

     }

 }


 int CKNLanczosMethod::ConvergenceCheckingEx(int nEigenValueCount, double *pEigenValues, double *pEiegnVectors, bool *pbValidEigenValue, double fANorm, double *pBeta, int nIterationCount)

 {

     if (0 == nEigenValueCount)

         return 0;


     double              fTotal = m_fConvergenceTolerance;

     double              fResidual;

     int                 i, nConvergedCount = nEigenValueCount;


     for (i = 0; i < nEigenValueCount; i++)

     {

         if (false == pbValidEigenValue[i])

             continue;


         fResidual = fabs(pBeta[nIterationCount + 1] * pEiegnVectors[i*nIterationCount + nIterationCount - 1]);


         if (fResidual >= fTotal)

         {

             pbValidEigenValue[i] = false;

             nConvergedCount--;

         }

     }


     return nConvergedCount;

 }


 int CKNLanczosMethod::ConvergenceChecking(int nEigenValueCount, double *pEigenValues, double *pEiegnVectors, double *pConvergedEigenValues, double *pConvergedEigenVectors, double fANorm, double *pBeta, int nIterationCount)

 {

     if (0 == nEigenValueCount)

         return 0;


     if (NULL == pConvergedEigenValues || NULL == pConvergedEigenVectors || NULL == m_pConvergedIndex)

         throw ERROR_MALLOC;


     double              fTotal = m_fConvergenceTolerance;

     double              fResidual;

     int                 i, nConvergedCount = 0;


     for (i = 0; i < nEigenValueCount; i++)

     {

         fResidual = fabs(pBeta[nIterationCount + 1] * pEiegnVectors[i*nIterationCount + nIterationCount - 1]);


         if (fResidual < fTotal)

             m_pConvergedIndex[nConvergedCount++] = i;

     }


     ExtractDoubleValues(pConvergedEigenValues, pEigenValues, nEigenValueCount, m_pConvergedIndex, nConvergedCount, false);

     ExtractDoubleVector(nIterationCount, pConvergedEigenVectors, pEiegnVectors, nEigenValueCount, m_pConvergedIndex, nConvergedCount, false);


     return nConvergedCount;

 }


 int CKNLanczosMethod::RangeChecking(int nEigenValueCount, double *pEigenValues, double *pEiegnVectors, double *pRangeCheckingEigenValues, double *pRangeCheckingVectors, int nIterationCount)

 {

     int                 i, nRangecheckedCount = 0;


     if (NULL == pRangeCheckingEigenValues || NULL == pRangeCheckingVectors || NULL == m_pRangecheckedIndex)

         throw ERROR_MALLOC;


     for (i = 0; i < nEigenValueCount; i++)

     {

         if (pEigenValues[i] >= m_fEigenvalueMin && pEigenValues[i] <= m_fEignevalueMax)

             m_pRangecheckedIndex[nRangecheckedCount++] = i;

     }


     ExtractDoubleValues(pRangeCheckingEigenValues, pEigenValues, nEigenValueCount, m_pRangecheckedIndex, nRangecheckedCount, false);

     ExtractDoubleVector(nIterationCount, pRangeCheckingVectors, pEiegnVectors, nEigenValueCount, m_pRangecheckedIndex, nRangecheckedCount, false);


     return nRangecheckedCount;

 }


 int CKNLanczosMethod::SpuriousRitzValueChecking(int nEigenValueCount, double *pEigenValues, double *pEigenVectors,  double *pNonSpuriousValues, double *pNonSpuriousVectors, double fANorm, int nIterationCount)

 {

     if (0 == nEigenValueCount)

         return 0;


     if (NULL == pNonSpuriousValues || NULL == pNonSpuriousVectors || NULL == m_pNonSpuriousValueIndex)

         throw ERROR_MALLOC;


     double              eps = 1e-8;

     double              fTotal = eps;

     int                 i, nNonSpuriousValue = 0;


     for (i = 0; i < nEigenValueCount; i++)

     {

         if (fabs(pEigenVectors[i*nIterationCount]) > fTotal)

             m_pNonSpuriousValueIndex[nNonSpuriousValue++] = i;

     }


     ExtractDoubleValues(pNonSpuriousValues, pEigenValues, nEigenValueCount, m_pNonSpuriousValueIndex, nNonSpuriousValue, false);

     ExtractDoubleVector(nIterationCount, pNonSpuriousVectors, pEigenVectors, nEigenValueCount, m_pNonSpuriousValueIndex, nNonSpuriousValue, false);


     return nNonSpuriousValue;

 }

 int CKNLanczosMethod::DistinguishClusterOfEigenvalueEx(int nEigenValueCount, double *pEigenValues, double *pEigenVectors, bool *pbValidEigenValues, int nIterationCount)

 {

     double              eps = 1e-8;

     int                 i, j, nNonClustersValue = nEigenValueCount;


     if (0 == nEigenValueCount)

         return 0;


     for (i = 0; i < nEigenValueCount - 1; i++)

     {

         if (!pbValidEigenValues[i])

             continue;


         for (j = i + 1; j < nEigenValueCount; j++)

         {

             if (!pbValidEigenValues[j])

                 continue;


             if (fabs(pEigenValues[i] - pEigenValues[j]) < eps)

             {

                 pbValidEigenValues[j] = false;

                 nNonClustersValue--;

             }

         }

     }


     return nNonClustersValue;

 }


 int CKNLanczosMethod::DistinguishClusterOfEigenvalue(int nEigenValueCount, double *pEigenValues, double *pEigenVectors, double *pNonClustersValues, double *pNonClustersVectors, int nIterationCount)

 {

     double              eps = 1e-8;

     int                 i, j, nNonClustersValue = 0;


     if (0 == nEigenValueCount)

         return 0;


     if (NULL == pNonClustersValues || NULL == m_pCheckNonClusterValue || NULL == m_pNonClustersValueIndex)

         throw ERROR_MALLOC;


     for (i = 0; i < nEigenValueCount; i++)

         m_pCheckNonClusterValue[i] = true;


     for (i = 0; i < nEigenValueCount - 1; i++)

     {

         if (!m_pCheckNonClusterValue[i])

             continue;


         for (j = i + 1; j < nEigenValueCount; j++)

         {

             if (fabs(pEigenValues[i] - pEigenValues[j]) < eps)

             {

                 m_pCheckNonClusterValue[j] = false;

             }

         }

     }


     for (i = 0; i < nEigenValueCount; i++)

     {

         if (m_pCheckNonClusterValue[i])

             m_pNonClustersValueIndex[nNonClustersValue++] = i;

     }


     ExtractDoubleValues(pNonClustersValues, pEigenValues, nEigenValueCount, m_pNonClustersValueIndex, nNonClustersValue, false);

     if (NULL != pNonClustersVectors)

         ExtractDoubleVector(nIterationCount, pNonClustersVectors, pEigenVectors, nEigenValueCount, m_pNonClustersValueIndex, nNonClustersValue, false);


     return nNonClustersValue;

 }


 int CKNLanczosMethod::EigenValueSolver(unsigned int nIterationCount, double *pAlpha, double *pBeta, double *pEigenValues, double *pEigenVectors)

 {

     MKL_INT             n, lda, ldz, il, iu, lwork;

     MKL_INT             nFoundEigenValueCount;

     MKL_INT             info;

     double              vl, vu;

     double              abstol = 1.0e-8;

     double              *work;

     CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::EVALUE_MALLOC);

     //MKL_INT               *iwork = (MKL_INT*)malloc(sizeof(MKL_INT)* 5 * nIterationCount);

     MKL_INT             *iwork = (MKL_INT*)malloc(sizeof(MKL_INT)* 10 * nIterationCount);

     MKL_INT             *ifail = (MKL_INT*)malloc(sizeof(MKL_INT)* nIterationCount);

     int                 nsplit = 0;       /* number of diagonal blocks in matrix  */

     int                 *iblock = (int *)malloc(sizeof(int)*nIterationCount);

     int                 *isplit = (int *)malloc(sizeof(int)*nIterationCount);


     //work = (double*)malloc(sizeof(double)*nIterationCount*4);

     work = (double*)malloc(sizeof(double)*nIterationCount * 10);

     CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::EVALUE_MALLOC);

     n = ldz = lda = nIterationCount;

     il = 1;

     iu = nIterationCount;

     vl = m_fEigenvalueMin;

     vu = m_fEignevalueMax;


     lwork = -1;

     dstebz("V", "E", &n, &vl, &vu, &il, &iu, &abstol, pAlpha + 1, pBeta + 2, &nFoundEigenValueCount, &nsplit, pEigenValues, iblock, isplit, work, iwork, &info);


     CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::EVALUE_FREE_MEM);

     FREE_MEM(iwork);

     FREE_MEM(work);

     FREE_MEM(ifail);

     FREE_MEM(iblock);

     FREE_MEM(isplit);

     CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::EVALUE_FREE_MEM);


     return nFoundEigenValueCount;

 }


 double* CKNLanczosMethod::BuildTMatrix(unsigned int nOrder, double *pAlpha, double *pBeta)

 {

     CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MALLOC);

     double          *pTMatrix = (double*)malloc(sizeof(double)*nOrder*nOrder);

     CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MALLOC);


     unsigned int    k;


     if (NULL == pTMatrix)

     {

         throw ERROR_MALLOC;

         return NULL;

     }


     memset(pTMatrix, 0, sizeof(double)*nOrder*nOrder);


     for (k = 1; k <= nOrder; k++)

     {

         pTMatrix[((k - 1) * nOrder) + (k - 1)] = pAlpha[k];

         if (k != nOrder)

             pTMatrix[(k - 1)*nOrder + k] = pBeta[k + 1];

         if (k != 1)

             pTMatrix[(k - 1)*nOrder + (k - 2)] = pBeta[k];

     }


     return pTMatrix;

 }


 void CKNLanczosMethod::InitVariables()

 {

     if (NULL != m_pV)

     {

         CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::FREE_MEM);

         delete m_pV;

         CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::FREE_MEM);

         m_pV = NULL;

     }


     m_pAMatrix = NULL;

     m_nMatrixSize = 0;

     m_nIterationCount = 0;

     m_nEigenValueCheckInterval = 0;

     m_nEigenValueCount = 0;

     m_bReorthogonalization = false;

 }


 void CKNLanczosMethod::ExtractDoubleValues(double *pTarget, double *pSource, unsigned int nSrcCount, int *pFilter, unsigned int nFilterCount, bool bExclusive)

 {

     unsigned int            i;


     if (bExclusive)

     {

         int     nSrcIndex = 0;

         int     nTargetIndex = 0;

         for (i = 0; i < nSrcCount; i++)

         {

             if (i != pFilter[nSrcIndex])

                 pTarget[nTargetIndex++] = pSource[i];

             else

                 nSrcIndex++;

         }

     }

     else

     {

         for (i = 0; i < nFilterCount; i++)

             pTarget[i] = pSource[pFilter[i]];

     }

 }


 void CKNLanczosMethod::ExtractDoubleVector(unsigned int nVectorsize, double *pTarget, double *pSource, unsigned int nSrcCount, int *pFilter, unsigned int nFilterCount, bool bExclusive)

 {

     unsigned int            i;


     if (bExclusive)

     {

         int     nSrcIndex = 0;

         int     nTargetIndex = 0;

         for (i = 0; i < nSrcCount; i++)

         {

             if (i != pFilter[nSrcIndex])

                 memcpy(pTarget + (nTargetIndex*nVectorsize), pSource + (i * nVectorsize), sizeof(double)* nVectorsize);

             else

                 nSrcIndex++;

         }

     }

     else

     {

         for (i = 0; i < nFilterCount; i++)

             memcpy(pTarget + (i*nVectorsize), pSource + (pFilter[i] * nVectorsize), sizeof(double)* nVectorsize);

     }

 }


 void CKNLanczosMethod::ReleaseResult(LPEIGENVALUE_RESULT lpResult, bool bReleaseStruct)

 {

     unsigned int            i;

     if (NULL == lpResult)

         return;


     CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::FREE_MEM);


     FREE_MEM(lpResult->pEigenValues);

     FREE_MEM(lpResult->pEigenValueFoundIteration);


     if (NULL != lpResult->pWaveFunctions)

     {

         for (i = 0; i < lpResult->nEigenValueCount / 10; i++)

             lpResult->pWaveFunctions[i].Finalize();


         delete[] lpResult->pWaveFunctions;

         lpResult->pWaveFunctions = NULL;

     }


     if (NULL != lpResult->pEigenVectorsForAMatrix)

     {

         for (i = 0; i < lpResult->nEigenValueCount; i++)

             lpResult->pEigenVectorsForAMatrix[i].Finalize();


         delete[] lpResult->pEigenVectorsForAMatrix;

         lpResult->pEigenVectorsForAMatrix = NULL;

     }


     if( NULL != lpResult->pEigenVectors)

     {

         for (i = 0; i < lpResult->nEigenValueCount - lpResult->nDegeneratedEigenValueCount ; i++)

             FREE_MEM(lpResult->pEigenVectors[i]);


         FREE_MEM(lpResult->pEigenVectors);

     }


     if (bReleaseStruct)

         FREE_MEM(lpResult);

     CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::FREE_MEM);

 }


 void CKNLanczosMethod::StopIteration()

 {

     CKNLanczosMethod::m_bStop = true;

 }


 void CKNLanczosMethod::BuildWaveFunction(LPEIGENVALUE_RESULT lpResult)

 {

     if (0 != m_nMatrixSize % 10 || 0 != CKNMPIManager::GetCurrentLoadBalanceCount() % 10)

         return;


     unsigned int        i, j, nIndex = 0;

     CKNComplex          tempResult, complexNumber;

     double              fTempResult;


     CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MALLOC);

     lpResult->pWaveFunctions = new CKNMatrixOperation::CKNVector[lpResult->nEigenValueCount];

     CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MALLOC);

     for (i = 0; i < lpResult->nEigenValueCount; i++)

     {

         nIndex = 0;

         fTempResult = 0.;

         lpResult->pWaveFunctions[i].SetSize(CKNMPIManager::GetCurrentLoadBalanceCount() / 10);

         for (j = 0; j < CKNMPIManager::GetCurrentLoadBalanceCount(); j++)

         {

             complexNumber = lpResult->pEigenVectorsForAMatrix[i].GetAt(j);

             double          absoluteValue = complexNumber.GetAbsolute();

             fTempResult += (absoluteValue*absoluteValue);

             if (9 == j % 10)

             {

                 lpResult->pWaveFunctions[i].SetAt(nIndex++, fTempResult, 0);

                 fTempResult = 0.;

             }

         }

     }

 }


 void CKNLanczosMethod::DoResidualCheck(CKNMatrixOperation::CKNCSR *pAMatrix, LPEIGENVALUE_RESULT lpResult)

 {

     int                                 i, j;

     CKNMatrixOperation::CKNVector       vectorResult1, vectorResult2;

     CKNComplex                          result;

     double                              fEigenValue;

     double                              fNorm = 0.0;

     std::vector<bool>                   vectorResidualCheck;

     bool                                bFoundNoAnswer = false;

     std::vector<int>                    vectorResidualAnswer;

     int                                 nResidualAnswerCount = 0;


     SHOW_SIMPLE_MSG("-Residual Checking...\n");


 #ifdef DISABLE_MPI_ROUTINE

     vectorResult1.SetSize(pAMatrix->GetColumnCount());

     vectorResult2.SetSize(pAMatrix->GetColumnCount());

 #else //DISABLE_MPI_ROUTINE

     vectorResult1.SetSize(CKNMPIManager::GetCurrentLoadBalanceCount());

     vectorResult2.SetSize(CKNMPIManager::GetCurrentLoadBalanceCount());

 #endif //DISABLE_MPI_ROUTINE

     for( i = 0 ; i < lpResult->nEigenValueCount ; ++i )

     {

         CKNMatrixOperation::MVMul(pAMatrix, &lpResult->pEigenVectorsForAMatrix[i], &vectorResult1);

         vectorResult2 = lpResult->pEigenVectorsForAMatrix[i];

         if( CKNMPIManager::IsRootRank() )

             fEigenValue = lpResult->pEigenValues[i];

         CKNMPIManager::BroadcastDouble(&fEigenValue, 1);

         vectorResult2.ScalarMultiple(fEigenValue);

         //CKNMatrixOperation::VVDot(&vectorResult1, &vectorResult2, &result);

         vectorResult1.MinusVector(&vectorResult2);

 #ifdef DISABLE_MPI_ROUTINE

         fNorm = vectorResult1.GetNorm();

 #else //DISABLE_MPI_ROUTINE

         fNorm = vectorResult1.GetNorm(true);

 #endif DISABLE_MPI_ROUTINE


         if (CKNMatrixOperation::IsSame(fNorm, 0.0, GENERAL_TOLERANCE))

             vectorResidualCheck.push_back(true);

         else

         {

             vectorResidualCheck.push_back(false);

             bFoundNoAnswer = true;

         }

     }


     if (!bFoundNoAnswer)

     {

         vectorResult1.Finalize();

         vectorResult2.Finalize();

         return;

     }


     for( i = 0 ; i < lpResult->nEigenValueCount ; ++ i )

     {

         if( vectorResidualCheck[i] )

         {

             vectorResidualAnswer.push_back(i);

             nResidualAnswerCount++;

         }

     }


     for( i = 0 ; i < nResidualAnswerCount; ++ i )

     {

         if( i == vectorResidualAnswer[i] )

             continue;


         lpResult->pEigenValues[i] = lpResult->pEigenValues[vectorResidualAnswer[i]];

         lpResult->pEigenValueFoundIteration[i] = lpResult->pEigenValueFoundIteration[vectorResidualAnswer[i]];

         lpResult->pEigenVectorsForAMatrix[i] = lpResult->pEigenVectorsForAMatrix[vectorResidualAnswer[i]];


         if( NULL != lpResult->pWaveFunctions )

             lpResult->pWaveFunctions[i] = lpResult->pWaveFunctions[vectorResidualAnswer[i]];

     }


     lpResult->nEigenValueCount = nResidualAnswerCount;


     vectorResult1.Finalize();

     vectorResult2.Finalize();

 }


 void CKNLanczosMethod::SaveLanczosResult(CKNLanczosMethod::LPEIGENVALUE_RESULT lpResult, bool bCalcuEigenvalue, bool bWaveFunction, double *pKValue, int nRepeatCount)

 {

     if (NULL == lpResult || NULL == pKValue)

         return;

     CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::FILEIO);

     FILE            *out;

     char            szFileName[1024], szBuffer[1024];

     std::string     writeString;

     unsigned int    i, j, k;

     char            szFileOpt[3] = "wt";


     if( 0 != nRepeatCount )

         strcpy(szFileOpt, "at");


 #ifdef _WIN32

     _mkdir("result");

 #else

     mkdir("result", 0777);

 #endif


     if( CKNMPIManager::IsDeflationRoot() && CKNMPIManager::IsRootRank())

     {

 #ifdef _WIN32

         if (NULL != (out = fopen("result\\eigenvalues.txt", szFileOpt)))

 #else _WIN32

         if (NULL != (out = fopen("result/eigenvalues.txt", szFileOpt)))

 #endif //_WIN32

         {

             int     nEigenValueCount;

             if( NULL != pKValue )

                 sprintf(szBuffer, "---[ev #%d %8.6f %8.6f %8.6f]---\n\n", nRepeatCount, pKValue[0], pKValue[1], pKValue[2]);

             else

                 sprintf(szBuffer, "---[ev]---\n\n");


             fputs(szBuffer, out);

             for (i = 0; i < lpResult->nEigenValueCount; i++)

             {


                 if( DEGENERATED_INDEX != lpResult->pEigenValueFoundIteration[i] )

                     sprintf(szBuffer, "[ev %2d] %18.16f - Iteration [#%7d]\n", i, lpResult->pEigenValues[i], lpResult->pEigenValueFoundIteration[i]);

                 else

                     sprintf(szBuffer, "[ev %2d] %18.16f - Degenerated eigenvalue\n", i, lpResult->pEigenValues[i], lpResult->pEigenValueFoundIteration[i]);


                 fputs(szBuffer, out);

             }


             /*nEigenValueCount = i;

             if( lpResult->nDegeneratedEigenValueCount > 0 )

             {

                 for(i = 0; i < lpResult->nDegeneratedEigenValueCount; ++i)

                 {

                     sprintf(szBuffer, "[ev %2d] %18.16f - Degenerated eigenvalue\n", nEigenValueCount + i, lpResult->pDegeneratedEigenValues[i]);

                     fputs(szBuffer, out);

                 }

             }*/


             fputs("\n\n", out);

             fclose(out);

         }

     }


     if (bCalcuEigenvalue && NULL != lpResult->pEigenVectorsForAMatrix)

     {

         if( CKNMPIManager::IsDeflationRoot() )

         {

             for (j = 0; j < lpResult->nEigenValueCount; j++)

             {

 #ifdef _WIN32

                 sprintf(szFileName, "result\\eigenvector_%02d_%02d.txt", nRepeatCount, j);

 #else _WIN32

                 sprintf(szFileName, "result/eigenvector_%02d_%02d.txt", nRepeatCount, j);

 #endif //_WIN32

                 for( k = 0; k < CKNMPIManager::GetTotalNodeCount() ; ++k)

                 {

                     if( k == CKNMPIManager::GetCurrentRank() )

                     {

                         if (NULL != (out = fopen(szFileName, "at")))

                         {


                             for (i = 0; i < lpResult->pEigenVectorsForAMatrix[j].GetSize(); i++)

                             {

                                 sprintf(szBuffer, "%16.16f  %16.16f\n",

                                     lpResult->pEigenVectorsForAMatrix[j].GetAt(i).GetRealNumber(),

                                     lpResult->pEigenVectorsForAMatrix[j].GetAt(i).GetImaginaryNumber());


                                 writeString += szBuffer;


                                 if (i % 100)

                                 {

                                     fputs(writeString.c_str(), out);

                                     writeString.clear();

                                 }

                             }


                             if (!writeString.empty())

                             {

                                 fputs(writeString.c_str(), out);

                                 writeString.clear();

                             }


                             fclose(out);

                         }

                     }

 #ifndef DISABLE_MPI_ROUTINE

                     CKNMPIManager::Barrier();

 #endif //DISABLE_MPI_ROUTINE

                 }

             }

         }

     }


     if (bWaveFunction && NULL != lpResult->pWaveFunctions)

     {

         if( CKNMPIManager::IsDeflationRoot() )

         {

             for (j = 0; j < lpResult->nEigenValueCount; j++)

             {

 #ifdef _WIN32

                 sprintf(szFileName, "result\\wavefunction_%02d_%02d.txt", nRepeatCount, j);

 #else _WIN32

                 sprintf(szFileName, "result/wavefunction_%02d_%02d.txt", nRepeatCount, j);

 #endif //_WIN32

                 for( k = 0; k < CKNMPIManager::GetTotalNodeCount() ; ++k)

                 {

                     if( k == CKNMPIManager::GetCurrentRank() )

                     {

                         if (NULL != (out = fopen(szFileName, "at")))

                         {

                             for (i = 0; i < lpResult->pWaveFunctions[j].GetSize(); i++)

                             {

                                 sprintf(szBuffer, "%16.16f\n",

                                     lpResult->pWaveFunctions[j].GetAt(i).GetRealNumber());


                                 writeString += szBuffer;


                                 if (i % 100)

                                 {

                                     fputs(writeString.c_str(), out);

                                     writeString.clear();

                                 }

                             }


                             if (!writeString.empty())

                             {

                                 fputs(writeString.c_str(), out);

                                 writeString.clear();

                             }

                             fclose(out);

                         }

                     }

 #ifndef DISABLE_MPI_ROUTINE

                     CKNMPIManager::Barrier();

 #endif //DISABLE_MPI_ROUTINE

                 }

             }

         }

     }


     CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::FILEIO);

 }


 void CKNLanczosMethod::ShowLanczosResult(CKNLanczosMethod::LPEIGENVALUE_RESULT lpResult, bool bCalculateEigenVectors, bool bCalculateWaveFunction, double *pKValue, int nRepeatCount)

 {

     char            szMsg[1024];

     int             i;


     if( !CKNMPIManager::IsDeflationRoot() || !CKNMPIManager::IsRootRank())

         return;


     double          fEvalTime = CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::EVALUE) - CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::EVALUE_MALLOC) - CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::EVALUE_FREE_MEM);

     double          fCommTime = CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::COMM) + CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::MV_COMM) + CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::VV_COMM);

     double          fMemTime = CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::MALLOC) + CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::FREE_MEM) + CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::EVALUE_MALLOC) + CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::EVALUE_FREE_MEM) + CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::MV_MALLOC) + CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::MV_FREE_MEM) ;

     double          fMVMulTime = CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::MVMUL) - CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::MV_MALLOC) - CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::MV_FREE_MEM) - CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::MV_COMM);

     double          fVVTime = CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::VVDOT) - CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::VV_COMM);

     double          fComputingTime = CKNTimeMeasurement::GetTotalTakeTime() - fEvalTime - fCommTime - fMemTime - fMVMulTime - fVVTime - CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::FILEIO);


 #ifdef DOING_MEASUREMENT

     CKNIPCCUtility::ShowMsg("\n--------------------------------------\nTime evaluation\n\n");

     sprintf(szMsg, "%d nodes used\nTotal time      [ %f\tsec ]\nComputing       [ %lf\tsec ]\nEvalue takes    [ %lf\tsec ]\nMPI takes       [ %lf\tsec ]\nMVMul takes     [ %lf\tsec ]\nVVDot takes     [ %lf\tsec ]\nMem Op takes    [ %lf\tsec ]\nResult written  [ %lf\tsec ]\n",

         CKNMPIManager::GetTotalNodeCount(),

         CKNTimeMeasurement::GetTotalTakeTime(),

         fComputingTime,

         fEvalTime,

         fCommTime,

         fMVMulTime,

         fVVTime,

         fMemTime,

         CKNTimeMeasurement::GetTakeTime(CKNTimeMeasurement::FILEIO));


     CKNIPCCUtility::ShowMsg(szMsg);

     CKNIPCCUtility::ShowMsg("--------------------------------------\n");

 #endif //DOING_MEASUREMENT


     if (NULL != lpResult)

     {

         int                 nEigenValueCount;

         CKNIPCCUtility::ShowMsg("\n--------------------------------------------------\nEigen values\n\n");

         for (i = 0; i < (int)lpResult->nEigenValueCount; ++i)

         {

             if( DEGENERATED_INDEX != lpResult->pEigenValueFoundIteration[i] )

                 sprintf(szMsg, "[ev %2d] %18.16f - Iteration [#%7d]\n", i, lpResult->pEigenValues[i], lpResult->pEigenValueFoundIteration[i]);

             else

                 sprintf(szMsg, "[ev %2d] %18.16f - Degenerated eigenvalue\n",  i, lpResult->pEigenValues[i]);

             CKNIPCCUtility::ShowMsg(szMsg);

         }

         CKNIPCCUtility::ShowMsg("--------------------------------------------------\n");

     }

 }


 void CKNLanczosMethod::RecalcuWaveFunction(CKNLanczosMethod::LPEIGENVALUE_RESULT lpResult)

 {


     if( !CKNMPIManager::IsDeflationRoot() )

         return;


     unsigned int        i, j, nIndex = 0;

     CKNComplex          tempResult, complexNumber;

     double              fTempResult;


     for (i = 0; i < lpResult->nEigenValueCount; i++)

     {

         nIndex = 0;

         fTempResult = 0.;

         for (j = 0; j < CKNMPIManager::GetCurrentLoadBalanceCount(); j++)

         {

             complexNumber = lpResult->pEigenVectorsForAMatrix[i].GetAt(j);

             double          absoluteValue = complexNumber.GetAbsolute();

             fTempResult += (absoluteValue*absoluteValue);

             if (9 == j % 10)

             {

                 lpResult->pWaveFunctions[i].SetAt(nIndex++, fTempResult, 0);

                 fTempResult = 0.;

             }

         }

     }


 }


 void CKNLanczosMethod::AppendEigenValue(LPEIGENVALUE_RESULT lpResult, double fEigenValue, unsigned int nFindIteration, bool bInsertFirst)

 {

     int                     i;


     lpResult->nEigenValueCount++;

     lpResult->pEigenValues = (double*)realloc(lpResult->pEigenValues, sizeof(double) * lpResult->nEigenValueCount);

     if (bInsertFirst)

     {

         for( i = lpResult->nEigenValueCount - 1 ; i > 0 ; --i )

             lpResult->pEigenValues[i] = lpResult->pEigenValues[i-1];


         lpResult->pEigenValues[0] = fEigenValue;

     }

     else

         lpResult->pEigenValues[lpResult->nEigenValueCount-1] = fEigenValue;


     lpResult->pEigenValueFoundIteration = (unsigned int*)realloc(lpResult->pEigenValueFoundIteration, sizeof(unsigned int)*lpResult->nEigenValueCount);

     if (bInsertFirst)

     {

         for( i = lpResult->nEigenValueCount - 1 ; i > 0 ; --i )

             lpResult->pEigenValueFoundIteration[i] = lpResult->pEigenValueFoundIteration[i-1];


         lpResult->pEigenValueFoundIteration[0] = nFindIteration;

     }

     else

         lpResult->pEigenValueFoundIteration[lpResult->nEigenValueCount-1] = nFindIteration;

 }


 void CKNLanczosMethod::AppendEigenVector(LPEIGENVALUE_RESULT lpResult, CKNMatrixOperation::CKNVector *pEigenVector, bool bInsertFirst)

 {

     unsigned int                        i, nNewIndex;

     CKNMatrixOperation::CKNVector       *pEigenVectorsForAMatrix = new CKNMatrixOperation::CKNVector[lpResult->nEigenValueCount];

     CKNMatrixOperation::CKNVector       *pWaveFunctions =  NULL;

     unsigned int                        nAdjust = 0;


     if (bInsertFirst)

         nAdjust = 1;


     if( NULL != lpResult->pWaveFunctions )

         pWaveFunctions =  new CKNMatrixOperation::CKNVector[lpResult->nEigenValueCount];


     for( i = 0 + nAdjust; i < lpResult->nEigenValueCount - 1 + nAdjust; ++ i)

     {

         pEigenVectorsForAMatrix[i].SetSize(lpResult->pEigenVectorsForAMatrix[i-nAdjust].GetSize());

         pEigenVectorsForAMatrix[i] = lpResult->pEigenVectorsForAMatrix[i-nAdjust];


         if( NULL != lpResult->pWaveFunctions )

         {

             pWaveFunctions[i].SetSize(lpResult->pWaveFunctions[i-nAdjust].GetSize());

             pWaveFunctions[i] = lpResult->pWaveFunctions[i-nAdjust];


             if (bInsertFirst)

                 pWaveFunctions[0].SetSize(pEigenVector->GetSize()/10);

             else

                 pWaveFunctions[lpResult->nEigenValueCount-1].SetSize(pEigenVector->GetSize()/10);

         }

     }


     if (NULL != lpResult->pWaveFunctions)

     {

         for (i = 0; i < lpResult->nEigenValueCount -1; i++)

             lpResult->pWaveFunctions[i].Finalize();


         delete[] lpResult->pWaveFunctions;

         lpResult->pWaveFunctions = NULL;

         lpResult->pWaveFunctions = pWaveFunctions;

     }


     if (NULL != lpResult->pEigenVectorsForAMatrix)

     {

         for (i = 0; i < lpResult->nEigenValueCount-1; i++)

             lpResult->pEigenVectorsForAMatrix[i].Finalize();


         delete[] lpResult->pEigenVectorsForAMatrix;

         lpResult->pEigenVectorsForAMatrix = NULL;

         lpResult->pEigenVectorsForAMatrix = pEigenVectorsForAMatrix;


         if (bInsertFirst)

             nNewIndex = 0;

         else

             nNewIndex = lpResult->nEigenValueCount-1;


         lpResult->pEigenVectorsForAMatrix[nNewIndex].SetSize(pEigenVector->GetSize());

         lpResult->pEigenVectorsForAMatrix[nNewIndex] = *pEigenVector;

     }

 }


 void CKNLanczosMethod::MergeDegeneratedEigenvalues(CKNLanczosMethod::LPEIGENVALUE_RESULT lpResult, unsigned int nFindingDegeneratedEVCount, CKNMatrixOperation::CKNCSR *pA, CKNMatrixOperation::CKNCSR *pLocalBlock, CKNMatrixOperation::CKNCSR *pLeftBlock, CKNMatrixOperation::CKNCSR *pRightBlock)

 {

     unsigned int                    i, j, *pTargetDeflationGroup = NULL, k;

     unsigned int                    *pTargetDeflationEV = NULL, *pEVFindIteration = NULL;

     int                             *pEigenValueCount = NULL;

     double                          *pEVTotal = NULL;

     int                             nEVTotalCount = 0;

     MPI_Request                     req[2];

     double                          Command[COMMAND_SIZE];

     bool                            bKeepWait = true;

     unsigned int                    nTargetGroup;

     CKNComplex                      complexResult;


     if( CKNMPIManager::IsLanczosComputeRoot() )

     {

         pEigenValueCount = CKNMPIManager::GetEigenvalueCountFromDeflationGroup(nFindingDegeneratedEVCount, lpResult->nEigenValueCount);


         if( CKNMPIManager::IsDeflationRoot() )

         {

             int             nDeflationStartIndex, nDeflationIndex, nTargetIndex;


             for( i = 0; i < nFindingDegeneratedEVCount ; ++ i)

                 nEVTotalCount += pEigenValueCount[i];


             pEVTotal = (double*)malloc(sizeof(double)*nEVTotalCount);

             pTargetDeflationGroup = (unsigned int*)malloc(sizeof(unsigned int)*nEVTotalCount);

             pTargetDeflationEV = (unsigned int*)malloc(sizeof(unsigned int)*nEVTotalCount);

             pEVFindIteration = (unsigned int*)malloc(sizeof(unsigned int)*nEVTotalCount);


             nDeflationStartIndex = 0;

             nDeflationIndex = 0;


             for( i = 0; i < nFindingDegeneratedEVCount ; ++ i)

             {

                 nTargetIndex = 0;

                 for( j = nDeflationStartIndex ; j < nDeflationStartIndex + pEigenValueCount[i] ; ++j )

                 {

                     pTargetDeflationGroup[j] = nDeflationIndex;

                     pTargetDeflationEV[j] = nTargetIndex++;

                 }


                 nDeflationStartIndex += pEigenValueCount[i];

                 nDeflationIndex++;

             }

         }


         CKNMPIManager::GatherEVFromDeflationGroup(nFindingDegeneratedEVCount, pEVTotal, pEigenValueCount, lpResult->pEigenValues, lpResult->nEigenValueCount);

         CKNMPIManager::GatherEVIterationFromDeflationGroup(nFindingDegeneratedEVCount, (int*)pEVFindIteration, pEigenValueCount, (int*)lpResult->pEigenValueFoundIteration, lpResult->nEigenValueCount);

     }


     for( i = 0 ; i < lpResult->nEigenValueCount ; ++ i )

         FREE_MEM(lpResult->pEigenVectors[i]);

     FREE_MEM(lpResult->pEigenVectors);


     if( CKNMPIManager::IsDeflationRoot() )

     {

         if( CKNMPIManager::IsLanczosComputeRoot() )

         {

             int             nStartIndex = lpResult->nEigenValueCount;


             lpResult->nDegeneratedEigenValueCount = 0;

             lpResult->pDegeneratedEigenValues = (double*)malloc(sizeof(double)*(nEVTotalCount-lpResult->nEigenValueCount));

             for( i = pEigenValueCount[0] ; i < nEVTotalCount ; ++i )

             {

                 bool            bNewEigenValue = true;


                 for( j = 0 ; j < nStartIndex ; ++j )

                 {

                     if( CKNMatrixOperation::IsSameA(pEVTotal[i], lpResult->pEigenValues[j], TOLERANE_M_10_9))

                     {

                         bool                                bDoOrthgonal = false;

                         CKNMatrixOperation::CKNVector       vectorFromDeflation;

                         std::vector<unsigned int>           vectorOrthgonalTarget;


                         vectorOrthgonalTarget.push_back(j);

                         bNewEigenValue = false;


                         Command[0] = CHECK_EV_ORTH;

                         Command[1] = (double)pTargetDeflationGroup[i];

                         Command[2] = (double)pTargetDeflationEV[i];


                         CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetDeflationComm());

                         Command[2] = j;

                         CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());


                         vectorFromDeflation.SetSize(CKNMPIManager::GetCurrentLoadBalanceCount());

                         CKNMPIManager::ReceiveVectorSync(pTargetDeflationGroup[i], &vectorFromDeflation, vectorFromDeflation.GetSize(), &req[0], CKNMPIManager::GetDeflationComm());


                         CKNMatrixOperation::VVDot(&lpResult->pEigenVectorsForAMatrix[j], &vectorFromDeflation, &complexResult);


                         bDoOrthgonal = CKNMatrixOperation::IsSameA(fabs(complexResult.GetRealNumber()), 1, GENERAL_TOLERANCE);

                         bDoOrthgonal = !bDoOrthgonal;


                         if( bDoOrthgonal )

                         {

                             for( k = nStartIndex ; k < lpResult->nEigenValueCount ; ++k )

                             {

                                 if( CKNMatrixOperation::IsSameA(pEVTotal[i], lpResult->pEigenValues[k], TOLERANE_M_10_9))

                                 {

                                     Command[0] = CHECK_EV_ORTH_SIMPLE;

                                     Command[1] = (double)k;

                                     CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());


                                     CKNMatrixOperation::VVDot(&lpResult->pEigenVectorsForAMatrix[k], &vectorFromDeflation, &complexResult);

                                     if( CKNMatrixOperation::IsSameA(fabs(complexResult.GetRealNumber()), 1, GENERAL_TOLERANCE) )

                                     {

                                         bDoOrthgonal = false;

                                         break;

                                     }

                                     else

                                         vectorOrthgonalTarget.push_back(k);

                                 }

                             }

                         }


                         Command[0] = DO_ORTHGONAL;

                         Command[2] = j;

                         Command[1] = bDoOrthgonal ? 1 : 0;


                         CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());

                         if( bDoOrthgonal )

                         {

                             int             nOrthogonalTarget;

                             int             *pOrthgonalTarget = NULL;

                             double          fEigenValue;


                             nOrthogonalTarget = vectorOrthgonalTarget.size();

                             CKNMPIManager::BroadcastInt(&nOrthogonalTarget, 1);


                             pOrthgonalTarget = (int*)malloc(sizeof(int)*nOrthogonalTarget);

                             for( k = 0 ; k < nOrthogonalTarget ; ++ k )

                                 pOrthgonalTarget[k] = vectorOrthgonalTarget[k];

                             CKNMPIManager::BroadcastInt(pOrthgonalTarget, nOrthogonalTarget);


                             for( k = 0 ; k < nOrthogonalTarget ; ++ k )

                                 CKNMatrixOperation::Gram_schmidt(&lpResult->pEigenVectorsForAMatrix[pOrthgonalTarget[k]], &vectorFromDeflation);


                             CKNMatrixOperation::VVDot(&lpResult->pEigenVectorsForAMatrix[j], &vectorFromDeflation, &complexResult);

                             FREE_MEM(pOrthgonalTarget);


                             if( complexResult == 0.0 )

                             {

                                 CKNMatrixOperation::CKNVector       vectorTemp, vectorTemp2;

                                 vectorTemp.SetSize(vectorFromDeflation.GetSize());

                                 vectorTemp2.SetSize(vectorFromDeflation.GetSize());


                                 CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MVMUL);

                                 CKNMatrixOperation::MVMul(pA, &vectorFromDeflation, &vectorTemp);

                                 CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MVMUL);


                                 vectorTemp2 = vectorFromDeflation;


                                 if( CKNMPIManager::IsRootRank() )

                                     fEigenValue = lpResult->pEigenValues[j];

                                 CKNMPIManager::BroadcastDouble(&fEigenValue, 1);


                                 vectorTemp2.ScalarMultiple(fEigenValue);

                                 vectorTemp2.MinusVector(&vectorTemp);


                                 double fNorm = vectorTemp2.GetNorm(true);


                                 if( CKNMatrixOperation::IsSame(fNorm, 0.0, GENERAL_TOLERANCE))

                                 {

                                     Command[0] = SEND_BACK_EV;

                                     Command[1] = (double)pTargetDeflationGroup[i];

                                     Command[2] = lpResult->nDegeneratedEigenValueCount+1;

                                     lpResult->pDegeneratedEigenValues[lpResult->nDegeneratedEigenValueCount++] = complexResult.GetRealNumber();

                                     CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetDeflationComm());

                                     CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());

                                     CKNMPIManager::SendVectorSync(pTargetDeflationGroup[i], &vectorFromDeflation, vectorFromDeflation.GetSize(), &req[1], CKNMPIManager::GetDeflationComm());

                                     AppendEigenValue(lpResult, pEVTotal[i]);

                                     AppendEigenVector(lpResult, &vectorFromDeflation);

                                     break;

                                 }

                                 else

                                 {

                                     Command[0] = NOT_SEND_BACK_EV;

                                     CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());

                                 }

                             }

                             else

                             {

                                 Command[0] = NOT_SEND_BACK_EV;

                                 CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());

                             }

                         }

                         vectorFromDeflation.Finalize();

                     }

                 }


                 if(bNewEigenValue)

                 {

                     CKNMatrixOperation::CKNVector       vectorFromDeflation;


                     Command[0] = SEND_EV_TO_MASTER;

                     Command[1] = (double)pTargetDeflationGroup[i];

                     Command[2] = (double)pTargetDeflationEV[i];


                     CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetDeflationComm());

                     CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());


                     vectorFromDeflation.SetSize(CKNMPIManager::GetCurrentLoadBalanceCount());

                     CKNMPIManager::ReceiveVectorSync(pTargetDeflationGroup[i], &vectorFromDeflation, vectorFromDeflation.GetSize(), &req[0], CKNMPIManager::GetDeflationComm());


                     AppendEigenValue(lpResult, pEVTotal[i], pEVFindIteration[i], true);

                     AppendEigenVector(lpResult, &vectorFromDeflation, true);


                     nStartIndex++;

                 }

             }


             lpResult->pDegeneratedEigenValues = (double*)realloc(lpResult->pDegeneratedEigenValues, sizeof(double)*lpResult->nDegeneratedEigenValueCount);


             Command[0] = EXIT_MPI_WAIT;

             Command[1] = -1;

             CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetDeflationComm());

             CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());

         }

         else

         {

             while(bKeepWait)

             {

                 CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());


                 switch((int)Command[0])

                 {

                 case EXIT_MPI_WAIT:

                     bKeepWait = false;

                     break;

                 case SEND_EV_TO_MASTER:

                     {

                         CKNMatrixOperation::CKNVector       vectorFromDeflation;

                         vectorFromDeflation.SetSize(CKNMPIManager::GetCurrentLoadBalanceCount());


                         nTargetGroup = (unsigned int)Command[1];

                         nTargetGroup = CKNMPIManager::GetTotalNodeCount() * nTargetGroup + CKNMPIManager::GetCurrentRank();


                         CKNMPIManager::ReceiveVectorSync(nTargetGroup, &vectorFromDeflation, vectorFromDeflation.GetSize(), &req[0], MPI_COMM_WORLD);


                         lpResult->nEigenValueCount++;

                         AppendEigenVector(lpResult, &vectorFromDeflation, true);

                     }

                     break;

                 case CHECK_EV_ORTH:

                     {

                         CKNMatrixOperation::CKNVector       vectorFromDeflation;

                         vectorFromDeflation.SetSize(CKNMPIManager::GetCurrentLoadBalanceCount());


                         nTargetGroup = (unsigned int)Command[1];

                         nTargetGroup = CKNMPIManager::GetTotalNodeCount() * nTargetGroup + CKNMPIManager::GetCurrentRank();


                         CKNMPIManager::ReceiveVectorSync(nTargetGroup, &vectorFromDeflation, vectorFromDeflation.GetSize(), &req[0], MPI_COMM_WORLD);

                         CKNMatrixOperation::VVDot(&lpResult->pEigenVectorsForAMatrix[(int)Command[2]], &vectorFromDeflation, &complexResult);


                         while(1)

                         {

                             CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());

                             if( DO_ORTHGONAL == (int)Command[0] )

                                 break;

                             else if( CHECK_EV_ORTH_SIMPLE == (int)Command[0] )

                                 CKNMatrixOperation::VVDot(&lpResult->pEigenVectorsForAMatrix[(int)Command[1]], &vectorFromDeflation, &complexResult);

                         }


                         if( DO_ORTHGONAL == (int)Command[0] && 1 == (int)Command[1])

                         {


                             int             nOrthogonalTarget;

                             int             *pOrthgonalTarget = NULL;

                             double          fEigenValue;


                             CKNMPIManager::BroadcastInt(&nOrthogonalTarget, 1);


                             pOrthgonalTarget = (int*)malloc(sizeof(int)*nOrthogonalTarget);

                             CKNMPIManager::BroadcastInt(pOrthgonalTarget, nOrthogonalTarget);


                             for( k = 0 ; k < nOrthogonalTarget ; ++ k )

                                 CKNMatrixOperation::Gram_schmidt(&lpResult->pEigenVectorsForAMatrix[pOrthgonalTarget[k]], &vectorFromDeflation);


                             CKNMatrixOperation::VVDot(&lpResult->pEigenVectorsForAMatrix[(int)Command[2]], &vectorFromDeflation, &complexResult);

                             FREE_MEM(pOrthgonalTarget);


                             if( complexResult == 0.0 )

                             {

                                 CKNMatrixOperation::CKNVector       vectorTemp, vectorTemp2;

                                 vectorTemp.SetSize(vectorFromDeflation.GetSize());

                                 vectorTemp2.SetSize(vectorFromDeflation.GetSize());


                                 CKNTimeMeasurement::MeasurementStart(CKNTimeMeasurement::MVMUL);

                                 CKNMatrixOperation::MVMul(pA, &vectorFromDeflation, &vectorTemp);

                                 CKNTimeMeasurement::MeasurementEnd(CKNTimeMeasurement::MVMUL);


                                 vectorTemp2 = vectorFromDeflation;

                                 CKNMPIManager::BroadcastDouble(&fEigenValue, 1);

                                 vectorTemp2.ScalarMultiple(fEigenValue);

                                 vectorTemp2.MinusVector(&vectorTemp);

                                 double fNorm = vectorTemp2.GetNorm(true);

                             }


                             CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());

                             if( SEND_BACK_EV == (int)Command[0] )

                             {

                                 CKNMPIManager::SendVectorSync(nTargetGroup, &vectorFromDeflation, vectorFromDeflation.GetSize(), &req[1], MPI_COMM_WORLD);

                                 lpResult->nEigenValueCount++;

                                 lpResult->nDegeneratedEigenValueCount++;

                                 AppendEigenVector(lpResult, &vectorFromDeflation);

                             }

                         }


                         vectorFromDeflation.Finalize();

                     }

                     break;

                 }

             }

         }

     }

     else

     {

         int             nSentEVIndex = -1;


         lpResult->pDegeneratedIndex = (int*)malloc(sizeof(int)*lpResult->nEigenValueCount);

         for( i = 0 ; i < lpResult->nEigenValueCount ; ++i)

             lpResult->pDegeneratedIndex[i] = -1;


         if( CKNMPIManager::IsLanczosComputeRoot() )

         {

             while(bKeepWait)

             {

                 CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetDeflationComm());

                 switch((int)Command[0])

                 {

                 case EXIT_MPI_WAIT:

                     CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());

                     bKeepWait = false;

                     break;

                 case CHECK_EV_ORTH:

                 case SEND_EV_TO_MASTER:

                     nTargetGroup = (unsigned int)Command[1];

                     if( nTargetGroup == CKNMPIManager::GetLanczosGroupIndex())

                     {

                         CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());

                         nSentEVIndex = (int)Command[2];

                         CKNMPIManager::SendVectorSync(0, &lpResult->pEigenVectorsForAMatrix[nSentEVIndex], CKNMPIManager::GetCurrentLoadBalanceCount(), &req[0], CKNMPIManager::GetDeflationComm());

                     }

                     break;

                 case SEND_BACK_EV:

                     nTargetGroup = (unsigned int)Command[1];

                     if( nTargetGroup == CKNMPIManager::GetLanczosGroupIndex())

                     {

                         lpResult->pDegeneratedIndex[nSentEVIndex] = (unsigned int)Command[2];

                         CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());

                         CKNMPIManager::ReceiveVectorSync(0, &lpResult->pEigenVectorsForAMatrix[nSentEVIndex], CKNMPIManager::GetCurrentLoadBalanceCount(), &req[1], CKNMPIManager::GetDeflationComm());

                     }

                     break;

                 }

             }

         }

         else

         {

             while(bKeepWait)

             {

                 CKNMPIManager::ExchangeCommand(Command, CKNMPIManager::GetLanczosComputComm());

                 switch((int)Command[0])

                 {

                 case EXIT_MPI_WAIT:

                     bKeepWait = false;

                     break;

                 case SEND_EV_TO_MASTER:

                 case CHECK_EV_ORTH:

                     {

                         int nLanczosGroupSize = CKNMPIManager::GetTotalNodeCount();

                         nSentEVIndex = (int)Command[2];

                         CKNMPIManager::SendVectorSync(CKNMPIManager::GetCurrentRank(), &lpResult->pEigenVectorsForAMatrix[nSentEVIndex], CKNMPIManager::GetCurrentLoadBalanceCount(), &req[0], MPI_COMM_WORLD);

                     }

                     break;

                 case SEND_BACK_EV:

                     lpResult->pDegeneratedIndex[nSentEVIndex] = (unsigned int)Command[2];

                     CKNMPIManager::ReceiveVectorSync(CKNMPIManager::GetCurrentRank(), &lpResult->pEigenVectorsForAMatrix[nSentEVIndex], CKNMPIManager::GetCurrentLoadBalanceCount(), &req[1], MPI_COMM_WORLD);

                     break;

                 }

             }

         }

     }


     CKNMPIManager::BarrierAllComm();


     FREE_MEM(pEVTotal);

     FREE_MEM(pEigenValueCount);

     FREE_MEM(pEVFindIteration);

     FREE_MEM(pTargetDeflationGroup);

 }


 bool CKNLanczosMethod::CheckingCalculationCondition(bool bCalcuEigenValue, bool bCalcuWaveFunction, unsigned int nDeflationGroup)

 {

     bool                    bRtn = false;


     if( true == bCalcuWaveFunction )

         if( false == bCalcuEigenValue )

             return bRtn;


     if( nDeflationGroup > 1 && false == bCalcuEigenValue )

         return bRtn;


     bRtn = true;

     return bRtn;

 }


 int CKNLanczosMethod::ResultCompare(const void *pA, const void *pB)

 {

     CKNLanczosMethod::LPRESULT_SORT_DATA        lpA = (CKNLanczosMethod::LPRESULT_SORT_DATA)pA;

     CKNLanczosMethod::LPRESULT_SORT_DATA        lpB = (CKNLanczosMethod::LPRESULT_SORT_DATA)pB;


     if (lpA->fEigenValue > lpB->fEigenValue)

         return 1;

     else if(lpA->fEigenValue < lpB->fEigenValue)

         return -1;

     else

     {

         if( (unsigned int)lpA->nEigenValueFoundIteration > (unsigned int)lpB->nEigenValueFoundIteration )

             return 1;

         else

             return -1;

     }


     return -1;

 }


 void CKNLanczosMethod::SortSolution(LPEIGENVALUE_RESULT lpResult)

 {


     LPRESULT_SORT_DATA                  lpData = NULL;

     int                                 *pOrder = NULL;

     unsigned int                        i;

     CKNMatrixOperation::CKNVector       *pVectorEV = NULL, *pVectorWF = NULL;


     if( lpResult->nEigenValueCount <= 1 || false == CKNMPIManager::IsRootRank() )

         return;


     pOrder = (int*)malloc(sizeof(int)*lpResult->nEigenValueCount*2);

     if( NULL != lpResult->pEigenVectorsForAMatrix )

         pVectorEV = new CKNMatrixOperation::CKNVector[lpResult->nEigenValueCount];

     if( NULL != lpResult->pWaveFunctions )

         pVectorWF = new CKNMatrixOperation::CKNVector[lpResult->nEigenValueCount];


     if( CKNMPIManager::IsRootRank() )

     {

         lpData = (LPRESULT_SORT_DATA)malloc(sizeof(RESULT_SORT_DATA)*lpResult->nEigenValueCount);


         for( i = 0 ; i < lpResult->nEigenValueCount ; ++ i )

         {

             lpData[i].fEigenValue = lpResult->pEigenValues[i];

             lpData[i].nEigenValueFoundIteration = lpResult->pEigenValueFoundIteration[i];

             lpData[i].nOriginalIndex = i;

         }


         qsort(lpData, lpResult->nEigenValueCount, sizeof(RESULT_SORT_DATA), CKNLanczosMethod::ResultCompare);


         for( i = 0 ; i < lpResult->nEigenValueCount ; ++ i )

         {

             pOrder[i*2] = i;

             pOrder[i*2+1] = lpData[i].nOriginalIndex;

             lpResult->pEigenValues[i] = lpData[i].fEigenValue;

             lpResult->pEigenValueFoundIteration[i] = lpData[i].nEigenValueFoundIteration;

         }

     }


     /*if( CKNMPIManager::IsMultiLevelMPI() )

         CKNMPIManager::BroadcastInt(pOrder, lpResult->nEigenValueCount*2);*/


     for( i = 0; i < lpResult->nEigenValueCount ; ++ i)

     {

         if( NULL != lpResult->pEigenVectorsForAMatrix )

         {

             pVectorEV[i].SetSize(CKNMPIManager::GetCurrentLoadBalanceCount());

             pVectorEV[i] = lpResult->pEigenVectorsForAMatrix[i];

         }

         if( NULL != lpResult->pWaveFunctions )

         {

             pVectorWF[i].SetSize(CKNMPIManager::GetCurrentLoadBalanceCount()/10);

             pVectorWF[i] = lpResult->pWaveFunctions[i];

         }

     }


     for( i = 0; i < lpResult->nEigenValueCount ; ++ i)

     {

         if( NULL != lpResult->pEigenVectorsForAMatrix )

             lpResult->pEigenVectorsForAMatrix[pOrder[i*2]] = pVectorEV[pOrder[i*2+1]];

         if( NULL != lpResult->pWaveFunctions )

             lpResult->pWaveFunctions[pOrder[i*2]] = pVectorWF[pOrder[i*2+1]];

     }


     for( i = 0; i < lpResult->nEigenValueCount ; ++ i)

     {

         if( NULL != lpResult->pEigenVectorsForAMatrix )

             pVectorEV[i].Finalize();

         if( NULL != lpResult->pWaveFunctions )

             pVectorWF[i].Finalize();

     }

     if( NULL != lpResult->pEigenVectorsForAMatrix )

         delete[] pVectorEV;

     if( NULL != lpResult->pWaveFunctions )

         delete[] pVectorWF;


     FREE_MEM(lpData);

     FREE_MEM(pOrder);

 }

CKNMPIManager::BroadcastBool
static void BroadcastBool(bool *boolValue, int nRootRank=0)
Broadcst boolean value.
Definition: KNMPIManager.cpp:524

CKNMPIManager::GatherEVFromDeflationGroup
static void GatherEVFromDeflationGroup(int nSourceCount, double *pReceiveBuffer, int *pSourceCount, double *pSendBuffer, int nSendCount)
Definition: KNMPIManager.h:76

CKNTimeMeasurement::MVMUL
Definition: KNTimeMeasurement.h:24

CKNMatrixOperation::CKNVector::SetSize
void SetSize(unsigned int nSize)
Set Vector elements size.
Definition: KNMatrixOperation.cpp:40

DO_ORTHGONAL
#define DO_ORTHGONAL
Definition: CKNGlobal.h:96

CKNLanczosMethod::EIGENVALUE_RESULT::pWaveFunctions
CKNMatrixOperation::CKNVector * pWaveFunctions
Definition: KNLanczosMethod.h:40

CKNLanczosMethod::FinalLanczosVector
void FinalLanczosVector()
Deallocating lanczos vectors.
Definition: KNLanczosMethod.cpp:595

CKNComplex::GetImaginaryNumber
double GetImaginaryNumber() const
Get imaginary part.
Definition: KNComplex.h:27

CKNMPIManager::BroadcastInt
static void BroadcastInt(int *pValue, unsigned int nSize, int nRootRank=0, MPI_Comm comm=MPI_COMM_NULL)
Broadcst boolean value.
Definition: KNMPIManager.cpp:560

CKNMatrixOperation::CKNVector::ScalarDivision
void ScalarDivision(CKNComplex Scalar)
Scalar division operation.
Definition: KNMatrixOperation.cpp:164

CKNTimeMeasurement::MALLOC
Definition: KNTimeMeasurement.h:24

CKNIPCCUtility::ShowMsg
static void ShowMsg(char *pszBuffer)
Show message.
Definition: KNIPCCUtility.cpp:35

CKNMatrixOperation::CKNVector::ScalarMultiple
void ScalarMultiple(CKNComplex Scalar)
Scalar multiple operation.
Definition: KNMatrixOperation.cpp:129

CKNMatrixOperation::CKNVector::Normalize
void Normalize(bool bMPI=false)
Normalize vector with norm.
Definition: KNMatrixOperation.cpp:216

CKNMPIManager::Barrier
static void Barrier()
Definition: KNMPIManager.h:70

CKNLanczosMethod::DoSelectiveReorthogonalization
void DoSelectiveReorthogonalization(unsigned int nIterationCount)
Do selective reorthogonalization.
Definition: KNLanczosMethod.cpp:719

CKNMatrixOperation::CKNVector::ScalarMultiThanMinusVector
void ScalarMultiThanMinusVector(double fScalar, CKNVector *vector)
Do minus operation after scalar multiple to operand between vectors.
Definition: KNMatrixOperation.cpp:264

CKNMPIManager::GetMPIComm
static MPI_Comm GetMPIComm()
Definition: KNMPIManager.h:67

X_largest
unsigned int X_largest
Definition: KNLanczosMethod.cpp:27

CKNLanczosMethod::EIGENVALUE_RESULT::pEigenValues
double * pEigenValues
Definition: KNLanczosMethod.h:31

CKNLanczosMethod::MergeDegeneratedEigenvalues
static void MergeDegeneratedEigenvalues(CKNLanczosMethod::LPEIGENVALUE_RESULT lpResult, unsigned int nFindingDegeneratedEVCount, CKNMatrixOperation::CKNCSR *pA, CKNMatrixOperation::CKNCSR *pLocalBlock, CKNMatrixOperation::CKNCSR *pLeftBlock, CKNMatrixOperation::CKNCSR *pRightBlock)
Merging eigenvalue into mater group.
Definition: KNLanczosMethod.cpp:2010

CKNMPIManager::GetEigenvalueCountFromDeflationGroup
static int * GetEigenvalueCountFromDeflationGroup(int nDeflationGroupCount, int nLocalEVCount)
Checking is root rank of Deflation computation.
Definition: KNMPIManager.cpp:802

CKNMPIManager::BroadcastLanczosResult
static void BroadcastLanczosResult(CKNLanczosMethod::LPEIGENVALUE_RESULT lpResult, int nIterationCount)
Broadcast Lanczos result.
Definition: KNMPIManager.cpp:578

CKNLanczosMethod::DoResidualCheck
void DoResidualCheck(CKNMatrixOperation::CKNCSR *pAMatrix, LPEIGENVALUE_RESULT lpResult)
Residual checking.
Definition: KNLanczosMethod.cpp:1565

KNLanczosMethod.h
Show message and debugging variable.

CKNMPIManager::BroadcastDouble
static void BroadcastDouble(double *pValue, unsigned int nSize, int nRootRank=0, MPI_Comm comm=MPI_COMM_NULL)
Broadcst boolean value.
Definition: KNMPIManager.cpp:540

CKNTimeMeasurement::EVALUE
Definition: KNTimeMeasurement.h:24

CKNComplex::GetRealNumber
double GetRealNumber() const
Get real part.
Definition: KNComplex.h:26

CKNLanczosMethod::EIGENVALUE_RESULT::pEigenVectorsForAMatrix
CKNMatrixOperation::CKNVector * pEigenVectorsForAMatrix
Definition: KNLanczosMethod.h:35

CKNLanczosMethod::InitLanczosIterationVariables
void InitLanczosIterationVariables(CKNComplex **pAlpha, double **pAlphaReal, double **pBeta, double **pWj, double **pWjm1, double **pWjp1, CKNMatrixOperation::CKNVector **pW)
Init omega, alpha, beta array.
Definition: KNLanczosMethod.cpp:617

CKNMatrixOperation::CKNCSR::GetColumnCount
unsigned int GetColumnCount()
Getting row size of matrix.
Definition: KNMatrixOperation.h:173

CKNMPIManager::GetLanczosComputComm
static MPI_Comm GetLanczosComputComm()
Definition: KNMPIManager.h:79

CKNMatrixOperation::CKNCSR
Data and operation representation of CSR(Compressed Sparse Row)
Definition: KNMatrixOperation.h:164

CKNMPIManager::GetCurrentLoadBalanceCount
static int GetCurrentLoadBalanceCount()
Get Current node's rank load balancing number.
Definition: KNMPIManager.cpp:684

CKNLanczosMethod::LPRESULT_SORT_DATA
struct CKNLanczosMethod::RESULT_SORT_DATA * LPRESULT_SORT_DATA

CKNLanczosMethod::InitLanczosVector
void InitLanczosVector()
Init lanczos vectors.
Definition: KNLanczosMethod.cpp:576

CKNTimeMeasurement::MeasurementEnd
static void MeasurementEnd(MEASUREMENT_INDEX index)
Measurement end for part.
Definition: KNTimeMeasurement.cpp:87

CKNLanczosMethod::EIGENVALUE_RESULT::nEigenVectorSize
unsigned int nEigenVectorSize
Definition: KNLanczosMethod.h:34

CKNLanczosMethod::ResultCompare
static int ResultCompare(const void *pA, const void *pB)
Comparing computing result function for quick sorting.
Definition: KNLanczosMethod.cpp:2433

CKNTimeMeasurement::GetTakeTime
static double GetTakeTime(MEASUREMENT_INDEX index)
Get taken time for part.
Definition: KNTimeMeasurement.cpp:61

CKNMatrixOperation::MVMulEx_Optimal
static void MVMulEx_Optimal(CKNCSR *pAMatrix, CKNVector *pVector, CKNVector *pResult, unsigned int, unsigned int, CKNVector *, int)
Matrix and vector multiple operation for 1 layer exchanging communication.
Definition: KNMatrixOperation.cpp:2452

CKNMPIManager::GetLanczosGroupIndex
static unsigned int GetLanczosGroupIndex()
Definition: KNMPIManager.h:83

CKNMPIManager::GatherEVIterationFromDeflationGroup
static void GatherEVIterationFromDeflationGroup(int nSourceCount, int *pReceiveBuffer, int *pSourceCount, int *pSendBuffer, int nSendCount)
Gather eigenvalue from deflation group.
Definition: KNMPIManager.h:77

CKNLanczosMethod::InitializeTemporaryArrayAndVector
bool InitializeTemporaryArrayAndVector(int nIterationCount)
Initialize temporary eigenvalue arrays and vectors.
Definition: KNLanczosMethod.cpp:76

CKNLanczosMethod::EIGENVALUE_RESULT::pDegeneratedIndex
int * pDegeneratedIndex
Definition: KNLanczosMethod.h:42

CKNMPIManager::GetTotalNodeCount
static int GetTotalNodeCount()
Definition: KNMPIManager.h:44

CKNTimeMeasurement::VVDOT
Definition: KNTimeMeasurement.h:24

CKNLanczosMethod::BuildWaveFunction
void BuildWaveFunction(LPEIGENVALUE_RESULT lpResult)
Building wavefunction.
Definition: KNLanczosMethod.cpp:1530

CKNMPIManager::ReceiveVectorSync
static void ReceiveVectorSync(int nSourceRank, CKNMatrixOperation::CKNVector *pVector, int nSize, MPI_Request *req, MPI_Comm commWorld=MPI_COMM_NULL)
Receiving Vector with sync.
Definition: KNMPIManager.cpp:910

SHOW_SIMPLE_MSG
#define SHOW_SIMPLE_MSG(message)
Definition: CKNGlobal.h:41

CKNLanczosMethod::FinalizeLanczosInterationVariable
void FinalizeLanczosInterationVariable(CKNComplex *pAlpha, double *pAlphaReal, double *pBeta, double *pWj, double *pWjm1, double *pWjp1, CKNMatrixOperation::CKNVector *pW)
Deallocating omega, alpha, beta.
Definition: KNLanczosMethod.cpp:645

XeonPhi_header.h

CKNLanczosMethod::RESULT_SORT_DATA::fEigenValue
double fEigenValue
Definition: KNLanczosMethod.h:50

GENERAL_TOLERANCE
#define GENERAL_TOLERANCE
General tolerance definition.
Definition: CKNGlobal.h:48

CKNLanczosMethod::CKNLanczosMethod
CKNLanczosMethod()
Constructor.
Definition: KNLanczosMethod.cpp:32

CKNMatrixOperation::CKNVector::MinusVector
void MinusVector(CKNVector *vector)
Do minus operation between vectors.
Definition: KNMatrixOperation.cpp:322

CKNLanczosMethod::RecalcuWaveFunction
static void RecalcuWaveFunction(CKNLanczosMethod::LPEIGENVALUE_RESULT lpResult)
Recalculating wavefunction after merging degenerated eigenvalues.
Definition: KNLanczosMethod.cpp:1873

CKNLanczosMethod::CheckAndDoSelectiveReorthogonalization
bool CheckAndDoSelectiveReorthogonalization(int nIterationCount, double *pAlpha, double *pBeta, double *pWj, double *pWjm1, double *pWjp1, double fANorm)
Check current state need selective reorthogonalization and do it.
Definition: KNLanczosMethod.cpp:708

CKNTimeMeasurement::FILEIO
Definition: KNTimeMeasurement.h:24

CKNTimeMeasurement::EVALUE_MALLOC
Definition: KNTimeMeasurement.h:24

TOLERANE_M_10_9
#define TOLERANE_M_10_9
10^-9
Definition: CKNGlobal.h:49

CKNLanczosMethod::AppendEigenVector
static void AppendEigenVector(LPEIGENVALUE_RESULT lpResult, CKNMatrixOperation::CKNVector *pEigenVector, bool bInsertFirst=false)
Appending eigenvector into master group if degenerated eigenvalue is finded.
Definition: KNLanczosMethod.cpp:1941

CKNTimeMeasurement::MV_COMM
Definition: KNTimeMeasurement.h:24

CKNLanczosMethod::IntegrateEigenvalues
void IntegrateEigenvalues(int nIterationCount, LPEIGENVALUE_RESULT lpResult, unsigned int nCalculatedEigenValueCount, double *pCalcuResult_Value, double *pCalcuResult_Vector)
Integrating computing solution during Lanczos method operation.
Definition: KNLanczosMethod.cpp:1051

CKNMatrixOperation::IsSameA
static bool IsSameA(double operand1, double operand2, double tol)
Compare two double variable.
Definition: KNMatrixOperation.cpp:2802

CKNLanczosMethod::RESULT_SORT_DATA
Structure for eigenvalue result sorting.
Definition: KNLanczosMethod.h:49

CKNLanczosMethod::BuildTMatrix
double * BuildTMatrix(unsigned int nOrder, double *pAlpha, double *pBeta)
Building T matrix for solving eigenvalue.
Definition: KNLanczosMethod.cpp:1367

CKNLanczosMethod::StopIteration
static void StopIteration()
Stop lanczos iteration on going state.
Definition: KNLanczosMethod.cpp:1522

DEGENERATED_INDEX
#define DEGENERATED_INDEX
Definition: CKNGlobal.h:56

CKNLanczosMethod::SaveLanczosResult
static void SaveLanczosResult(CKNLanczosMethod::LPEIGENVALUE_RESULT lpResult, bool bCalcuEigenvalue, bool bWaveFunction, double *pKValue, int nRepeatCount)
Saving Lanczos computation result into file.
Definition: KNLanczosMethod.cpp:1654

EXIT_MPI_WAIT
#define EXIT_MPI_WAIT
Command for Deflation Lanczos.
Definition: CKNGlobal.h:94

CKNGlobal.h
Common definition for Solver.

CKNMPIManager::SendVectorSync
static void SendVectorSync(int nTargetRank, CKNMatrixOperation::CKNVector *pVector, int nSize, MPI_Request *req, MPI_Comm commWorld=MPI_COMM_NULL)
Getting Deflation computing group MPI_Comm.
Definition: KNMPIManager.cpp:890

CKNLanczosMethod::CheckingCalculationCondition
static bool CheckingCalculationCondition(bool bCalcuEigenValue, bool bCalcuWaveFunction, unsigned int nDeflationGroup)
Checking pre conditions for Lanczos method operation.
Definition: KNLanczosMethod.cpp:2413

CKNMatrixOperation::CKNVector::GetAt
CKNComplex GetAt(unsigned int nIndex)
Get element value from specific index.
Definition: KNMatrixOperation.cpp:100

CHECK_EV_ORTH
#define CHECK_EV_ORTH
Definition: CKNGlobal.h:95

CKNMPIManager::IsLanczosComputeRoot
static bool IsLanczosComputeRoot()
Barrier current deflation group.
Definition: KNMPIManager.h:71

CKNLanczosMethod::EIGENVALUE_RESULT
Structure for engienvalue computing.
Definition: KNLanczosMethod.h:30

CKNLanczosMethod::DoEigenValueSolving
bool DoEigenValueSolving(int nIterationCount, double *pAlpha, double *pBeta, double fANorm, LPEIGENVALUE_RESULT lpResult, bool bFinal)
Every user set iteration count calculate eigenvalues.
Definition: KNLanczosMethod.cpp:872

CKNLanczosMethod::ConvergenceCheckingEx
int ConvergenceCheckingEx(int nEigenValueCount, double *pEigenValues, double *pEiegnVectors, bool *pbValidEigenValue, double fANorm, double *pBeta, int nIterationCount)
Checking convergence criteria.
Definition: KNLanczosMethod.cpp:1101

CHECK_EV_ORTH_SIMPLE
#define CHECK_EV_ORTH_SIMPLE
Definition: CKNGlobal.h:100

CKNMatrixOperation::MVMul
static void MVMul(CKNCSR *pAMatrix, CKNVector *pVector, CKNVector *pResult)
Matrix and vector multiple operation.
Definition: KNMatrixOperation.cpp:2134

CKNLanczosMethod::EIGENVALUE_RESULT::nDegeneratedEigenValueCount
unsigned int nDegeneratedEigenValueCount
Definition: KNLanczosMethod.h:37

CKNMatrixOperation::MVMulOptimal
static void MVMulOptimal(CKNCSR *pAMatrix, CKNVector *pVector, CKNVector *pResult)
Matrix and vector multiple operation for multiple call.
Definition: KNMatrixOperation.cpp:2600

CKNLanczosMethod::EIGENVALUE_RESULT::pEigenValueFoundIteration
unsigned int * pEigenValueFoundIteration
Definition: KNLanczosMethod.h:39

KNTimeMeasurement.h
Time measurement class.

CKNLanczosMethod::SpuriousRitzValueChecking
int SpuriousRitzValueChecking(int nEigenValueCount, double *pEigenValues, double *pEigenVectors, double *pNonSpuriousValues, double *pNonSpuriousVectors, double fANorm, int nIterationCount)
Checking spurious values.
Definition: KNLanczosMethod.cpp:1202

CKNTimeMeasurement::VV_COMM
Definition: KNTimeMeasurement.h:24

SEND_EV_TO_MASTER
#define SEND_EV_TO_MASTER
Definition: CKNGlobal.h:99

CKNTimeMeasurement::FREE_MEM
Definition: KNTimeMeasurement.h:24

CKNMatrixOperation::CKNVector::m_vectValueImaginaryBuffer
double_vector_t m_vectValueImaginaryBuffer
A member variable for saving none zero elements.
Definition: KNMatrixOperation.h:105

CKNLanczosMethod::EIGENVALUE_RESULT::nMaxEigenValueFoundIteration
unsigned int nMaxEigenValueFoundIteration
Definition: KNLanczosMethod.h:38

CKNLanczosMethod::ExtractDoubleVector
void ExtractDoubleVector(unsigned int nVectorsize, double *pTarget, double *pSource, unsigned int nSrcCount, int *pFilter, unsigned int nFilterCount, bool bExclusive)
Extract vectors by condition that described in filter.
Definition: KNLanczosMethod.cpp:1453

inverse_iter
void inverse_iter(double *alpha, double *beta, double *app_evc, int iter, double app_eva)
Definition: KNLanczosMethod.cpp:790

NOT_SEND_BACK_EV
#define NOT_SEND_BACK_EV
Definition: CKNGlobal.h:98

CKNLanczosMethod::EIGENVALUE_RESULT::pDegeneratedEigenValues
double * pDegeneratedEigenValues
Definition: KNLanczosMethod.h:32

CKNMatrixOperation::CKNVector::Finalize
void Finalize()
Free allocated memory for vector elements.
Definition: KNMatrixOperation.cpp:365

CKNComplex::GetAbsolute
double GetAbsolute()
Get Absolute value of complex number.
Definition: KNComplex.cpp:24

CKNLanczosMethod::DoLanczosMethod
LPEIGENVALUE_RESULT DoLanczosMethod(CKNMatrixOperation::CKNCSR *pAMatrix, unsigned int nIterationCount, unsigned int nEigenValueCheckInterval, unsigned int nEigenValueCount, double fEigenvalueMin, double fEignevalueMax, double fConvergenceTolerance, bool bReorthogonalization, bool bCalcuEigVector, bool bWaveFunction, double load_in_MIC, CKNMatrixOperation::CKNCSR *pmylocalblock=NULL, CKNMatrixOperation::CKNCSR *leftlocalblock=NULL, CKNMatrixOperation::CKNCSR *rightlocalblock=NULL)
Doing lanczos method.
Definition: KNLanczosMethod.cpp:130

CKNLanczosMethod::InitVariables
void InitVariables()
Deallocating member variables.
Definition: KNLanczosMethod.cpp:1395

KNIPCCUtility.h
This class includes functions for matrix debugging.

CKNTimeMeasurement::GetTotalTakeTime
static double GetTotalTakeTime()
Definition: KNTimeMeasurement.h:32

CKNLanczosMethod::SortSolution
static void SortSolution(LPEIGENVALUE_RESULT lpResult)
Sorting computing eigenvalue.
Definition: KNLanczosMethod.cpp:2457

CKNLanczosMethod::DistinguishClusterOfEigenvalue
int DistinguishClusterOfEigenvalue(int nEigenValueCount, double *pEigenValues, double *pEigenVectors, double *pNonClustersValues, double *pNonClustersVectors, int nIterationCount)
Distinguish clusters values.
Definition: KNLanczosMethod.cpp:1271

CKNMPIManager::ExchangeCommand
static void ExchangeCommand(double *pfCommand, MPI_Comm comm)
Gather eigenvalue finding iteration number from deflation group.
Definition: KNMPIManager.cpp:878

CKNMatrixOperation::CKNVector::GetNorm
double GetNorm(bool bMPI=false)
Getting norm of vector.
Definition: KNMatrixOperation.cpp:232

CKNLanczosMethod::CalculateEigenVector
void CalculateEigenVector(LPEIGENVALUE_RESULT lpResult, CKNMatrixOperation::CKNVector V, unsigned int nIterationIndex)
Calculate Eigen vector of A Matrix.
Definition: KNLanczosMethod.cpp:673

CKNMPIManager::GetCurrentRank
static int GetCurrentRank()
Definition: KNMPIManager.h:42

CKNLanczosMethod::RESULT_SORT_DATA::nOriginalIndex
unsigned int nOriginalIndex
Definition: KNLanczosMethod.h:52

thomas_alg
void thomas_alg(double **T, double *initguess, double *app_evc, int iter)
Definition: KNLanczosMethod.cpp:725

CKNMPIManager::GetDeflationComm
static MPI_Comm GetDeflationComm()
Getting Lanczos computing group MPI_Comm.
Definition: KNMPIManager.h:80

CKNTimeMeasurement::EVALUE_FREE_MEM
Definition: KNTimeMeasurement.h:24

CKNLanczosMethod::IntegrateEigenvaluesEx
void IntegrateEigenvaluesEx(int nIterationCount, LPEIGENVALUE_RESULT lpResult, unsigned int nCalculatedEigenValueCount, unsigned int nCalculatedEigenValueCountBeforeConvergenceCheck, double *pCalcuResult_Value, double *pCalcuResult_Vector, bool *pbValidEigenValue)
Integrating computing solution during Lanczos method operation.
Definition: KNLanczosMethod.cpp:948

CKNMatrixOperation::CKNVector::m_vectValueRealBuffer
double_vector_t m_vectValueRealBuffer
A member variable for saving none zero elements.
Definition: KNMatrixOperation.h:104

ALLOC_WITH_NULL_INIT
#define ALLOC_WITH_NULL_INIT(pointer, data_type, data_size)
Definition: CKNGlobal.h:35

CKNLanczosMethod::AppendEigenValue
static void AppendEigenValue(LPEIGENVALUE_RESULT lpResult, double fEigenValue, unsigned int nFindIteration=DEGENERATED_INDEX, bool bInsertFirst=false)
Checking is aborting computation flag.
Definition: KNLanczosMethod.cpp:1908

CKNLanczosMethod::EIGENVALUE_RESULT::pEigenVectors
double ** pEigenVectors
Definition: KNLanczosMethod.h:33

CKNTimeMeasurement::MV_FREE_MEM
Definition: KNTimeMeasurement.h:24

CKNMatrixOperation::CKNVector::SetAt
void SetAt(unsigned int nIndex, CKNComplex value)
Set element value in specific index, Call by value.
Definition: KNMatrixOperation.cpp:54

CKNLanczosMethod::EIGENVALUE_RESULT::nEigenValueCount
unsigned int nEigenValueCount
Definition: KNLanczosMethod.h:36

FREE_MEM
#define FREE_MEM(pointer)
Macro for memory allocation and assign null value.
Definition: CKNGlobal.h:20

CKNMatrixOperation::CKNVector::GetSize
unsigned int GetSize()
Return Vector elements size.
Definition: KNMatrixOperation.h:71

CKNLanczosMethod::~CKNLanczosMethod
~CKNLanczosMethod()
Destructor.
Definition: KNLanczosMethod.cpp:67

CKNLanczosMethod::EIGENVALUE_RESULT::nEigenValueCountForMemeory
unsigned int nEigenValueCountForMemeory
Definition: KNLanczosMethod.h:41

CKNLanczosMethod::FinalizeTemporaryArrayAndVector
void FinalizeTemporaryArrayAndVector()
Finalize temporary eigenvalue arrays and vectors.
Definition: KNLanczosMethod.cpp:95

CKNTimeMeasurement::MV_MALLOC
Definition: KNTimeMeasurement.h:24

CKNLanczosMethod::ExtractDoubleValues
void ExtractDoubleValues(double *pTarget, double *pSource, unsigned int nSrcCount, int *pFilter, unsigned int nFilterCount, bool bExclusive)
Extract value by condition that described in filter.
Definition: KNLanczosMethod.cpp:1421

ERROR_MALLOC
const unsigned long ERROR_MALLOC
Error code that means error occur during memory allocation.
Definition: CKNGlobal.h:62

CKNComplex
This class for complex operation and saving value.
Definition: KNComplex.h:18

KNMPIManager.h
MPI Mangement class.

CKNMPIManager::BarrierAllComm
static void BarrierAllComm()
Is Multilevel MPI Setting.
Definition: KNMPIManager.cpp:791

CKNLanczosMethod::ReleaseResult
static void ReleaseResult(LPEIGENVALUE_RESULT lpResult, bool bReleaseStruct)
Release memory for lanczos method result.
Definition: KNLanczosMethod.cpp:1480

CKNTimeMeasurement::MeasurementStart
static void MeasurementStart(MEASUREMENT_INDEX index)
Measurement start for part.
Definition: KNTimeMeasurement.cpp:73

CKNLanczosMethod::DistinguishClusterOfEigenvalueEx
int DistinguishClusterOfEigenvalueEx(int nEigenValueCount, double *pEigenValues, double *pEigenVectors, bool *pbValidEigenValues, int nIterationCount)
Distinguish clusters values.
Definition: KNLanczosMethod.cpp:1233

CKNLanczosMethod::LanczosIteration
LPEIGENVALUE_RESULT LanczosIteration()
Doing lanczos basic iteration.
Definition: KNLanczosMethod.cpp:173

CKNMPIManager::IsRootRank
static bool IsRootRank()
Get Total node count.
Definition: KNMPIManager.cpp:217

CKNLanczosMethod::LanczosIterationLoop
void LanczosIterationLoop(LPEIGENVALUE_RESULT lpResult, CKNMatrixOperation::CKNVector *V1, unsigned int nIterationCount, CKNComplex *pAlpha, double *pAlphaReal, double *pBeta, double *pWj, double *pWjm1, double *pWjp1, bool bMakeEigvVector=false)
Doing lanczos basic iteration.
Definition: KNLanczosMethod.cpp:303

CKNLanczosMethod::m_bStop
static bool m_bStop
Determind stop iteration before end of iteration count.
Definition: KNLanczosMethod.h:131

CKNTimeMeasurement::COMM
Definition: KNTimeMeasurement.h:24

COMMAND_SIZE
#define COMMAND_SIZE
Definition: CKNGlobal.h:102

CKNLanczosMethod::RangeChecking
int RangeChecking(int nEigenValueCount, double *pEigenValues, double *pEiegnVectors, double *pRangeCheckingEigenValues, double *pRangeCheckingVectors, int nIterationCount)
Checking eigenvalue range.
Definition: KNLanczosMethod.cpp:1173

CKNMatrixOperation::IsSame
static bool IsSame(double operand1, double operand2, double tol)
Compare two double variable.
Definition: KNMatrixOperation.cpp:2789

CKNMatrixOperation::Gram_schmidt
static int Gram_schmidt(CKNVector *pVect1, CKNVector *pVect2)
Doing gam schmidt orthogonalization.
Definition: KNMatrixOperation.cpp:2814

CKNLanczosMethod::EigenValueSolver
int EigenValueSolver(unsigned int nIterationCount, double *pAlpha, double *pBeta, double *pEigenValues, double *pEigenVectors)
EigenValue Solving.
Definition: KNLanczosMethod.cpp:1321

CKNMPIManager::IsMultiLevelMPI
static bool IsMultiLevelMPI()
Get MPI_Comm.
Definition: KNMPIManager.h:68

CKNLanczosMethod::RESULT_SORT_DATA::nEigenValueFoundIteration
int nEigenValueFoundIteration
Definition: KNLanczosMethod.h:51

CKNLanczosMethod::ConvergenceChecking
int ConvergenceChecking(int nEigenValueCount, double *pEigenValues, double *pEiegnVectors, double *pConvergedEigenValues, double *pConvergedEigenVectors, double fANorm, double *pBeta, int nIterationCount)
Checking convergence criteria.
Definition: KNLanczosMethod.cpp:1138

DO_NOT_CONVERGENCE_CHECKING
#define DO_NOT_CONVERGENCE_CHECKING
Convergernece checking option default value.
Definition: CKNGlobal.h:46

CKNMatrixOperation::CKNVector
This class for describing vector for Lanczos method.
Definition: KNMatrixOperation.h:60

CKNLanczosMethod::ShowLanczosResult
static void ShowLanczosResult(CKNLanczosMethod::LPEIGENVALUE_RESULT lpResult, bool bCalculateEigenVectors, bool bCalculateWaveFunction, double *pKValue, int nRepeatCount)
Save calculating result into file.
Definition: KNLanczosMethod.cpp:1822

CKNMatrixOperation::VVDot
static bool VVDot(CKNVector *pVector1, CKNVector *pVector2, CKNComplex *pResult)
Between vectors dot product operation.
Definition: KNMatrixOperation.cpp:2691

CKNMPIManager::IsDeflationRoot
static bool IsDeflationRoot()
Checking is root rank of Lanczos computation.
Definition: KNMPIManager.h:72

SEND_BACK_EV
#define SEND_BACK_EV
Definition: CKNGlobal.h:97