quantum-espresso/LAXlib/la_module.f90

MODULE LAXlib
#ifdef __CUDA
  USE cudafor
#endif
  IMPLICIT NONE
  !
  INTERFACE diaghg
     MODULE PROCEDURE cdiaghg_cpu_, rdiaghg_cpu_
#ifdef __CUDA
     MODULE PROCEDURE cdiaghg_gpu_, rdiaghg_gpu_
#endif
  END INTERFACE
  !
  CONTAINS
  !
  !----------------------------------------------------------------------------
  SUBROUTINE cdiaghg_cpu_( n, m, h, s, ldh, e, v, offload )
    !----------------------------------------------------------------------------
    !
    ! ... calculates eigenvalues and eigenvectors of the generalized problem
    ! ... Hv=eSv, with H hermitean matrix, S overlap matrix.
    ! ... On output both matrix are unchanged
    !
    ! ... LAPACK version - uses both ZHEGV and ZHEGVX
    !
    USE la_param,          ONLY : DP
#if defined (__CUDA)
    USE cudafor
#endif
    !
    IMPLICIT NONE
    !
    INTEGER, INTENT(IN) :: n, m, ldh
      ! dimension of the matrix to be diagonalized
      ! number of eigenstates to be calculate
      ! leading dimension of h, as declared in the calling pgm unit
    COMPLEX(DP), INTENT(INOUT) :: h(ldh,n), s(ldh,n)
      ! actually intent(in) but compilers don't know and complain
      ! matrix to be diagonalized
      ! overlap matrix
    REAL(DP), INTENT(OUT) :: e(n)
      ! eigenvalues
    COMPLEX(DP), INTENT(OUT) :: v(ldh,m)
      ! eigenvectors (column-wise)
    LOGICAL, OPTIONAL ::  offload
      ! optionally evaluate offload on GPU 
    LOGICAL :: loffload
      !
#if defined(__CUDA)
    COMPLEX(DP), ALLOCATABLE, DEVICE :: v_d(:,:), h_d(:,:), s_d(:,:)
    REAL(DP),    ALLOCATABLE, DEVICE :: e_d(:)
    INTEGER :: info
#endif
    !
    loffload = .false.
    !
    ! the following ifdef ensures no offload if not compiling from GPU 
#if defined(__CUDA)
    IF (PRESENT(offload)) loffload = offload
#endif
    !
    ! ... always false on CPU cude
    !
    IF ( loffload ) THEN
#if defined(__CUDA)
      !
      ALLOCATE(s_d, source=s); ALLOCATE(h_d, source=h)
      ALLOCATE(e_d(n), v_d(ldh,n))
      !
      CALL cdiaghg_gpu(n, m, h_d, s_d, ldh, e_d, v_d)
      !
      e = e_d
      v(1:ldh,1:m) = v_d(1:ldh,1:m)
      !
      DEALLOCATE(h_d, s_d, e_d, v_d)
#endif
    ELSE
      CALL cdiaghg(n, m, h, s, ldh, e, v)
    END IF
    !
    RETURN
    !
  END SUBROUTINE cdiaghg_cpu_
  !
#if defined(__CUDA)
  !----------------------------------------------------------------------------
  SUBROUTINE cdiaghg_gpu_( n, m, h_d, s_d, ldh, e_d, v_d, onhost )
    !----------------------------------------------------------------------------
    !
    ! ... calculates eigenvalues and eigenvectors of the generalized problem
    ! ... Hv=eSv, with H hermitean matrix, S overlap matrix.
    ! ... On output both matrix are unchanged
    !
    ! ... LAPACK version - uses both ZHEGV and ZHEGVX
    !
    USE la_param,          ONLY : DP
    USE cudafor
    !
    IMPLICIT NONE
    !
    INTEGER, INTENT(IN) :: n, m, ldh
      ! dimension of the matrix to be diagonalized
      ! number of eigenstates to be calculate
      ! leading dimension of h, as declared in the calling pgm unit
    COMPLEX(DP), DEVICE, INTENT(INOUT) :: h_d(ldh,n), s_d(ldh,n)
      ! actually intent(in) but compilers don't know and complain
      ! matrix to be diagonalized
      ! overlap matrix
    REAL(DP), DEVICE, INTENT(OUT) :: e_d(n)
      ! eigenvalues
    COMPLEX(DP), DEVICE, INTENT(OUT) :: v_d(ldh,n)
      ! eigenvectors (column-wise)
    LOGICAL, OPTIONAL ::  onhost
      ! optionally evaluate offload on GPU 
    LOGICAL :: lonhost
      !
    COMPLEX(DP), ALLOCATABLE :: v(:,:), h(:,:), s(:,:)
    REAL(DP),    ALLOCATABLE :: e(:)
    !
    INTEGER :: info
    !
    lonhost = .false.
    !
    IF (PRESENT(onhost)) lonhost = onhost
    !
    !
    IF ( lonhost ) THEN
      !
      ALLOCATE(s, source=s_d); ALLOCATE(h, source=h_d)
      ALLOCATE(e(n), v(ldh,m))
      !
      CALL cdiaghg(n, m, h, s, ldh, e, v)
      !
      e_d = e
      v_d(1:ldh,1:m) = v(1:ldh,1:m)
      !
      DEALLOCATE(h, s, e, v)
    ELSE
      CALL cdiaghg_gpu(n, m, h_d, s_d, ldh, e_d, v_d)
    END IF
    !
    RETURN
    !
  END SUBROUTINE cdiaghg_gpu_
#endif
  !
  !----------------------------------------------------------------------------
  SUBROUTINE rdiaghg_cpu_( n, m, h, s, ldh, e, v, offload )
    !----------------------------------------------------------------------------
    !
    ! ... general interface for rdiaghg
    !
    USE la_param,          ONLY : DP
#if defined(__CUDA)
    USE cudafor
#endif
    !
    IMPLICIT NONE
    !
    INTEGER, INTENT(IN) :: n, m, ldh
      ! dimension of the matrix to be diagonalized
      ! number of eigenstates to be calculate
      ! leading dimension of h, as declared in the calling pgm unit
    REAL(DP), INTENT(INOUT) :: h(ldh,n), s(ldh,n)
      ! actually intent(in) but compilers don't know and complain
      ! matrix to be diagonalized
      ! overlap matrix
    REAL(DP), INTENT(OUT) :: e(n)
      ! eigenvalues
    REAL(DP), INTENT(OUT) :: v(ldh,m)
      ! eigenvectors (column-wise)
    LOGICAL, OPTIONAL ::  offload
      ! optionally evaluate offload on GPU 
    LOGICAL :: loffload
      !
#if defined(__CUDA)
    REAL(DP), ALLOCATABLE, DEVICE :: v_d(:,:), h_d(:,:), s_d(:,:)
    REAL(DP), ALLOCATABLE, DEVICE :: e_d(:)
    INTEGER :: info
#endif
    !
    loffload = .false.
    !
    ! the following ifdef ensures no offload if not compiling from GPU 
#if defined(__CUDA)
    IF (PRESENT(offload)) loffload = offload
#endif
    !
    ! ... always false on CPU cude
    !
    IF ( loffload ) THEN
#if defined(__CUDA)
      !
      ALLOCATE(s_d, source=s); ALLOCATE(h_d, source=h)
      ALLOCATE(e_d(n), v_d(ldh,n))
      !
      CALL rdiaghg_gpu(n, m, h_d, s_d, ldh, e_d, v_d)
      !
      e = e_d
      v(1:ldh,1:m) = v_d(1:ldh,1:m)
      !
      DEALLOCATE(h_d, s_d, e_d, v_d)
#endif
    ELSE
      CALL rdiaghg(n, m, h, s, ldh, e, v)
    END IF
    !
    RETURN
    !
  END SUBROUTINE rdiaghg_cpu_
  !
#if defined(__CUDA)
  !----------------------------------------------------------------------------
  SUBROUTINE rdiaghg_gpu_( n, m, h_d, s_d, ldh, e_d, v_d, onhost )
    !----------------------------------------------------------------------------
    !
    ! ... General interface to rdiaghg_gpu
    !
    USE la_param,          ONLY : DP
    USE cudafor
    !
    IMPLICIT NONE
    !
    INTEGER, INTENT(IN) :: n, m, ldh
      ! dimension of the matrix to be diagonalized
      ! number of eigenstates to be calculate
      ! leading dimension of h, as declared in the calling pgm unit
    REAL(DP), DEVICE, INTENT(INOUT) :: h_d(ldh,n), s_d(ldh,n)
      ! actually intent(in) but compilers don't know and complain
      ! matrix to be diagonalized
      ! overlap matrix
    REAL(DP), DEVICE, INTENT(OUT) :: e_d(n)
      ! eigenvalues
    REAL(DP), DEVICE, INTENT(OUT) :: v_d(ldh,n)
      ! eigenvectors (column-wise)
    LOGICAL, OPTIONAL ::  onhost
      ! optionally evaluate offload on GPU 
    LOGICAL :: lonhost
      !
    REAL(DP), ALLOCATABLE :: v(:,:), h(:,:), s(:,:)
    REAL(DP),    ALLOCATABLE :: e(:)
    !
    INTEGER :: info
    !
    lonhost = .false.
    !
    IF (PRESENT(onhost)) lonhost = onhost
    !
    !
    IF ( lonhost ) THEN
      !
      ALLOCATE(s, source=s_d); ALLOCATE(h, source=h_d)
      ALLOCATE(e(n), v(ldh,m))
      !
      CALL rdiaghg(n, m, h, s, ldh, e, v)
      !
      e_d = e
      v_d(1:ldh,1:m) = v(1:ldh,1:m)
      !
      DEALLOCATE(h, s, e, v)
    ELSE
      CALL rdiaghg_gpu(n, m, h_d, s_d, ldh, e_d, v_d)
    END IF
    !
    RETURN
    !
  END SUBROUTINE rdiaghg_gpu_
#endif
END MODULE LAXlib
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`MODULE LAXlib`
			`#ifdef __CUDA`
			`USE cudafor`
			`#endif`
			`IMPLICIT NONE`
			`!`
			`INTERFACE diaghg`
			`MODULE PROCEDURE cdiaghg_cpu_, rdiaghg_cpu_`
			`#ifdef __CUDA`
			`MODULE PROCEDURE cdiaghg_gpu_, rdiaghg_gpu_`
			`#endif`
			`END INTERFACE`
			`!`
			`CONTAINS`
			`!`
			`!----------------------------------------------------------------------------`
			`SUBROUTINE cdiaghg_cpu_( n, m, h, s, ldh, e, v, offload )`
			`!----------------------------------------------------------------------------`
			`!`
			`! ... calculates eigenvalues and eigenvectors of the generalized problem`
			`! ... Hv=eSv, with H hermitean matrix, S overlap matrix.`
			`! ... On output both matrix are unchanged`
			`!`
			`! ... LAPACK version - uses both ZHEGV and ZHEGVX`
			`!`
			`USE la_param, ONLY : DP`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#if defined (__CUDA)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`USE cudafor`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#endif`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`IMPLICIT NONE`
			`!`
			`INTEGER, INTENT(IN) :: n, m, ldh`
			`! dimension of the matrix to be diagonalized`
			`! number of eigenstates to be calculate`
			`! leading dimension of h, as declared in the calling pgm unit`
			`COMPLEX(DP), INTENT(INOUT) :: h(ldh,n), s(ldh,n)`
			`! actually intent(in) but compilers don't know and complain`
			`! matrix to be diagonalized`
			`! overlap matrix`
			`REAL(DP), INTENT(OUT) :: e(n)`
			`! eigenvalues`
			`COMPLEX(DP), INTENT(OUT) :: v(ldh,m)`
			`! eigenvectors (column-wise)`
			`LOGICAL, OPTIONAL :: offload`
			`! optionally evaluate offload on GPU`
			`LOGICAL :: loffload`
			`!`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#if defined(__CUDA)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`COMPLEX(DP), ALLOCATABLE, DEVICE :: v_d(:,:), h_d(:,:), s_d(:,:)`
			`REAL(DP), ALLOCATABLE, DEVICE :: e_d(:)`
			`INTEGER :: info`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#endif`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`loffload = .false.`
			`!`
			`! the following ifdef ensures no offload if not compiling from GPU`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#if defined(__CUDA)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`IF (PRESENT(offload)) loffload = offload`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#endif`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`! ... always false on CPU cude`
			`!`
			`IF ( loffload ) THEN`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#if defined(__CUDA)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`ALLOCATE(s_d, source=s); ALLOCATE(h_d, source=h)`
			`ALLOCATE(e_d(n), v_d(ldh,n))`
			`!`
			`CALL cdiaghg_gpu(n, m, h_d, s_d, ldh, e_d, v_d)`
			`!`
			`e = e_d`
Corrected arrays size and one misleading error message 2018-02-28 16:24:30 +08:00			`v(1:ldh,1:m) = v_d(1:ldh,1:m)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`DEALLOCATE(h_d, s_d, e_d, v_d)`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#endif`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`ELSE`
			`CALL cdiaghg(n, m, h, s, ldh, e, v)`
			`END IF`
			`!`
			`RETURN`
			`!`
			`END SUBROUTINE cdiaghg_cpu_`
			`!`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#if defined(__CUDA)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!----------------------------------------------------------------------------`
			`SUBROUTINE cdiaghg_gpu_( n, m, h_d, s_d, ldh, e_d, v_d, onhost )`
			`!----------------------------------------------------------------------------`
			`!`
			`! ... calculates eigenvalues and eigenvectors of the generalized problem`
			`! ... Hv=eSv, with H hermitean matrix, S overlap matrix.`
			`! ... On output both matrix are unchanged`
			`!`
			`! ... LAPACK version - uses both ZHEGV and ZHEGVX`
			`!`
			`USE la_param, ONLY : DP`
			`USE cudafor`
			`!`
			`IMPLICIT NONE`
			`!`
			`INTEGER, INTENT(IN) :: n, m, ldh`
			`! dimension of the matrix to be diagonalized`
			`! number of eigenstates to be calculate`
			`! leading dimension of h, as declared in the calling pgm unit`
			`COMPLEX(DP), DEVICE, INTENT(INOUT) :: h_d(ldh,n), s_d(ldh,n)`
			`! actually intent(in) but compilers don't know and complain`
			`! matrix to be diagonalized`
			`! overlap matrix`
			`REAL(DP), DEVICE, INTENT(OUT) :: e_d(n)`
			`! eigenvalues`
Corrected arrays size and one misleading error message 2018-02-28 16:24:30 +08:00			`COMPLEX(DP), DEVICE, INTENT(OUT) :: v_d(ldh,n)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`! eigenvectors (column-wise)`
			`LOGICAL, OPTIONAL :: onhost`
			`! optionally evaluate offload on GPU`
			`LOGICAL :: lonhost`
			`!`
			`COMPLEX(DP), ALLOCATABLE :: v(:,:), h(:,:), s(:,:)`
			`REAL(DP), ALLOCATABLE :: e(:)`
			`!`
			`INTEGER :: info`
			`!`
			`lonhost = .false.`
			`!`
			`IF (PRESENT(onhost)) lonhost = onhost`
			`!`
			`!`
			`IF ( lonhost ) THEN`
			`!`
			`ALLOCATE(s, source=s_d); ALLOCATE(h, source=h_d)`
Corrected arrays size and one misleading error message 2018-02-28 16:24:30 +08:00			`ALLOCATE(e(n), v(ldh,m))`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`CALL cdiaghg(n, m, h, s, ldh, e, v)`
			`!`
			`e_d = e`
Corrected arrays size and one misleading error message 2018-02-28 16:24:30 +08:00			`v_d(1:ldh,1:m) = v(1:ldh,1:m)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`DEALLOCATE(h, s, e, v)`
			`ELSE`
			`CALL cdiaghg_gpu(n, m, h_d, s_d, ldh, e_d, v_d)`
			`END IF`
			`!`
			`RETURN`
			`!`
			`END SUBROUTINE cdiaghg_gpu_`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#endif`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`!----------------------------------------------------------------------------`
			`SUBROUTINE rdiaghg_cpu_( n, m, h, s, ldh, e, v, offload )`
			`!----------------------------------------------------------------------------`
			`!`
			`! ... general interface for rdiaghg`
			`!`
			`USE la_param, ONLY : DP`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#if defined(__CUDA)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`USE cudafor`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#endif`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`IMPLICIT NONE`
			`!`
			`INTEGER, INTENT(IN) :: n, m, ldh`
			`! dimension of the matrix to be diagonalized`
			`! number of eigenstates to be calculate`
			`! leading dimension of h, as declared in the calling pgm unit`
			`REAL(DP), INTENT(INOUT) :: h(ldh,n), s(ldh,n)`
			`! actually intent(in) but compilers don't know and complain`
			`! matrix to be diagonalized`
			`! overlap matrix`
			`REAL(DP), INTENT(OUT) :: e(n)`
			`! eigenvalues`
			`REAL(DP), INTENT(OUT) :: v(ldh,m)`
			`! eigenvectors (column-wise)`
			`LOGICAL, OPTIONAL :: offload`
			`! optionally evaluate offload on GPU`
			`LOGICAL :: loffload`
			`!`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#if defined(__CUDA)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`REAL(DP), ALLOCATABLE, DEVICE :: v_d(:,:), h_d(:,:), s_d(:,:)`
			`REAL(DP), ALLOCATABLE, DEVICE :: e_d(:)`
			`INTEGER :: info`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#endif`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`loffload = .false.`
			`!`
			`! the following ifdef ensures no offload if not compiling from GPU`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#if defined(__CUDA)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`IF (PRESENT(offload)) loffload = offload`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#endif`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`! ... always false on CPU cude`
			`!`
			`IF ( loffload ) THEN`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#if defined(__CUDA)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`ALLOCATE(s_d, source=s); ALLOCATE(h_d, source=h)`
			`ALLOCATE(e_d(n), v_d(ldh,n))`
			`!`
			`CALL rdiaghg_gpu(n, m, h_d, s_d, ldh, e_d, v_d)`
			`!`
			`e = e_d`
Corrected arrays size and one misleading error message 2018-02-28 16:24:30 +08:00			`v(1:ldh,1:m) = v_d(1:ldh,1:m)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`DEALLOCATE(h_d, s_d, e_d, v_d)`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#endif`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`ELSE`
			`CALL rdiaghg(n, m, h, s, ldh, e, v)`
			`END IF`
			`!`
			`RETURN`
			`!`
			`END SUBROUTINE rdiaghg_cpu_`
			`!`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#if defined(__CUDA)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!----------------------------------------------------------------------------`
			`SUBROUTINE rdiaghg_gpu_( n, m, h_d, s_d, ldh, e_d, v_d, onhost )`
			`!----------------------------------------------------------------------------`
			`!`
			`! ... General interface to rdiaghg_gpu`
			`!`
			`USE la_param, ONLY : DP`
			`USE cudafor`
			`!`
			`IMPLICIT NONE`
			`!`
			`INTEGER, INTENT(IN) :: n, m, ldh`
			`! dimension of the matrix to be diagonalized`
			`! number of eigenstates to be calculate`
			`! leading dimension of h, as declared in the calling pgm unit`
			`REAL(DP), DEVICE, INTENT(INOUT) :: h_d(ldh,n), s_d(ldh,n)`
			`! actually intent(in) but compilers don't know and complain`
			`! matrix to be diagonalized`
			`! overlap matrix`
			`REAL(DP), DEVICE, INTENT(OUT) :: e_d(n)`
			`! eigenvalues`
Corrected arrays size and one misleading error message 2018-02-28 16:24:30 +08:00			`REAL(DP), DEVICE, INTENT(OUT) :: v_d(ldh,n)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`! eigenvectors (column-wise)`
			`LOGICAL, OPTIONAL :: onhost`
			`! optionally evaluate offload on GPU`
			`LOGICAL :: lonhost`
			`!`
			`REAL(DP), ALLOCATABLE :: v(:,:), h(:,:), s(:,:)`
			`REAL(DP), ALLOCATABLE :: e(:)`
			`!`
			`INTEGER :: info`
			`!`
			`lonhost = .false.`
			`!`
			`IF (PRESENT(onhost)) lonhost = onhost`
			`!`
			`!`
			`IF ( lonhost ) THEN`
			`!`
			`ALLOCATE(s, source=s_d); ALLOCATE(h, source=h_d)`
Corrected arrays size and one misleading error message 2018-02-28 16:24:30 +08:00			`ALLOCATE(e(n), v(ldh,m))`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`CALL rdiaghg(n, m, h, s, ldh, e, v)`
			`!`
			`e_d = e`
Corrected arrays size and one misleading error message 2018-02-28 16:24:30 +08:00			`v_d(1:ldh,1:m) = v(1:ldh,1:m)`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`!`
			`DEALLOCATE(h, s, e, v)`
			`ELSE`
			`CALL rdiaghg_gpu(n, m, h_d, s_d, ldh, e_d, v_d)`
			`END IF`
			`!`
			`RETURN`
			`!`
			`END SUBROUTINE rdiaghg_gpu_`
Preprocessor directives moved 2018-03-01 21:31:30 +08:00			`#endif`
Created general interface for diagonalization 2018-02-23 23:13:44 +08:00			`END MODULE LAXlib`