quantum-espresso/PWCOND/scatter_forw.f90

!
! Copyright (C) 2003 A. Smogunov 
! This file is distributed under the terms of the
! GNU General Public License. See the file `License'
! in the root directory of the present distribution,
! or http://www.gnu.org/copyleft/gpl.txt .
!
subroutine scatter_forw(zin, zfin, orbin, orbfin)
!
! This subroutine computes local Phi_n and partial nonlocal Phi_alpha
! solutions of the Schrodinger equation in the region zin<z<zfin
! on which the general solution may be constructed:
!        \sum a_n Phi_n + \sum a_alpha Phi_alpha
! It computes also the integrals (intw1, intw2) of  Phi_n and 
! Phi_alpha over beta-functions inside the unit cell. 
!
#include "machine.h"
  use pwcom
  use para
  use cond
implicit none

  integer ::      &
        orbin,    & ! starting orbital         in zin<z<zfin 
        orbfin,   & ! final orbital            in zin<z<zfin
        norbnow,  & ! total number of orbitals in zin<z<zfin
        kin,      & ! first slab               in zin<z<zfin 
        kfin,     & ! last slab                in zin<z<zfin 
        startk,   & ! first slab for a given CPU 
        lastk,    & ! last slab  for a given CPU 
        k, kz, n, lam, ig, lam1, mdim, itt, nbb, iorb, iorb1,   &
        iorbs, iorb1s
  integer :: info
  integer, allocatable :: inslab(:)
  real(kind=DP), parameter :: eps=1.d-8
  real(kind=DP) :: DDOT, zin, zfin, dz, tr, tr1, dz1 
  complex(kind=DP), parameter :: cim=(0.d0,1.d0) 
  complex(kind=DP) :: int1d, int2d, c, d, e, f, s1, s2, s3, s4, arg,&
                      f1p, ZDOTC
  complex(kind=DP), allocatable ::   &
     psigper(:,:), & ! psigper(g,lam)=newbg(g,lam1) psiper(lam1,lam)
     w0(:,:,:),  &   ! w0(z,g,m) are 2D Fourier components (see four.f)
     w(:,:,:),   &   ! w(z,lam,m)=psigper(g,lam)^* \exp{-igr^m_perp} 
                     !                            w0(z,g,m) 
     ci(:,:,:),  &   ! ci(m,lam,k)=\int_{z(k)}^{z(k+1)} dz 
                     !          w(z,lam,m)^*\exp{izk(lam,k)(z-z(k))}
     di(:,:,:),  &   ! di(m,lam,k)=\int_{z(k)}^{z(k+1)} dz
                     !          w(z,lam,m)^*\exp{izk(lam,k)(z(k+1)-z)}   
     bf(:,:), an(:,:), bn(:,:),        & 
     app(:,:), bpp(:,:), al(:,:),      & 
     bl(:,:), af(:,:),                 &
     bnlf(:,:), anln(:,:), bnln(:,:),  &
     anlp(:,:), bnlp(:,:), anll(:,:),  &
     ff(:,:), fl(:,:)                
                               
  norbnow = orbfin - orbin + 1
  orbin = orbin - 1
!
! Find first and last slab (kin, kfin)
!
  do k=1, nrz
    if (z(k).le.zin+eps)  kin=k
    if (z(k).le.zfin-eps) kfin=k
  enddo
  dz=z(kin+1)-z(kin) 
  dz1=dz/nz1
!
! Divide the slabs among CPU
!
  call divide(kfin-kin+1,startk,lastk)
  startk=kin+startk-1
  lastk=kin+lastk-1

!------------------------
! Start of 2D Fourier components calculations and depending
! variables
!
  allocate( psigper( ngper, n2d ) )
  allocate( w( nz1, n2d, norbnow ) )
  allocate( w0( nz1, ngper, 5 ) )
  allocate( ci( norbnow, n2d, nrzp ) )
  allocate( di( norbnow, n2d, nrzp ) )     
  allocate( inslab( norbnow ) )
  intw1=(0.d0,0.d0)
  intw2=(0.d0,0.d0)
!
! some orbitals relations
!                    
  do iorb=1, norbnow
    inslab(iorb)=0
  enddo    
  do iorb=1, norbnow
    iorbs=orbin+iorb 
    if(inslab(iorb).eq.0.and.mnew(iorbs).eq.1) then
      itt=itnew(iorbs)
      nbb=nbnew(iorbs)
      do iorb1=iorb, norbnow
       iorb1s=orbin+iorb1
       if(mnew(iorb1s).eq.1.and.nbnew(iorb1s).eq.nbb) then
         tr=abs(taunew(3,iorbs)-taunew(3,iorb1s))
         if(itnew(iorb1s).eq.itt.and.tr.le.eps) then
           inslab(iorb1)=iorb
         endif
       endif
      enddo
    endif
  enddo 
!
! The loop over slabs to compute ci, di, and initial intw2
!
  do k=startk, lastk

    c=(1.d0,0.d0)
    d=(0.d0,0.d0)  
    call ZGEMM('n', 'n', ngper, n2d, n2d, c, newbg, ngper,  &
               psiper(1,1,nkofz(k)), n2d, d, psigper, ngper)
    w=(0.d0,0.d0)
    do iorb=1, norbnow
      iorbs=orbin+iorb
      if(cross(iorbs,k).eq.1.and.inslab(iorb).eq.iorb) then  
       mdim=2*ls(iorbs)+1
       call four(iorbs, w0, k, dz)
       do iorb1=1, norbnow
        iorb1s=orbin+iorb1
        if(inslab(iorb1).eq.iorb) then
         do ig=1, ngper
          tr=-tpi*DDOT(2,gper(1,ig),1,taunew(1,iorb1s),1)
          c=cmplx(cos(tr),sin(tr))
          do lam=1, n2d
           d=CONJG(psigper(ig,lam))*c
           do n=1, mdim
            do kz=1, nz1
             w(kz,lam,iorb1-1+n)=w(kz,lam,iorb1-1+n)+d*w0(kz,ig,n)
            enddo
           enddo
          enddo
         enddo                
        endif
       enddo
      endif 
    enddo
    do iorb=1, norbnow
     iorbs = orbin + iorb
     if (cross(iorbs,k).eq.1) then   
        do lam=1, n2d
           ci(iorb,lam,nkofz(k))=int1d(w(1,lam,iorb),   &
                        zk(lam,nkofz(k)),dz,dz1,nz1,tpiba,1)
           di(iorb,lam,nkofz(k))=int1d(w(1,lam,iorb),   &
                        zk(lam,nkofz(k)),dz,dz1,nz1,tpiba,-1)
        enddo                                                        
        do iorb1=1, norbnow
           iorb1s = orbin + iorb1
           if (cross(iorb1s,k).eq.1) then
             do lam=1, n2d
                intw2(iorb,iorb1)=intw2(iorb,iorb1)-       &
                   cim*int2d(w(1,lam,iorb),w(1,lam,iorb1), & 
                         zk(lam,nkofz(k)),dz1,nz1,tpiba)/  &
                       (2.d0*zk(lam,nkofz(k))*tpiba) 
             enddo
           endif 
        enddo
     endif
    enddo      
  enddo 

  deallocate(psigper)
  deallocate(w)
  deallocate(w0)
  deallocate(inslab)

!-----------------------------------

!
! Some allocation for iterative process
!
  allocate( bf( n2d, n2d ) )
  allocate( an( n2d, n2d ) )
  allocate( bn( n2d, n2d ) )
  allocate( app( n2d, n2d ) )
  allocate( bpp( n2d ,n2d ) )
  allocate( al( n2d, n2d ) )
  allocate( bl( n2d, n2d ) )
  allocate( af( n2d, n2d ) )
  allocate( bnlf( n2d, norbnow ) )
  allocate( anln( n2d, norbnow ) )
  allocate( bnln( n2d, norbnow ) )
  allocate( anlp( n2d, norbnow ) )
  allocate( bnlp( n2d, norbnow ) )
  allocate( anll( n2d, norbnow ) )
  allocate( ff( n2d, norbnow ) )
  allocate( fl( n2d, norbnow ) )

!
!    We set up the starting values
!                                       
  app=(0.d0,0.d0)
  an=(0.d0,0.d0)
  bpp=(0.d0,0.d0)
  bn=(0.d0,0.d0)
  bf=(0.d0,0.d0)
  anlp=(0.d0,0.d0)
  anln=(0.d0,0.d0)
  bnlp=(0.d0,0.d0)
  bnln=(0.d0,0.d0)
  bnlf=(0.d0,0.d0)
  ff=(0.d0,0.d0)
  fl=(0.d0,0.d0)

  do lam=1, n2d
    bf(lam,lam)=(1.d0,0.d0)
    bpp(lam,lam)=(1.d0,0.d0)
  enddo                                               
!
! To compute intw1, ff, fl for the first slab
!
  kz=nkofz(startk)
  do iorb=1, norbnow
    iorbs = orbin + iorb
    if (cross(iorbs, startk).eq.1) then
       do lam=1, n2d
          intw1(iorb,lam)=di(iorb, lam, kz)
          arg=tpi*zk(lam, kz)*dz
          if (abs(DIMAG(zk(lam, kz))).lt.eps) then
           ff(lam,iorb)=-cim*EXP(cim*arg)*CONJG(di(iorb,lam,kz))/ &
                             (2.d0*zk(lam,kz)*tpiba) 
           fl(lam,iorb)=-cim*EXP(cim*arg)*CONJG(ci(iorb,lam,kz))/ &
                             (2.d0*zk(lam,kz)*tpiba)
          else
           ff(lam,iorb)=-cim*CONJG(ci(iorb,lam,kz))/              &
                             (2.d0*zk(lam,kz)*tpiba)
           fl(lam,iorb)=-cim*CONJG(di(iorb,lam,kz))/              &
                             (2.d0*zk(lam,kz)*tpiba)
          endif
       enddo
    endif
  enddo

!------------------------------------
! The main loop over slabs 
!
  do k=startk+1, lastk
    kz=nkofz(k) 
    do lam=1, n2d
       do lam1=1,n2d
          c=ZDOTC(n2d,psiper(1,lam,kz),1,psiper(1,lam1,kz-1),1)
          s1=(zk(lam,kz)+zk(lam1,kz-1))/zk(lam,kz)*c
          s2=(zk(lam,kz)-zk(lam1,kz-1))/zk(lam,kz)*c
          c=EXP(tpi*cim*zk(lam1,kz-1)*dz)
          s3=s1*c
          s4=s2*c
          do n=1, n2d
             an(lam,n)= an(lam,n)+s3*app(lam1,n)
             bn(lam,n)= bn(lam,n)+s4*app(lam1,n)   
          enddo
          an(lam,lam1)= an(lam,lam1)+s2
          bn(lam,lam1)= bn(lam,lam1)+s1
          do iorb=1, norbnow
            iorbs = orbin + iorb
            tr=taunew(3,iorbs)-rsph(nbnew(iorbs),itnew(iorbs))
            if (z(k)+dz.gt.tr) then
               anln(lam,iorb)=anln(lam,iorb)+s3*anlp(lam1,iorb)+ &
                       s1*fl(lam1,iorb)      
               bnln(lam,iorb)=bnln(lam,iorb)+s4*anlp(lam1,iorb)+ &
                       s2*fl(lam1,iorb)      
            endif
          enddo
       enddo 
       do n=1, n2d
          an(lam,n)=an(lam,n)*0.5d0
          bn(lam,n)=bn(lam,n)*0.5d0*EXP(-tpi*cim*zk(lam,kz)*dz)
       enddo
       do iorb=1, norbnow
          iorbs = orbin + iorb
          tr=taunew(3,iorbs)-rsph(nbnew(iorbs),itnew(iorbs))
          if (z(k)+dz.gt.tr) then 
             anln(lam,iorb)=anln(lam,iorb)*0.5d0
             bnln(lam,iorb)=bnln(lam,iorb)*0.5d0                &
                                    *EXP(-tpi*cim*zk(lam,kz)*dz)
          endif
       enddo
    enddo
    call DCOPY(2*n2d*n2d, an, 1, app, 1)
    call DCOPY(2*n2d*n2d, bn, 1, bpp, 1)
    an=(0.d0,0.d0)
    bn=(0.d0,0.d0)
    call DCOPY(2*norbnow*n2d, anln, 1, anlp, 1)
    call DCOPY(2*norbnow*n2d, bnln, 1, bnlp, 1)
    anln=(0.d0,0.d0)
    bnln=(0.d0,0.d0)
    fl=(0.d0,0.d0)
!
    do iorb=1, norbnow
       iorbs = orbin + iorb 
       if(cross(iorbs, k).eq.1) then
          do lam=1, n2d
             arg=tpi*zk(lam,kz)*dz
             do n=1, n2d   
              intw1(iorb,n)=intw1(iorb,n)+app(lam,n)*ci(iorb,lam,kz)+ &
                                    bpp(lam,n)*di(iorb,lam,kz)       
             enddo
             if (abs(DIMAG(zk(lam,kz))).lt.eps) then
              f1p=-cim*EXP(cim*arg)*CONJG(di(iorb,lam,kz))/        &
                          (2.d0*zk(lam,kz)*tpiba) 
              fl(lam,iorb)=-cim*EXP(cim*arg)*CONJG(ci(iorb,lam,kz))/ &
                          (2.d0*zk(lam,kz)*tpiba) 
             else
              f1p=-cim*CONJG(ci(iorb,lam,kz))/(2.d0*zk(lam,kz)*tpiba)
              fl(lam,iorb)=-cim*CONJG(di(iorb,lam,kz))/              &
                                      (2.d0*zk(lam,kz)*tpiba) 
             endif
             bnlp(lam,iorb)=bnlp(lam,iorb)-f1p*EXP(-cim*arg)
          enddo
       endif   
    enddo
    do iorb=1, norbnow
     iorbs = orbin + iorb
     if(cross(iorbs, k).eq.1) then 
          do iorb1=1, norbnow
             iorb1s = orbin + iorb1
             tr=taunew(3,iorb1s)-rsph(nbnew(iorb1s),itnew(iorb1s))
             if (z(k)+dz.gt.tr) then 
               c=(0.d0, 0.d0)
               do lam=1, n2d
                  c=c+anlp(lam,iorb1)*ci(iorb,lam,kz)+              &
                      bnlp(lam,iorb1)*di(iorb,lam,kz)   
               enddo
               intw2(iorb,iorb1)=intw2(iorb,iorb1)+c
             endif
          enddo
       endif
    enddo
!
! Rotation of linear solutions
!
    call rotatef(app, bpp, bf, anlp, bnlp, bnlf, intw1, intw2,     &
                 n2d, norbf, norbnow)
  enddo
!---------------------------------------------

  call DCOPY(2*n2d*n2d, app, 1, al, 1)
!
! To compute the 2nd half of linear solutions
!
  call scatter_back(app, bpp, an, bn, af, ci, di, startk, lastk, &
                    norbnow, orbin, dz)

  call DCOPY(2*n2d*n2d, bpp, 1, bl, 1)
  call DCOPY(2*n2d*norbnow, anlp, 1, anll, 1)
  call DSCAL(2*norbf*2*n2d, sarea, intw1, 1)
  call DSCAL(2*norbf*norbf, sarea, intw2, 1)

!
! To construct functions and derivetives on the boundaries
!
! local solutions 
  fun0=(0.d0,0.d0)
  fun1=(0.d0,0.d0)
  fund0=(0.d0,0.d0)
  fund1=(0.d0,0.d0)
  k=nkofz(startk)
  kz=nkofz(lastk)
  do n=1, n2d
    do lam=1, n2d
      s1=bf(lam,n)*EXP(cim*tpi*zk(lam,k)*dz)
      s2=al(lam,n)*EXP(cim*tpi*zk(lam,kz)*dz)
      if (lam.eq.n) s2=s2+(1.d0,0.d0)
      s3=-cim*zk(lam,k)*s1*tpiba
      s4=cim*zk(lam,kz)*s2*tpiba
      if (lam.eq.n) s4=s4-2.d0*cim*zk(lam,kz)*tpiba
      c=bl(lam,n)*EXP(cim*tpi*zk(lam,k)*dz)
      if (lam.eq.n) c=c+(1.d0,0.d0)
      d=af(lam,n)*EXP(cim*tpi*zk(lam,kz)*dz)
      e=-cim*zk(lam,k)*c*tpiba
      if (lam.eq.n) e=e+2.d0*cim*zk(lam,k)*tpiba
      f=cim*zk(lam,kz)*d*tpiba
      do ig=1, n2d
        fun0(ig,n)=fun0(ig,n)+psiper(ig,lam,k)*s1
        fun1(ig,n)=fun1(ig,n)+psiper(ig,lam,kz)*s2
        fund0(ig,n)=fund0(ig,n)+psiper(ig,lam,k)*s3
        fund1(ig,n)=fund1(ig,n)+psiper(ig,lam,kz)*s4
        fun0(ig,n+n2d)=fun0(ig,n+n2d)+psiper(ig,lam,k)*c
        fun1(ig,n+n2d)=fun1(ig,n+n2d)+psiper(ig,lam,kz)*d
        fund0(ig,n+n2d)=fund0(ig,n+n2d)+psiper(ig,lam,k)*e
        fund1(ig,n+n2d)=fund1(ig,n+n2d)+psiper(ig,lam,kz)*f
       enddo
     enddo
  enddo                                                               
! nonlocal solutions
  funl0=(0.d0,0.d0)
  funl1=(0.d0,0.d0)
  fundl0=(0.d0,0.d0)
  fundl1=(0.d0,0.d0)
  do iorb=1, norbnow
    do lam=1, n2d
      s1=ff(lam,iorb)+bnlf(lam,iorb)*                   &
                            exp(cim*tpi*zk(lam,k)*dz)
      s2=fl(lam,iorb)+anll(lam,iorb)*                   &
                            exp(cim*tpi*zk(lam,kz)*dz)
      s3=-cim*zk(lam,k)*s1*tpiba
      s4=cim*zk(lam,kz)*s2*tpiba
      do ig=1, n2d
       funl0(ig,iorb)=funl0(ig,iorb)+psiper(ig,lam,k)*s1
       funl1(ig,iorb)=funl1(ig,iorb)+psiper(ig,lam,kz)*s2
       fundl0(ig,iorb)=fundl0(ig,iorb)+psiper(ig,lam,k)*s3
       fundl1(ig,iorb)=fundl1(ig,iorb)+psiper(ig,lam,kz)*s4
      enddo
    enddo
  enddo               

  deallocate(ci)
  deallocate(di)   
  deallocate(bf)
  deallocate(an)
  deallocate(bn)
  deallocate(app)
  deallocate(bpp)
  deallocate(al)
  deallocate(bl)
  deallocate(af)
  deallocate(bnlf)
  deallocate(anln)
  deallocate(bnln)
  deallocate(anlp)
  deallocate(bnlp)
  deallocate(anll)
  deallocate(ff)
  deallocate(fl)

!
! To construct the functions in the whole rigion zin<z<zfin in the
! case of multiparallel running
!
#ifdef __PARA
  call rotproc(fun0, fund0, fun1, fund1, funl0, fundl0, funl1, &
               fundl1, intw1, intw2, n2d, norbf, norbnow)                    
#endif       

  return
end subroutine scatter_forw
Program for complex bands and conductance calculation. git-svn-id: http://qeforge.qe-forge.org/svn/q-e/trunk/espresso@319 c92efa57-630b-4861-b058-cf58834340f0 2003-09-24 18:03:55 +08:00			`!`
			`! Copyright (C) 2003 A. Smogunov`
			`! This file is distributed under the terms of the`
			! GNU General Public License. See the file `License'
			`! in the root directory of the present distribution,`
			`! or http://www.gnu.org/copyleft/gpl.txt .`
			`!`
			`subroutine scatter_forw(zin, zfin, orbin, orbfin)`
			`!`
			`! This subroutine computes local Phi_n and partial nonlocal Phi_alpha`
			`! solutions of the Schrodinger equation in the region zin<z<zfin`
			`! on which the general solution may be constructed:`
			`! \sum a_n Phi_n + \sum a_alpha Phi_alpha`
			`! It computes also the integrals (intw1, intw2) of Phi_n and`
			`! Phi_alpha over beta-functions inside the unit cell.`
			`!`
			`#include "machine.h"`
			`use pwcom`
			`use para`
			`use cond`
			`implicit none`

			`integer :: &`
			`orbin, & ! starting orbital in zin<z<zfin`
			`orbfin, & ! final orbital in zin<z<zfin`
			`norbnow, & ! total number of orbitals in zin<z<zfin`
			`kin, & ! first slab in zin<z<zfin`
			`kfin, & ! last slab in zin<z<zfin`
			`startk, & ! first slab for a given CPU`
			`lastk, & ! last slab for a given CPU`
			`k, kz, n, lam, ig, lam1, mdim, itt, nbb, iorb, iorb1, &`
			`iorbs, iorb1s`
			`integer :: info`
			`integer, allocatable :: inslab(:)`
			`real(kind=DP), parameter :: eps=1.d-8`
			`real(kind=DP) :: DDOT, zin, zfin, dz, tr, tr1, dz1`
			`complex(kind=DP), parameter :: cim=(0.d0,1.d0)`
			`complex(kind=DP) :: int1d, int2d, c, d, e, f, s1, s2, s3, s4, arg,&`
			`f1p, ZDOTC`
			`complex(kind=DP), allocatable :: &`
			`psigper(:,:), & ! psigper(g,lam)=newbg(g,lam1) psiper(lam1,lam)`
			`w0(:,:,:), & ! w0(z,g,m) are 2D Fourier components (see four.f)`
			`w(:,:,:), & ! w(z,lam,m)=psigper(g,lam)^* \exp{-igr^m_perp}`
			`! w0(z,g,m)`
			`ci(:,:,:), & ! ci(m,lam,k)=\int_{z(k)}^{z(k+1)} dz`
			`! w(z,lam,m)^*\exp{izk(lam,k)(z-z(k))}`
			`di(:,:,:), & ! di(m,lam,k)=\int_{z(k)}^{z(k+1)} dz`
			`! w(z,lam,m)^*\exp{izk(lam,k)(z(k+1)-z)}`
			`bf(:,:), an(:,:), bn(:,:), &`
			`app(:,:), bpp(:,:), al(:,:), &`
			`bl(:,:), af(:,:), &`
			`bnlf(:,:), anln(:,:), bnln(:,:), &`
			`anlp(:,:), bnlp(:,:), anll(:,:), &`
			`ff(:,:), fl(:,:)`

			`norbnow = orbfin - orbin + 1`
			`orbin = orbin - 1`
			`!`
			`! Find first and last slab (kin, kfin)`
			`!`
			`do k=1, nrz`
			`if (z(k).le.zin+eps) kin=k`
			`if (z(k).le.zfin-eps) kfin=k`
			`enddo`
			`dz=z(kin+1)-z(kin)`
			`dz1=dz/nz1`
			`!`
			`! Divide the slabs among CPU`
			`!`
			`call divide(kfin-kin+1,startk,lastk)`
			`startk=kin+startk-1`
			`lastk=kin+lastk-1`

			`!------------------------`
			`! Start of 2D Fourier components calculations and depending`
			`! variables`
			`!`
			`allocate( psigper( ngper, n2d ) )`
			`allocate( w( nz1, n2d, norbnow ) )`
			`allocate( w0( nz1, ngper, 5 ) )`
			`allocate( ci( norbnow, n2d, nrzp ) )`
			`allocate( di( norbnow, n2d, nrzp ) )`
			`allocate( inslab( norbnow ) )`
			`intw1=(0.d0,0.d0)`
			`intw2=(0.d0,0.d0)`
			`!`
			`! some orbitals relations`
			`!`
			`do iorb=1, norbnow`
			`inslab(iorb)=0`
			`enddo`
			`do iorb=1, norbnow`
			`iorbs=orbin+iorb`
			`if(inslab(iorb).eq.0.and.mnew(iorbs).eq.1) then`
			`itt=itnew(iorbs)`
			`nbb=nbnew(iorbs)`
			`do iorb1=iorb, norbnow`
			`iorb1s=orbin+iorb1`
			`if(mnew(iorb1s).eq.1.and.nbnew(iorb1s).eq.nbb) then`
			`tr=abs(taunew(3,iorbs)-taunew(3,iorb1s))`
			`if(itnew(iorb1s).eq.itt.and.tr.le.eps) then`
			`inslab(iorb1)=iorb`
			`endif`
			`endif`
			`enddo`
			`endif`
			`enddo`
			`!`
			`! The loop over slabs to compute ci, di, and initial intw2`
			`!`
			`do k=startk, lastk`

			`c=(1.d0,0.d0)`
			`d=(0.d0,0.d0)`
			`call ZGEMM('n', 'n', ngper, n2d, n2d, c, newbg, ngper, &`
			`psiper(1,1,nkofz(k)), n2d, d, psigper, ngper)`
			`w=(0.d0,0.d0)`
			`do iorb=1, norbnow`
			`iorbs=orbin+iorb`
			`if(cross(iorbs,k).eq.1.and.inslab(iorb).eq.iorb) then`
			`mdim=2*ls(iorbs)+1`
			`call four(iorbs, w0, k, dz)`
			`do iorb1=1, norbnow`
			`iorb1s=orbin+iorb1`
			`if(inslab(iorb1).eq.iorb) then`
			`do ig=1, ngper`
			`tr=-tpi*DDOT(2,gper(1,ig),1,taunew(1,iorb1s),1)`
			`c=cmplx(cos(tr),sin(tr))`
			`do lam=1, n2d`
			`d=CONJG(psigper(ig,lam))*c`
			`do n=1, mdim`
			`do kz=1, nz1`
			`w(kz,lam,iorb1-1+n)=w(kz,lam,iorb1-1+n)+d*w0(kz,ig,n)`
			`enddo`
			`enddo`
			`enddo`
			`enddo`
			`endif`
			`enddo`
			`endif`
			`enddo`
			`do iorb=1, norbnow`
			`iorbs = orbin + iorb`
			`if (cross(iorbs,k).eq.1) then`
			`do lam=1, n2d`
			`ci(iorb,lam,nkofz(k))=int1d(w(1,lam,iorb), &`
			`zk(lam,nkofz(k)),dz,dz1,nz1,tpiba,1)`
			`di(iorb,lam,nkofz(k))=int1d(w(1,lam,iorb), &`
			`zk(lam,nkofz(k)),dz,dz1,nz1,tpiba,-1)`
			`enddo`
			`do iorb1=1, norbnow`
			`iorb1s = orbin + iorb1`
			`if (cross(iorb1s,k).eq.1) then`
			`do lam=1, n2d`
			`intw2(iorb,iorb1)=intw2(iorb,iorb1)- &`
			`cim*int2d(w(1,lam,iorb),w(1,lam,iorb1), &`
			`zk(lam,nkofz(k)),dz1,nz1,tpiba)/ &`
			`(2.d0zk(lam,nkofz(k))tpiba)`
			`enddo`
			`endif`
			`enddo`
			`endif`
			`enddo`
			`enddo`

			`deallocate(psigper)`
			`deallocate(w)`
			`deallocate(w0)`
			`deallocate(inslab)`

			`!-----------------------------------`

			`!`
			`! Some allocation for iterative process`
			`!`
			`allocate( bf( n2d, n2d ) )`
			`allocate( an( n2d, n2d ) )`
			`allocate( bn( n2d, n2d ) )`
			`allocate( app( n2d, n2d ) )`
			`allocate( bpp( n2d ,n2d ) )`
			`allocate( al( n2d, n2d ) )`
			`allocate( bl( n2d, n2d ) )`
			`allocate( af( n2d, n2d ) )`
			`allocate( bnlf( n2d, norbnow ) )`
			`allocate( anln( n2d, norbnow ) )`
			`allocate( bnln( n2d, norbnow ) )`
			`allocate( anlp( n2d, norbnow ) )`
			`allocate( bnlp( n2d, norbnow ) )`
			`allocate( anll( n2d, norbnow ) )`
			`allocate( ff( n2d, norbnow ) )`
			`allocate( fl( n2d, norbnow ) )`

			`!`
			`! We set up the starting values`
			`!`
			`app=(0.d0,0.d0)`
			`an=(0.d0,0.d0)`
			`bpp=(0.d0,0.d0)`
			`bn=(0.d0,0.d0)`
			`bf=(0.d0,0.d0)`
			`anlp=(0.d0,0.d0)`
			`anln=(0.d0,0.d0)`
			`bnlp=(0.d0,0.d0)`
			`bnln=(0.d0,0.d0)`
			`bnlf=(0.d0,0.d0)`
			`ff=(0.d0,0.d0)`
			`fl=(0.d0,0.d0)`

			`do lam=1, n2d`
			`bf(lam,lam)=(1.d0,0.d0)`
			`bpp(lam,lam)=(1.d0,0.d0)`
			`enddo`
			`!`
			`! To compute intw1, ff, fl for the first slab`
			`!`
			`kz=nkofz(startk)`
			`do iorb=1, norbnow`
			`iorbs = orbin + iorb`
			`if (cross(iorbs, startk).eq.1) then`
			`do lam=1, n2d`
			`intw1(iorb,lam)=di(iorb, lam, kz)`
			`arg=tpizk(lam, kz)dz`
			`if (abs(DIMAG(zk(lam, kz))).lt.eps) then`
			`ff(lam,iorb)=-cimEXP(cimarg)*CONJG(di(iorb,lam,kz))/ &`
			`(2.d0zk(lam,kz)tpiba)`
			`fl(lam,iorb)=-cimEXP(cimarg)*CONJG(ci(iorb,lam,kz))/ &`
			`(2.d0zk(lam,kz)tpiba)`
			`else`
			`ff(lam,iorb)=-cim*CONJG(ci(iorb,lam,kz))/ &`
			`(2.d0zk(lam,kz)tpiba)`
			`fl(lam,iorb)=-cim*CONJG(di(iorb,lam,kz))/ &`
			`(2.d0zk(lam,kz)tpiba)`
			`endif`
			`enddo`
			`endif`
			`enddo`

			`!------------------------------------`
			`! The main loop over slabs`
			`!`
			`do k=startk+1, lastk`
			`kz=nkofz(k)`
			`do lam=1, n2d`
			`do lam1=1,n2d`
			`c=ZDOTC(n2d,psiper(1,lam,kz),1,psiper(1,lam1,kz-1),1)`
			`s1=(zk(lam,kz)+zk(lam1,kz-1))/zk(lam,kz)*c`
			`s2=(zk(lam,kz)-zk(lam1,kz-1))/zk(lam,kz)*c`
			`c=EXP(tpicimzk(lam1,kz-1)*dz)`
			`s3=s1*c`
			`s4=s2*c`
			`do n=1, n2d`
			`an(lam,n)= an(lam,n)+s3*app(lam1,n)`
			`bn(lam,n)= bn(lam,n)+s4*app(lam1,n)`
			`enddo`
			`an(lam,lam1)= an(lam,lam1)+s2`
			`bn(lam,lam1)= bn(lam,lam1)+s1`
			`do iorb=1, norbnow`
			`iorbs = orbin + iorb`
			`tr=taunew(3,iorbs)-rsph(nbnew(iorbs),itnew(iorbs))`
			`if (z(k)+dz.gt.tr) then`
			`anln(lam,iorb)=anln(lam,iorb)+s3*anlp(lam1,iorb)+ &`
			`s1*fl(lam1,iorb)`
			`bnln(lam,iorb)=bnln(lam,iorb)+s4*anlp(lam1,iorb)+ &`
			`s2*fl(lam1,iorb)`
			`endif`
			`enddo`
			`enddo`
			`do n=1, n2d`
			`an(lam,n)=an(lam,n)*0.5d0`
			`bn(lam,n)=bn(lam,n)0.5d0EXP(-tpicimzk(lam,kz)*dz)`
			`enddo`
			`do iorb=1, norbnow`
			`iorbs = orbin + iorb`
			`tr=taunew(3,iorbs)-rsph(nbnew(iorbs),itnew(iorbs))`
			`if (z(k)+dz.gt.tr) then`
			`anln(lam,iorb)=anln(lam,iorb)*0.5d0`
			`bnln(lam,iorb)=bnln(lam,iorb)*0.5d0 &`
			`EXP(-tpicimzk(lam,kz)dz)`
			`endif`
			`enddo`
			`enddo`
			`call DCOPY(2n2dn2d, an, 1, app, 1)`
			`call DCOPY(2n2dn2d, bn, 1, bpp, 1)`
			`an=(0.d0,0.d0)`
			`bn=(0.d0,0.d0)`
			`call DCOPY(2norbnown2d, anln, 1, anlp, 1)`
			`call DCOPY(2norbnown2d, bnln, 1, bnlp, 1)`
			`anln=(0.d0,0.d0)`
			`bnln=(0.d0,0.d0)`
			`fl=(0.d0,0.d0)`
			`!`
			`do iorb=1, norbnow`
			`iorbs = orbin + iorb`
			`if(cross(iorbs, k).eq.1) then`
			`do lam=1, n2d`
			`arg=tpizk(lam,kz)dz`
			`do n=1, n2d`
			`intw1(iorb,n)=intw1(iorb,n)+app(lam,n)*ci(iorb,lam,kz)+ &`
			`bpp(lam,n)*di(iorb,lam,kz)`
			`enddo`
			`if (abs(DIMAG(zk(lam,kz))).lt.eps) then`
			`f1p=-cimEXP(cimarg)*CONJG(di(iorb,lam,kz))/ &`
			`(2.d0zk(lam,kz)tpiba)`
			`fl(lam,iorb)=-cimEXP(cimarg)*CONJG(ci(iorb,lam,kz))/ &`
			`(2.d0zk(lam,kz)tpiba)`
			`else`
			`f1p=-cimCONJG(ci(iorb,lam,kz))/(2.d0zk(lam,kz)*tpiba)`
			`fl(lam,iorb)=-cim*CONJG(di(iorb,lam,kz))/ &`
			`(2.d0zk(lam,kz)tpiba)`
			`endif`
			`bnlp(lam,iorb)=bnlp(lam,iorb)-f1pEXP(-cimarg)`
			`enddo`
			`endif`
			`enddo`
			`do iorb=1, norbnow`
			`iorbs = orbin + iorb`
			`if(cross(iorbs, k).eq.1) then`
			`do iorb1=1, norbnow`
			`iorb1s = orbin + iorb1`
			`tr=taunew(3,iorb1s)-rsph(nbnew(iorb1s),itnew(iorb1s))`
			`if (z(k)+dz.gt.tr) then`
			`c=(0.d0, 0.d0)`
			`do lam=1, n2d`
			`c=c+anlp(lam,iorb1)*ci(iorb,lam,kz)+ &`
			`bnlp(lam,iorb1)*di(iorb,lam,kz)`
			`enddo`
			`intw2(iorb,iorb1)=intw2(iorb,iorb1)+c`
			`endif`
			`enddo`
			`endif`
			`enddo`
			`!`
			`! Rotation of linear solutions`
			`!`
			`call rotatef(app, bpp, bf, anlp, bnlp, bnlf, intw1, intw2, &`
			`n2d, norbf, norbnow)`
			`enddo`
			`!---------------------------------------------`

			`call DCOPY(2n2dn2d, app, 1, al, 1)`
			`!`
			`! To compute the 2nd half of linear solutions`
			`!`
			`call scatter_back(app, bpp, an, bn, af, ci, di, startk, lastk, &`
			`norbnow, orbin, dz)`

			`call DCOPY(2n2dn2d, bpp, 1, bl, 1)`
			`call DCOPY(2n2dnorbnow, anlp, 1, anll, 1)`
			`call DSCAL(2norbf2*n2d, sarea, intw1, 1)`
			`call DSCAL(2norbfnorbf, sarea, intw2, 1)`

			`!`
			`! To construct functions and derivetives on the boundaries`
			`!`
			`! local solutions`
			`fun0=(0.d0,0.d0)`
			`fun1=(0.d0,0.d0)`
			`fund0=(0.d0,0.d0)`
			`fund1=(0.d0,0.d0)`
			`k=nkofz(startk)`
			`kz=nkofz(lastk)`
			`do n=1, n2d`
			`do lam=1, n2d`
			`s1=bf(lam,n)EXP(cimtpizk(lam,k)dz)`
			`s2=al(lam,n)EXP(cimtpizk(lam,kz)dz)`
			`if (lam.eq.n) s2=s2+(1.d0,0.d0)`
			`s3=-cimzk(lam,k)s1*tpiba`
			`s4=cimzk(lam,kz)s2*tpiba`
			`if (lam.eq.n) s4=s4-2.d0cimzk(lam,kz)*tpiba`
			`c=bl(lam,n)EXP(cimtpizk(lam,k)dz)`
			`if (lam.eq.n) c=c+(1.d0,0.d0)`
			`d=af(lam,n)EXP(cimtpizk(lam,kz)dz)`
			`e=-cimzk(lam,k)c*tpiba`
			`if (lam.eq.n) e=e+2.d0cimzk(lam,k)*tpiba`
			`f=cimzk(lam,kz)d*tpiba`
			`do ig=1, n2d`
			`fun0(ig,n)=fun0(ig,n)+psiper(ig,lam,k)*s1`
			`fun1(ig,n)=fun1(ig,n)+psiper(ig,lam,kz)*s2`
			`fund0(ig,n)=fund0(ig,n)+psiper(ig,lam,k)*s3`
			`fund1(ig,n)=fund1(ig,n)+psiper(ig,lam,kz)*s4`
			`fun0(ig,n+n2d)=fun0(ig,n+n2d)+psiper(ig,lam,k)*c`
			`fun1(ig,n+n2d)=fun1(ig,n+n2d)+psiper(ig,lam,kz)*d`
			`fund0(ig,n+n2d)=fund0(ig,n+n2d)+psiper(ig,lam,k)*e`
			`fund1(ig,n+n2d)=fund1(ig,n+n2d)+psiper(ig,lam,kz)*f`
			`enddo`
			`enddo`
			`enddo`
			`! nonlocal solutions`
			`funl0=(0.d0,0.d0)`
			`funl1=(0.d0,0.d0)`
			`fundl0=(0.d0,0.d0)`
			`fundl1=(0.d0,0.d0)`
			`do iorb=1, norbnow`
			`do lam=1, n2d`
			`s1=ff(lam,iorb)+bnlf(lam,iorb)* &`
			`exp(cimtpizk(lam,k)*dz)`
			`s2=fl(lam,iorb)+anll(lam,iorb)* &`
			`exp(cimtpizk(lam,kz)*dz)`
			`s3=-cimzk(lam,k)s1*tpiba`
			`s4=cimzk(lam,kz)s2*tpiba`
			`do ig=1, n2d`
			`funl0(ig,iorb)=funl0(ig,iorb)+psiper(ig,lam,k)*s1`
			`funl1(ig,iorb)=funl1(ig,iorb)+psiper(ig,lam,kz)*s2`
			`fundl0(ig,iorb)=fundl0(ig,iorb)+psiper(ig,lam,k)*s3`
			`fundl1(ig,iorb)=fundl1(ig,iorb)+psiper(ig,lam,kz)*s4`
			`enddo`
			`enddo`
			`enddo`

			`deallocate(ci)`
			`deallocate(di)`
			`deallocate(bf)`
			`deallocate(an)`
			`deallocate(bn)`
			`deallocate(app)`
			`deallocate(bpp)`
			`deallocate(al)`
			`deallocate(bl)`
			`deallocate(af)`
			`deallocate(bnlf)`
			`deallocate(anln)`
			`deallocate(bnln)`
			`deallocate(anlp)`
			`deallocate(bnlp)`
			`deallocate(anll)`
			`deallocate(ff)`
			`deallocate(fl)`

			`!`
			`! To construct the functions in the whole rigion zin<z<zfin in the`
			`! case of multiparallel running`
			`!`
			`#ifdef __PARA`
			`call rotproc(fun0, fund0, fun1, fund1, funl0, fundl0, funl1, &`
			`fundl1, intw1, intw2, n2d, norbf, norbnow)`
			`#endif`

			`return`
			`end subroutine scatter_forw`