atom-predict/egnn_v2/test_pl_v2.py

import os
import json
import glob
import torch
import random
torch.set_float32_matmul_precision('high')

import numpy as np
from torch import nn
from torch.utils.data.sampler import *
from torch.optim.lr_scheduler import ReduceLROnPlateau
from pytorch_lightning.loggers import TensorBoardLogger
from pytorch_lightning.callbacks import ModelCheckpoint
from pytorch_lightning.callbacks.early_stopping import EarlyStopping
import pytorch_lightning as pl

from egnn_core.model import PL_EGNN
from egnn_core.data import *
from egnn_core.metrics import *
from egnn_core.aug import *
from torch_geometric.data.lightning import LightningDataset
from torch.utils.data import ConcatDataset
from egnn_utils.save import save_results

# constants

DATASETS = '0'
GPUS = 1
BS = 32
NW = 1
WD = 5e-4
LR = 0.01
RF = 0.9
EPOCHS = 1000
IN_CHANNELS = 3
SAVE_TOP_K = 5
EARLY_STOP = 5
EVERY_N_EPOCHES = 2
# DATA_PATH = '../../data/linesv/gnn_data/'
# DATA_PATH = '/home/gao/mouclear/cc/data/all_sv_e2e/v2/atom'
DATA_PATH = '/home/gao/mouclear/cc/final_todo/point_withoutlabel'
# /home/gao/mouclear/cc/data/linesv/gnn_data

# DATA_PATH2 = '/home/gao/下载/new/'


# pytorch lightning module

class PLModel(pl.LightningModule):
    def __init__(self):
        super().__init__()
        self.model = PL_EGNN()
        self.loss = nn.CrossEntropyLoss(torch.FloatTensor([1., 2., 2.]))

    def forward(self, x):
        out = self.model(x.x, x.edge_index, x.batch)
        return out

    def configure_optimizers(self):
        optimizer = torch.optim.AdamW(self.parameters(), lr=LR, weight_decay=WD)
        scheduler = ReduceLROnPlateau(optimizer, factor=RF, mode='max', patience=2, min_lr=0, verbose=True)
        return {
           'optimizer': optimizer,
           'lr_scheduler': scheduler,
           'monitor': 'val_acc'
        }

    def training_step(self, train_batch, batch_idx):
        pos, light, y, edge_index, batch, mask = (
            train_batch.pos,
            train_batch.light,
            train_batch.label,
            train_batch.edge_index,
            train_batch.batch,
            train_batch.mask,
        )
        
        pd = self.model(light, pos, edge_index)
        loss = self.loss(pd[mask], y[mask])
        train_acc = acc(pd[mask], y[mask])
        self.log('train_loss', loss, batch_size=1)
        self.log('train_acc', train_acc, on_epoch=True, prog_bar=True, logger=True, batch_size=1)
        
        return loss

    def validation_step(self, val_batch, batch_idx):        
        pos, light, y, edge_index, batch, mask = (
            val_batch.pos,
            val_batch.light,
            val_batch.label,
            val_batch.edge_index,
            val_batch.batch,
            val_batch.mask,
        )
        
        pd = self.model(light, pos, edge_index)
        loss = self.loss(pd[mask], y[mask])
        val_acc = acc(pd[mask], y[mask])
        self.log('val_loss', loss, batch_size=1)
        self.log('val_acc', val_acc, on_epoch=True, prog_bar=True, logger=True, batch_size=1)
        

    def predict_step(self, batch, batch_idx):
        pos, light, y, edge_index, batch, mask, name = (
            batch.pos,
            batch.light,
            batch.label,
            batch.edge_index,
            batch.batch,
            batch.mask,
            batch.name
        )   
        
        pd = self.model(light, pos, edge_index)
        return pd[mask], y[mask], name

# main

if __name__ == '__main__':
    train_dataset = AtomDataset_v2(root='{}/'.format(DATA_PATH))
    valid_dataset = AtomDataset_v2(root='{}/'.format(DATA_PATH))
    test_dataset = AtomDataset_v2(root='{}/'.format(DATA_PATH))
    e2e_dataset = AtomDataset_v2(root='{}/'.format(DATA_PATH))

    datamodule = LightningDataset(
        train_dataset,
        valid_dataset,
        test_dataset,
        e2e_dataset,
        batch_size=BS,
        num_workers=NW,
    )

    model = PLModel()

    logger = TensorBoardLogger(
        name = DATASETS,
        save_dir = 'logs',
    )

    checkpoint_callback = ModelCheckpoint(
        every_n_epochs = EVERY_N_EPOCHES,
        save_top_k = SAVE_TOP_K,
        monitor = 'val_acc',
        mode = 'max',
        save_last = True,
        filename = '{epoch}-{val_loss:.2f}-{val_acc:.2f}'
    )

    earlystop_callback = EarlyStopping(
        monitor = "val_acc", 
        mode = "max",
        min_delta = 0.00, 
        patience = EARLY_STOP,
    )

    # training
    trainer = pl.Trainer(
        log_every_n_steps=1,
        devices = GPUS,
        max_epochs = EPOCHS,
        logger = logger,
        callbacks = [earlystop_callback, checkpoint_callback],
    )

    # trainer.fit(
    #     model,
    #     datamodule,
    # )
    #

    # inference test
    # predictions = trainer.predict(
    #     model,
    #     datamodule.test_dataset,
    #     ckpt_path = 'best',
    # )
    # save_results(trainer.log_dir, predictions, 'test')
    
    # inference e2e
    predictions = trainer.predict(
        model, 
        datamodule.pred_dataset,
        ckpt_path = '/home/gao/mouclear/cc/code_v2/egnn/logs/0/version_0/checkpoints/last.ckpt',
    )

    save_results(trainer.log_dir, predictions, 'test-on-e2e')
gnn模型代码init 2024-07-22 08:48:33 +08:00			`import os`
			`import json`
			`import glob`
			`import torch`
			`import random`
			`torch.set_float32_matmul_precision('high')`

			`import numpy as np`
			`from torch import nn`
			`from torch.utils.data.sampler import *`
			`from torch.optim.lr_scheduler import ReduceLROnPlateau`
			`from pytorch_lightning.loggers import TensorBoardLogger`
			`from pytorch_lightning.callbacks import ModelCheckpoint`
			`from pytorch_lightning.callbacks.early_stopping import EarlyStopping`
			`import pytorch_lightning as pl`

gnn模型预测 2024-07-23 13:42:42 +08:00			`from egnn_core.model import PL_EGNN`
			`from egnn_core.data import *`
			`from egnn_core.metrics import *`
			`from egnn_core.aug import *`
gnn模型代码init 2024-07-22 08:48:33 +08:00			`from torch_geometric.data.lightning import LightningDataset`
			`from torch.utils.data import ConcatDataset`
gnn模型预测 2024-07-23 13:42:42 +08:00			`from egnn_utils.save import save_results`
gnn模型代码init 2024-07-22 08:48:33 +08:00
			`# constants`

			`DATASETS = '0'`
			`GPUS = 1`
			`BS = 32`
			`NW = 1`
			`WD = 5e-4`
			`LR = 0.01`
			`RF = 0.9`
			`EPOCHS = 1000`
			`IN_CHANNELS = 3`
			`SAVE_TOP_K = 5`
			`EARLY_STOP = 5`
			`EVERY_N_EPOCHES = 2`
			`# DATA_PATH = '../../data/linesv/gnn_data/'`
			`# DATA_PATH = '/home/gao/mouclear/cc/data/all_sv_e2e/v2/atom'`
			`DATA_PATH = '/home/gao/mouclear/cc/final_todo/point_withoutlabel'`
			`# /home/gao/mouclear/cc/data/linesv/gnn_data`

			`# DATA_PATH2 = '/home/gao/下载/new/'`




			`# pytorch lightning module`

			`class PLModel(pl.LightningModule):`
			`def __init__(self):`
			`super().__init__()`
			`self.model = PL_EGNN()`
			`self.loss = nn.CrossEntropyLoss(torch.FloatTensor([1., 2., 2.]))`

			`def forward(self, x):`
			`out = self.model(x.x, x.edge_index, x.batch)`
			`return out`

			`def configure_optimizers(self):`
			`optimizer = torch.optim.AdamW(self.parameters(), lr=LR, weight_decay=WD)`
			`scheduler = ReduceLROnPlateau(optimizer, factor=RF, mode='max', patience=2, min_lr=0, verbose=True)`
			`return {`
			`'optimizer': optimizer,`
			`'lr_scheduler': scheduler,`
			`'monitor': 'val_acc'`
			`}`

			`def training_step(self, train_batch, batch_idx):`
			`pos, light, y, edge_index, batch, mask = (`
			`train_batch.pos,`
			`train_batch.light,`
			`train_batch.label,`
			`train_batch.edge_index,`
			`train_batch.batch,`
			`train_batch.mask,`
			`)`

			`pd = self.model(light, pos, edge_index)`
			`loss = self.loss(pd[mask], y[mask])`
			`train_acc = acc(pd[mask], y[mask])`
			`self.log('train_loss', loss, batch_size=1)`
			`self.log('train_acc', train_acc, on_epoch=True, prog_bar=True, logger=True, batch_size=1)`

			`return loss`

			`def validation_step(self, val_batch, batch_idx):`
			`pos, light, y, edge_index, batch, mask = (`
			`val_batch.pos,`
			`val_batch.light,`
			`val_batch.label,`
			`val_batch.edge_index,`
			`val_batch.batch,`
			`val_batch.mask,`
			`)`

			`pd = self.model(light, pos, edge_index)`
			`loss = self.loss(pd[mask], y[mask])`
			`val_acc = acc(pd[mask], y[mask])`
			`self.log('val_loss', loss, batch_size=1)`
			`self.log('val_acc', val_acc, on_epoch=True, prog_bar=True, logger=True, batch_size=1)`


			`def predict_step(self, batch, batch_idx):`
			`pos, light, y, edge_index, batch, mask, name = (`
			`batch.pos,`
			`batch.light,`
			`batch.label,`
			`batch.edge_index,`
			`batch.batch,`
			`batch.mask,`
			`batch.name`
			`)`

			`pd = self.model(light, pos, edge_index)`
			`return pd[mask], y[mask], name`

			`# main`

			`if __name__ == '__main__':`
			`train_dataset = AtomDataset_v2(root='{}/'.format(DATA_PATH))`
			`valid_dataset = AtomDataset_v2(root='{}/'.format(DATA_PATH))`
			`test_dataset = AtomDataset_v2(root='{}/'.format(DATA_PATH))`
			`e2e_dataset = AtomDataset_v2(root='{}/'.format(DATA_PATH))`

			`datamodule = LightningDataset(`
			`train_dataset,`
			`valid_dataset,`
			`test_dataset,`
			`e2e_dataset,`
			`batch_size=BS,`
			`num_workers=NW,`
			`)`

			`model = PLModel()`

			`logger = TensorBoardLogger(`
			`name = DATASETS,`
			`save_dir = 'logs',`
			`)`

			`checkpoint_callback = ModelCheckpoint(`
			`every_n_epochs = EVERY_N_EPOCHES,`
			`save_top_k = SAVE_TOP_K,`
			`monitor = 'val_acc',`
			`mode = 'max',`
			`save_last = True,`
			`filename = '{epoch}-{val_loss:.2f}-{val_acc:.2f}'`
			`)`

			`earlystop_callback = EarlyStopping(`
			`monitor = "val_acc",`
			`mode = "max",`
			`min_delta = 0.00,`
			`patience = EARLY_STOP,`
			`)`

			`# training`
			`trainer = pl.Trainer(`
			`log_every_n_steps=1,`
			`devices = GPUS,`
			`max_epochs = EPOCHS,`
			`logger = logger,`
			`callbacks = [earlystop_callback, checkpoint_callback],`
			`)`

			`# trainer.fit(`
			`# model,`
			`# datamodule,`
			`# )`
			`#`

			`# inference test`
			`# predictions = trainer.predict(`
			`# model,`
			`# datamodule.test_dataset,`
			`# ckpt_path = 'best',`
			`# )`
			`# save_results(trainer.log_dir, predictions, 'test')`

			`# inference e2e`
			`predictions = trainer.predict(`
			`model,`
			`datamodule.pred_dataset,`
			`ckpt_path = '/home/gao/mouclear/cc/code_v2/egnn/logs/0/version_0/checkpoints/last.ckpt',`
			`)`

			`save_results(trainer.log_dir, predictions, 'test-on-e2e')`