main_VAE.py

from models import *
import os
import glob
import argparse
from sklearn.preprocessing import StandardScaler
from tqdm import tqdm
from sklearn.model_selection import train_test_split
from upload_data import *
import SimpleITK as sitk
import cv2
import numpy as np
import math
from tools import *

os.environ['CUDA_VISIBLE_DEVICES'] = '0'
#torch.backends.cudnn.enabled = False
#random.shuffle

def _split_output(yt_hat, t, y, y_scaler, x, is_train=False):
    """
        Split output into dictionary for easier use in estimation
        Args:
            yt_hat: Generated prediction
            t: Binary treatment assignments
            y: Treatment outcomes
            y_scaler: Scaled treatment outcomes
            x: Covariates
            index: Index in data

        Returns:
            Dictionary of all needed data
    """

    
    yt_hat = yt_hat.detach().cpu().numpy()
    q_t0 = yt_hat[:, 0].reshape(-1, 1).copy()
    q_t1 = yt_hat[:, 1].reshape(-1, 1).copy()

    g = yt_hat[:, 2].copy()
    treatment_predicted = g.copy()
    treatment_predicted[treatment_predicted>=0.5] = 1
    treatment_predicted[treatment_predicted<0.5] = 0

    y = y.copy()
    var = "average propensity for t: {}".format(g[t.squeeze() == 1.].mean())
    
    q_cat = np.concatenate((q_t0, q_t1),1)

    policy = np.argmax(q_cat,1)
    #policy = np.zeros(q_cat.shape[0])
    
    print(var)
    print("Policy Risk:", policy_risk_multi(t, y, q_t0, q_t1))
    print("Ate_Error:", ate_error_0_1(t, y, q_t0 - q_t1))

    print("Treatment accuracy:", np.sum(treatment_predicted==t.squeeze())/treatment_predicted.shape[0])
    
    if not is_train:
        print("Treatment policy    :",policy)
        print("Treatment prediction:",treatment_predicted)
        print("Treatment label     :",t.squeeze().astype(int))
    
    factual_auc(t, y, q_t0, q_t1)
    factual_acc(t, y, q_t0, q_t1)

    return {'ave propensity for t': g[t.squeeze() == 1.].mean(),
    'Policy Risk': policy_risk_multi(t, y, q_t0, q_t1), 
    'Ate_Error_0_1': ate_error_0_1(t, y, q_t0 - q_t1), 'Treatment accuracy': np.sum(treatment_predicted==t.squeeze())/treatment_predicted.shape[0], 
    'Treatment policy': policy, 'Treatment prediction': treatment_predicted, 'Treatment label': t.squeeze().astype(int)}


def train(train_loader, net, optimizer, criterion, class_ratio,ratio_as_t1):
    """
    Trains network for one epoch in batches.

    Args:
        train_loader: Data loader for training set.
        net: Neural network model.
        optimizer: Optimizer (e.g. SGD).
        criterion: Loss function (e.g. cross-entropy loss).
    """

    avg_loss_0 = 0
    avg_loss_1 = 0

    for i, data in enumerate(train_loader):
        
        # get the inputs; data is a list of [inputs, labels]
        inputs, labels, images = data
        #traumatic = inputs[:,3]
        # zero the parameter gradients
        optimizer.zero_grad()

        # forward + backward + optimize
        y0, y1,  dist_p_0, dist_q_0, dist_p_1, dist_q_1 = net(inputs,labels,images,is_train=True)
        BCE,KLD = criterion(y0, y1,  dist_p_0, dist_q_0, dist_p_1, dist_q_1, labels, class_ratio,ratio_as_t1) 
        loss = BCE + KLD
        #loss = criterion(outputs, labels, traumatic, class_ratio)
        loss.backward()
        optimizer.step()

        # keep track of loss and accuracy
        avg_loss_0 += BCE
        avg_loss_1 += KLD

    return avg_loss_0 / len(train_loader), avg_loss_1 / len(train_loader), loss / len(train_loader)

def test(train_loader, net, criterion, number):
    """
    Trains network for one epoch in batches.

    Args:
        train_loader: Data loader for training set.
        net: Neural network model.
        optimizer: Optimizer (e.g. SGD).
        criterion: Loss function (e.g. cross-entropy loss).
    """
    net.eval()
    avg_loss = 0

    yt_hat_test = torch.from_numpy(np.zeros((number,4)))
    num_ = 0
    with torch.no_grad():
        for i, data in enumerate(train_loader):
            
            # get the inputs; data is a list of [inputs, labels]
            inputs, labels, images = data
            traumatic = inputs[:,3]
            # zero the parameter gradients

            y0, y1 = net(inputs,labels,images)  
            yt_hat_test[num_:num_+y0.shape[0],0] = y0
            yt_hat_test[num_:num_+y0.shape[0],1] = y1
            num_ += y0.shape[0]
    net.train()    
    return yt_hat_test

def load_image(path):
    get_test_X = sitk.ReadImage(path)
    test_X = sitk.GetArrayFromImage(get_test_X).astype(np.float32)
    image = np.zeros((test_X.shape[0],224,224)).astype(np.float32)
    for num in range(len(image)):
        image[num] = cv2.resize(test_X[num], (224, 224))
    return image

def train_and_predict_dragons(t, y, x, img_path, targeted_regularization=True, output_dir='',
                              knob_loss=VAE_loss_function, ratio=1., dragon='', val_split=0.2, batch_size=64, validation_index=0):
    """
    Method for training dragonnet and tarnet and predicting new results
    Returns:
        Outputs on train and test data
    """

    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
    print(device)

    verbose = 0

    train_outputs_best = {}
    test_outputs_best = {}
    best_evaluation = 1.

    if dragon == 'tarnet':
        print('I am here making tarnet')
        net = TarNet(x.shape[1]).to("cuda")

    elif dragon == 'dragonnet':
        print("I am here making dragonnet")
        net = DragonNet(x.shape[1]).to("cuda")
        
    elif dragon == 'ours':
        print("I am here making ours")
        net = VAE_MM(x.shape[1],hidden_size=200,latent_size=10).to("cuda")

    # Which loss to use for training the network
    #net = torch.nn.DataParallel(net)
    if targeted_regularization:
        loss = make_tarreg_loss(ratio=ratio, dragonnet_loss=knob_loss)
    else:
        loss = knob_loss
    
    # loss = knob_loss
    # for reporducing the IHDP experimemt

    i = 0
    torch.manual_seed(i)
    np.random.seed(i)
    # Get the data and optionally divide into train and test set

    all_index = np.arange(int(x.shape[0]))
    
    y_origin = copy.copy(y)
    y[y_origin>=4]=0
    y[y_origin<=3]=1
    
    ivh = x[:,1]
    GCS = x[:,4]
    ivh_index = []
    GCS_index = []
    for limited_index in all_index:
        if ivh[limited_index]==1 and t[limited_index]==0:
            ivh_index.append(limited_index)
        if len(ivh_index)>=50:
            break
    for limited_index in all_index:
        if GCS[limited_index]<9 and t[limited_index]==1:
            GCS_index.append(limited_index)
        if len(GCS_index)>=50:
            break
    test_index = np.array(ivh_index+GCS_index)
    x = x[:,1:]
       
    train_index = []
    for m in all_index:
        if m not in test_index:
            train_index.append(m)
    
    x_train, x_test = x[train_index], x[test_index]
    y_train, y_test = y[train_index], y[test_index]
    t_train, t_test = t[train_index], t[test_index]
    img_path_train, img_path_test = img_path[train_index], img_path[test_index]

    yt_train = np.concatenate([y_train, t_train], 1)
    yt_test = np.concatenate([y_test, t_test], 1)

    t0_index = np.where(t_train==0)
    t1_index = np.where(t_train==1)

    ratio_t0 = np.sum(y_train[t0_index])/len(y_train[t0_index])
    ratio_t1 = np.sum(y_train[t1_index])/len(y_train[t1_index])

    class_ratio = [ratio_t0, ratio_t1]
    
    ratio_as_t1 = np.sum(t_train)/len(t_train)

    
    train_data = trainerData3d_preload(img_path_train, x_train, y_train, t_train, is_train = True)
    test_data = trainerData3d_preload(img_path_test, x_test, y_test, t_test, is_train = False)
    train_loader = DataLoader(train_data, batch_size=batch_size, shuffle=True, drop_last = True)
    train_loader_test = DataLoader(train_data, batch_size=batch_size, shuffle=False)
    test_loader = DataLoader(test_data, batch_size=256, shuffle=False)

    import time;
    start_time = time.time()

    # Configuring optimizers
    # Training the networks first for 100 epochs with the Adam optimizer and
    # then for 300 epochs with the SGD optimizer.
    epochs1 = 1500
    epochs2 = 500

    # Add L2 regularization to t0 and t1 heads of the network

    optimizer_Adam = optim.Adam(net.parameters(), lr=5e-3)
    scheduler_Adam = optim.lr_scheduler.StepLR(optimizer=optimizer_Adam, step_size = 300, gamma=0.5)       
    #scheduler_SGD = optim.lr_scheduler.StepLR(optimizer=optimizer_SGD, step_size = 200, gamma=0.5)  

    train_loss = 0
    epochs0 = 0
    
    if epochs0 != 0:
        load_model_path = '../models_save/IPH_limited_ours2/'+str(epochs0)+'.pth'
        net.load_state_dict(torch.load(load_model_path))

    # Adam training run
    for epoch in range(epochs0, epochs1):
        # Train on data
        train_loss0,train_loss1, train_sum = train(train_loader, net, optimizer_Adam, loss, class_ratio,ratio_as_t1)
        scheduler_Adam.step(train_sum)
        
        #train_loss = train(train_loader, net, optimizer_SGD, loss, class_ratio)
        #scheduler_SGD.step(train_loss)

        
        if epoch % 10 ==0:
            print("BCE:"+str(epoch)+"/"+str(epochs1)+" "+f"Adam loss: {train_loss0}")
            print("KLD:"+str(epoch)+"/"+str(epochs1)+" "+f"Adam loss: {train_loss1}")
            yt_hat_test = test(test_loader, net, loss, len(test_index))
            yt_hat_train = test(train_loader_test, net, loss, len(train_index))
            np.savez_compressed("../results_save/IPH_limited_ours2/{}_fold_{}_epoch_test.npz".format(validation_index, epoch),yt_hat_test=yt_hat_test,t_test=t_test,y_test=y_test,
            y=y,x_test=x_test)
            np.savez_compressed("../results_save/IPH_limited_ours2/{}_fold_{}_epoch_train.npz".format(validation_index, epoch),yt_hat_train=yt_hat_train,t_train=t_train,y_train=y_train,
            y=y,x_train=x_train)
            test_outputs = _split_output(yt_hat_test, t_test, y_test, y, x_test, is_train=False)
            train_outputs = _split_output(yt_hat_train, t_train, y_train, y, x_train, is_train=True)
            if test_outputs['Policy Risk'] <= best_evaluation:
                train_outputs_best = train_outputs
                test_outputs_best = test_outputs
                best_evaluation = test_outputs['Policy Risk']
            print("==================the {} fold====================".format(validation_index))

        if epoch % 100 ==0:
            save_model_path = '../models_save/IPH_limited_ours/'+str(epoch)+'.pth'
            torch.save(net.state_dict(),save_model_path)
    save_model_path = '../models_save/IPH_limited_ours/'+str(epoch)+ '_' + str(validation_index) + '_fold.pth'
    torch.save(net.state_dict(),save_model_path)       
    return test_outputs_best, train_outputs_best


def run_ihdp(data_base_dir, output_dir='~/result/IPH/',
             knob_loss=VAE_loss_function,
             ratio=1., dragon=''):

    print("the dragon is {}".format(dragon))

    simulation_files = sorted(glob.glob("{}/*.xls".format(data_base_dir)))

    for idx, simulation_file in enumerate(simulation_files):

        simulation_output_dir = os.path.join(output_dir, str(idx))

        os.makedirs(simulation_output_dir, exist_ok=True)

        x, img_path = load_and_format_covariates(simulation_file)
        t, y, y_cf, mu_0, mu_1 = load_all_other_crap(simulation_file)
        np.savez_compressed(os.path.join(simulation_output_dir, "simulation_outputs.npz"),
                            t=t, y=y, y_cf=y_cf, mu_0=mu_0, mu_1=mu_1)

        average_propensity_for_t0 = []
        average_propensity_for_t1 = []
        average_propensity_for_t2 = []
        policy_risk = []
        ate_error_0_1 = []
        ate_error_0_2 = []
        ate_error_1_2 = []
        treatment_accuracy = []
        treatment_policy=np.array([])
        treatment_prediction=np.array([])
        treatment_label=np.array([])

        
        train_average_propensity_for_t0 = []
        train_average_propensity_for_t1 = []
        train_average_propensity_for_t2 = []
        train_policy_risk = []
        train_ate_error_0_1 = []
        train_ate_error_0_2 = []
        train_ate_error_1_2 = []
        train_treatment_accuracy = []
       

        for validation_index in range(0,1):
            # print("Is targeted regularization: {}".format(is_targeted_regularization))
            test_outputs_best, train_outputs_best = train_and_predict_dragons(t, y, x, img_path,
                                                                   targeted_regularization=False,
                                                                   output_dir=simulation_output_dir,
                                                                   knob_loss=knob_loss, ratio=ratio, dragon=dragon,
                                                                   val_split=0.2, batch_size=128, validation_index=validation_index)
                  
            #np.savez_compressed("../results_save/cli_img/{}_fold_test.npz".format(validation_index),test_outputs_best)
            #np.savez_compressed("../results_save/cli_img/{}_fold_train.npz".format(validation_index),train_outputs_best)
            print("==========Best test results for the {} fold==========".format(validation_index))
            print("average propensity for t: {}".format(test_outputs_best['ave propensity for t']))
            print("Policy Risk:", test_outputs_best['Policy Risk'])
            print("Ate_Error_0_1:", test_outputs_best['Ate_Error_0_1'])


            print("Treatment accuracy:", test_outputs_best['Treatment accuracy'])
            print("Treatment policy    :",test_outputs_best['Treatment policy'])
            print("Treatment prediction:",test_outputs_best['Treatment prediction'])
            print("Treatment label     :",test_outputs_best['Treatment label'])
            print("==========Best train results for the {} fold==========".format(validation_index))
            print("average propensity for t: {}".format(train_outputs_best['ave propensity for t']))
            print("Policy Risk:", train_outputs_best['Policy Risk'])
            print("Ate_Error_0_1:", train_outputs_best['Ate_Error_0_1'])

            print("Treatment accuracy:", train_outputs_best['Treatment accuracy'])
            print("====================================================")
            average_propensity_for_t0.append(test_outputs_best['ave propensity for t'])

            policy_risk.append(test_outputs_best['Policy Risk'])
            ate_error_0_1.append(test_outputs_best['Ate_Error_0_1'])

            treatment_accuracy.append(test_outputs_best['Treatment accuracy'])
            treatment_policy=np.concatenate((treatment_policy,test_outputs_best['Treatment policy']),0)
            treatment_prediction=np.concatenate((treatment_prediction,test_outputs_best['Treatment prediction']),0)
            treatment_label=np.concatenate((treatment_label,test_outputs_best['Treatment label']),0)
  
            train_average_propensity_for_t0.append(train_outputs_best['ave propensity for t'])

            train_policy_risk.append(train_outputs_best['Policy Risk'])
            train_ate_error_0_1.append(train_outputs_best['Ate_Error_0_1'])

            train_treatment_accuracy.append(train_outputs_best['Treatment accuracy'])
                   
        print("==========Average best test results==========")
        print("average propensity for t: {}".format(np.mean(average_propensity_for_t0)))
        print("Policy Risk:", np.mean(policy_risk))
        print("Ate_Error_0_1:", np.mean(ate_error_0_1))

        print("Treatment accuracy:", np.mean(treatment_accuracy))
        print("Treatment policy    :",treatment_policy)
        print("Treatment prediction:",treatment_prediction)
        print("Treatment label     :",treatment_label)
        print("==========Average best train results=========")
        print("average propensity for t: {}".format(np.mean(train_average_propensity_for_t0)))
        print("Policy Risk:", np.mean(train_policy_risk))
        print("Ate_Error_0_1:", np.mean(train_ate_error_0_1))

        print("Treatment accuracy:", np.mean(train_treatment_accuracy))
        print("=============================================")


def turn_knob(data_base_dir, knob='dragonnet',
              output_base_dir=''):
    output_dir = os.path.join(output_base_dir, knob)

    if knob == 'dragonnet':
        run_ihdp(data_base_dir=data_base_dir, output_dir=output_dir, dragon='dragonnet')

    if knob == 'tarnet':
        run_ihdp(data_base_dir=data_base_dir, output_dir=output_dir, dragon='tarnet')

    if knob == 'ours':
        run_ihdp(data_base_dir=data_base_dir, output_dir=output_dir, dragon='ours')

def main():
    parser = argparse.ArgumentParser()
    parser.add_argument('--data_base_dir', type=str, help="path to directory",default='../data/IPH')
    parser.add_argument('--knob', type=str, default='ours',
                        help="dragonnet or tarnet or ours")

    parser.add_argument('--output_base_dir', type=str, help="directory to save the output",default='../result/ours')

    args = parser.parse_args()
    turn_knob(args.data_base_dir, args.knob, args.output_base_dir)


if __name__ == '__main__':
    main()