Source code for BioExp.graphs.concept

import matplotlib
matplotlib.use('Agg')
import keras
import numpy as np
import tensorflow as tf
import os
import pdb
import cv2 
import pickle
from matplotlib import pyplot as plt
import matplotlib.gridspec as gridspec


import pandas as pd
from ..helpers.utils import *
from ..spatial.ablation import Ablate
from ..clusters.clusters import Cluster

from keras.models import Model
from keras.utils import np_utils
from skimage.transform import resize as imresize

from scipy.ndimage.measurements import label
from scipy.ndimage.morphology import binary_dilation, generate_binary_structure



[docs]class ConceptGraph():
	"""
	A class for generating concept graph on a trained keras model instance
	"""     

	def __init__(self, model, weights_pth, metric, layer_names, max_clusters = None):
		
		"""
			model       : keras model architecture (keras.models.Model)
			weights_pth : saved weights path (str)
			metric      : metric to compare prediction with gt, for example dice, CE
			layer_name  : name of the layer which needs to be ablated
			test_img    : test image used for ablation
			max_clusters: maximum number of clusters per layer
		"""     

		self.model      = model
		self.weights    = weights_pth
		self.layers     = layer_names
		self.metric     = metric


[docs]	def get_layer_idx(self, layer_name):
		for idx, layer in enumerate(self.model.layers):
			if layer.name == layer_name:
				return idx

[docs]	def get_concepts(self, save_path):
		"""
			Define node and generates json map

			save_path : path to save json graph
		"""

		graph_info = {'concept_name': [], 'layer_name': [], 'feature_map_idxs': []}

		node = 1
		for layer_name in self.layers:
			C = Cluster(self.model, self.weights, layer_name)
			concepts = C.get_clusters(threshold = 0.5, save_path='cluster_results')

			for concept in np.unique(concepts):
				graph_info['concept_name'].append('Node_' + str(node))
				graph_info['layer_name'].append(layer_name)
				idxs = np.arange(len(concepts)).astype('int')[concepts == concept]
				graph_info['feature_map_idxs'].append(list(idxs))
				node += 1

		os.makedirs(save_path, exist_ok = True)
		with open(os.path.join(save_path, 'concept_graph.pickle'), 'wb') as f:
			pickle.dump(graph_info, f)

		return graph_info


[docs]	def generate_link(self, fmaps):
		"""
			links is some norm information of feature activation maps

			fmaps: activation maps
		"""
		return np.linalg.norm(fmaps)
		
[docs]	def generate_fmaps(self, nodeA_info, nodeB_info, dataset_path, loader, save_path):
		"""
			get link between two nodes, nodeA, nodeB
			occlude at nodeA and observe changes in nodeB

			nodeA_info    : {'layer_name', 'layer_idxs'}
			nodeB_info    : {'layer_name', 'layer_idxs'}
		"""

		nodeA_idx   = self.get_layer_idx(nodeA_info['layer_name'])
		nodeA_idxs  = nodeA_info['layer_idxs']

		nodeB_idx   = self.get_layer_idx(nodeB_info['layer_name'])
		nodeB_idxs  = nodeB_info['layer_idxs']


		model = Model(inputs=self.model.input, outputs=self.model.get_layer(nodeB_info['layer_name']).output)
		model.load_weights(self.weights, by_name = True)

		try:
			self.layer_weights = np.array(model.layers[nodeA_idx].get_weights())
			occluded_weights = self.layer_weights.copy()

			for j in nodeA_idxs:
				occluded_weights[0][:,:,:,j] = 0
				occluded_weights[1][j] = 0

			model.layers[nodeA_idx].set_weights(occluded_weights)
		except:
			print ("nodeA is ahead of nodeB")

		if os.path.exists(os.path.join(save_path, 'A_{}_B_{}_fmaps.npy'.format(nodeA_info['concept_name'], nodeB_info['concept_name']))):
			fmaps = np.load(os.path.join(save_path, 'A_{}_B_{}_fmaps.npy'.format(nodeA_info['concept_name'], nodeB_info['concept_name']))) 

		else:
			fmaps = []
			input_paths = os.listdir(dataset_path)

			for i in range(len(input_paths) if len(input_paths) < 500 else 500):
				print ("[INFO: BioExp] Slice no -- Working on {}".format(i))
				input_, label_ = loader(os.path.join(dataset_path, input_paths[i]), 
										os.path.join(dataset_path, 
													input_paths[i]).replace('mask', 'label').replace('labels', 'masks'))
				output = np.squeeze(model.predict(input_[None, ...]))
				output = output[:,:, nodeB_idxs]
				fmaps.append(output)

			fmaps = np.array(fmaps)

			if not os.path.exists(save_path): 
				os.makedirs(save_path)

			np.save(os.path.join(save_path, 'A_{}_B_{}_fmaps.npy'.format(nodeA_info['concept_name'], nodeB_info['concept_name'])), fmaps)


		link = self.generate_link(fmaps)
		return link


[docs]	def generate_graph(self, graph_info, dataset_path = None, loader = None, save_path=None):
		"""
			generates graph adj matrix for computation

			graph_info: {'concept_name', 'layer_name', 'feature_map_idxs'}
			save_path : graph_path or path to save graph
		"""

		if os.path.exists(os.path.join(save_path, 'concept_adj_matrix.pickle')):
			with open(os.path.join(save_path, 'concept_adj_matrix.pickle'), 'rb') as f:
				AM = pickle.load(f) 

		else:
			nodes = len(graph_info['concept_name'])

			AM = []
			for nodeA in range(nodes):
				AM_row = []
				for nodeB in range(nodes):
					nodeA_info = {'concept_name': graph_info['concept_name'][nodeA],
									'layer_name': graph_info['layer_name'][nodeA],
									'layer_idxs': graph_info['feature_map_idxs'][nodeA]}
					nodeB_info = {'concept_name': graph_info['concept_name'][nodeB],
									'layer_name': graph_info['layer_name'][nodeB],
									'layer_idxs': graph_info['feature_map_idxs'][nodeB]}
					AM_row.append(self.generate_fmaps(nodeA_info, nodeB_info,
													dataset_path = dataset_path, 
													loader = loader, 
													save_path = save_path))
				AM.append(AM_row)

			with open(os.path.join(save_path, 'concept_adj_matrix.pickle'), 'wb') as f:
				pickle.dump(AM, f) 

		return AM