divamgupta
diff --git a/‎Models/FCN32.py
Lines changed: 27 additions & 31 deletions b/‎Models/FCN32.py
Lines changed: 27 additions & 31 deletions
diff --git a/‎Models/FCN8.py
Lines changed: 32 additions & 36 deletions b/‎Models/FCN8.py
Lines changed: 32 additions & 36 deletions
diff --git a/‎Models/VGGSegnet.py
Lines changed: 12 additions & 14 deletions b/‎Models/VGGSegnet.py
Lines changed: 12 additions & 14 deletions
@@ -11,52 +11,48 @@
 import os
 file_path = os.path.dirname( os.path.abspath(__file__) )
 
-VGG_Weights_path = file_path+"/../../data/vgg16_weights_th_dim_ordering_th_kernels.h5"
+VGG_Weights_path = file_path+"/../data/vgg16_weights_th_dim_ordering_th_kernels.h5"
 
+IMAGE_ORDERING = 'channels_first'
 
-# for input(360,480) output will be  ( 170 , 240)
 
-# input_image_size -> ( height , width )
-
-
-def FCN32( nClasses ,  input_height=416, input_width=608 , vgg_level=3):
+def FCN32( n_classes ,  input_height=416, input_width=608 , vgg_level=3):
 
 	assert input_height%32 == 0
 	assert input_width%32 == 0
 
 	# https://github.com/fchollet/deep-learning-models/releases/download/v0.1/vgg16_weights_th_dim_ordering_th_kernels.h5
-	n_classes = 3
 	img_input = Input(shape=(3,input_height,input_width))
 
-	x = Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv1', data_format='channels_first' )(img_input)
-	x = Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv2', data_format='channels_first' )(x)
-	x = MaxPooling2D((2, 2), strides=(2, 2), name='block1_pool', data_format='channels_first' )(x)
+	x = Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv1', data_format=IMAGE_ORDERING )(img_input)
+	x = Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv2', data_format=IMAGE_ORDERING )(x)
+	x = MaxPooling2D((2, 2), strides=(2, 2), name='block1_pool', data_format=IMAGE_ORDERING )(x)
 	f1 = x
 	# Block 2
-	x = Conv2D(128, (3, 3), activation='relu', padding='same', name='block2_conv1', data_format='channels_first' )(x)
-	x = Conv2D(128, (3, 3), activation='relu', padding='same', name='block2_conv2', data_format='channels_first' )(x)
-	x = MaxPooling2D((2, 2), strides=(2, 2), name='block2_pool', data_format='channels_first' )(x)
+	x = Conv2D(128, (3, 3), activation='relu', padding='same', name='block2_conv1', data_format=IMAGE_ORDERING )(x)
+	x = Conv2D(128, (3, 3), activation='relu', padding='same', name='block2_conv2', data_format=IMAGE_ORDERING )(x)
+	x = MaxPooling2D((2, 2), strides=(2, 2), name='block2_pool', data_format=IMAGE_ORDERING )(x)
 	f2 = x
 
 	# Block 3
-	x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv1', data_format='channels_first' )(x)
-	x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv2', data_format='channels_first' )(x)
-	x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv3', data_format='channels_first' )(x)
-	x = MaxPooling2D((2, 2), strides=(2, 2), name='block3_pool', data_format='channels_first' )(x)
+	x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv1', data_format=IMAGE_ORDERING )(x)
+	x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv2', data_format=IMAGE_ORDERING )(x)
+	x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv3', data_format=IMAGE_ORDERING )(x)
+	x = MaxPooling2D((2, 2), strides=(2, 2), name='block3_pool', data_format=IMAGE_ORDERING )(x)
 	f3 = x
 
 	# Block 4
-	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv1', data_format='channels_first' )(x)
-	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv2', data_format='channels_first' )(x)
-	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv3', data_format='channels_first' )(x)
-	x = MaxPooling2D((2, 2), strides=(2, 2), name='block4_pool', data_format='channels_first' )(x)
+	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv1', data_format=IMAGE_ORDERING )(x)
+	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv2', data_format=IMAGE_ORDERING )(x)
+	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv3', data_format=IMAGE_ORDERING )(x)
+	x = MaxPooling2D((2, 2), strides=(2, 2), name='block4_pool', data_format=IMAGE_ORDERING )(x)
 	f4 = x
 
 	# Block 5
-	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_conv1', data_format='channels_first' )(x)
-	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_conv2', data_format='channels_first' )(x)
-	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_conv3', data_format='channels_first' )(x)
-	x = MaxPooling2D((2, 2), strides=(2, 2), name='block5_pool', data_format='channels_first' )(x)
+	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_conv1', data_format=IMAGE_ORDERING )(x)
+	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_conv2', data_format=IMAGE_ORDERING )(x)
+	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_conv3', data_format=IMAGE_ORDERING )(x)
+	x = MaxPooling2D((2, 2), strides=(2, 2), name='block5_pool', data_format=IMAGE_ORDERING )(x)
 	f5 = x
 
 	x = Flatten(name='flatten')(x)
@@ -69,13 +65,13 @@ def FCN32( nClasses ,  input_height=416, input_width=608 , vgg_level=3):
 
 	o = f5
 
-	o = ( Conv2D( 4096 , ( 7 , 7 ) , activation='relu' , padding='same', data_format='channels_first'))(o)
+	o = ( Conv2D( 4096 , ( 7 , 7 ) , activation='relu' , padding='same', data_format=IMAGE_ORDERING))(o)
 	o = Dropout(0.5)(o)
-	o = ( Conv2D( 4096 , ( 1 , 1 ) , activation='relu' , padding='same', data_format='channels_first'))(o)
+	o = ( Conv2D( 4096 , ( 1 , 1 ) , activation='relu' , padding='same', data_format=IMAGE_ORDERING))(o)
 	o = Dropout(0.5)(o)
 
-	o = ( Conv2D( nClasses ,  ( 1 , 1 ) ,kernel_initializer='he_normal' , data_format='channels_first'))(o)
-	o = Conv2DTranspose( nClasses , kernel_size=(64,64) ,  strides=(32,32) , use_bias=False ,  data_format='channels_first' )(o)
+	o = ( Conv2D( n_classes ,  ( 1 , 1 ) ,kernel_initializer='he_normal' , data_format=IMAGE_ORDERING))(o)
+	o = Conv2DTranspose( n_classes , kernel_size=(64,64) ,  strides=(32,32) , use_bias=False ,  data_format=IMAGE_ORDERING )(o)
 	o_shape = Model(img_input , o ).output_shape
 
 	outputHeight = o_shape[2]
@@ -84,8 +80,8 @@ def FCN32( nClasses ,  input_height=416, input_width=608 , vgg_level=3):
 	print "koko" , o_shape
 
 	o = (Reshape(( -1  , outputHeight*outputWidth   )))(o)
-	# o = (Permute((2, 1)))(o)
-	# o = (Activation('softmax'))(o)
+	o = (Permute((2, 1)))(o)
+	o = (Activation('softmax'))(o)
 	model = Model( img_input , o )
 	model.outputWidth = outputWidth
 	model.outputHeight = outputHeight
 
@@ -11,12 +11,9 @@
 import os
 file_path = os.path.dirname( os.path.abspath(__file__) )
 
-VGG_Weights_path = file_path+"/../../data/vgg16_weights_th_dim_ordering_th_kernels.h5"
+VGG_Weights_path = file_path+"/../data/vgg16_weights_th_dim_ordering_th_kernels.h5"
 
-
-# for input(360,480) output will be  ( 170 , 240)
-
-# input_image_size -> ( height , width )
+IMAGE_ORDERING = 'channels_first' 
 
 # crop o1 wrt o2
 def crop( o1 , o2 , i  ):
@@ -32,14 +29,14 @@ def crop( o1 , o2 , i  ):
 	cy = abs( outputHeight2 - outputHeight1 )
 
 	if outputWidth1 > outputWidth2:
-		o1 = Cropping2D( cropping=((0,0) ,  (  0 , cx )), data_format='channels_first'  )(o1)
+		o1 = Cropping2D( cropping=((0,0) ,  (  0 , cx )), data_format=IMAGE_ORDERING  )(o1)
 	else:
-		o2 = Cropping2D( cropping=((0,0) ,  (  0 , cx )), data_format='channels_first'  )(o2)
+		o2 = Cropping2D( cropping=((0,0) ,  (  0 , cx )), data_format=IMAGE_ORDERING  )(o2)
 
 	if outputHeight1 > outputHeight2 :
-		o1 = Cropping2D( cropping=((0,cy) ,  (  0 , 0 )), data_format='channels_first'  )(o1)
+		o1 = Cropping2D( cropping=((0,cy) ,  (  0 , 0 )), data_format=IMAGE_ORDERING  )(o1)
 	else:
-		o2 = Cropping2D( cropping=((0, cy ) ,  (  0 , 0 )), data_format='channels_first'  )(o2)
+		o2 = Cropping2D( cropping=((0, cy ) ,  (  0 , 0 )), data_format=IMAGE_ORDERING  )(o2)
 
 	return o1 , o2 
 
@@ -49,38 +46,37 @@ def FCN8( nClasses ,  input_height=416, input_width=608 , vgg_level=3):
 	# assert input_width%32 == 0
 
 	# https://github.com/fchollet/deep-learning-models/releases/download/v0.1/vgg16_weights_th_dim_ordering_th_kernels.h5
-	n_classes = 3
 	img_input = Input(shape=(3,input_height,input_width))
 
-	x = Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv1', data_format='channels_first' )(img_input)
-	x = Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv2', data_format='channels_first' )(x)
-	x = MaxPooling2D((2, 2), strides=(2, 2), name='block1_pool', data_format='channels_first' )(x)
+	x = Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv1', data_format=IMAGE_ORDERING )(img_input)
+	x = Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv2', data_format=IMAGE_ORDERING )(x)
+	x = MaxPooling2D((2, 2), strides=(2, 2), name='block1_pool', data_format=IMAGE_ORDERING )(x)
 	f1 = x
 	# Block 2
-	x = Conv2D(128, (3, 3), activation='relu', padding='same', name='block2_conv1', data_format='channels_first' )(x)
-	x = Conv2D(128, (3, 3), activation='relu', padding='same', name='block2_conv2', data_format='channels_first' )(x)
-	x = MaxPooling2D((2, 2), strides=(2, 2), name='block2_pool', data_format='channels_first' )(x)
+	x = Conv2D(128, (3, 3), activation='relu', padding='same', name='block2_conv1', data_format=IMAGE_ORDERING )(x)
+	x = Conv2D(128, (3, 3), activation='relu', padding='same', name='block2_conv2', data_format=IMAGE_ORDERING )(x)
+	x = MaxPooling2D((2, 2), strides=(2, 2), name='block2_pool', data_format=IMAGE_ORDERING )(x)
 	f2 = x
 
 	# Block 3
-	x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv1', data_format='channels_first' )(x)
-	x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv2', data_format='channels_first' )(x)
-	x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv3', data_format='channels_first' )(x)
-	x = MaxPooling2D((2, 2), strides=(2, 2), name='block3_pool', data_format='channels_first' )(x)
+	x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv1', data_format=IMAGE_ORDERING )(x)
+	x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv2', data_format=IMAGE_ORDERING )(x)
+	x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv3', data_format=IMAGE_ORDERING )(x)
+	x = MaxPooling2D((2, 2), strides=(2, 2), name='block3_pool', data_format=IMAGE_ORDERING )(x)
 	f3 = x
 
 	# Block 4
-	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv1', data_format='channels_first' )(x)
-	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv2', data_format='channels_first' )(x)
-	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv3', data_format='channels_first' )(x)
-	x = MaxPooling2D((2, 2), strides=(2, 2), name='block4_pool', data_format='channels_first' )(x)
+	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv1', data_format=IMAGE_ORDERING )(x)
+	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv2', data_format=IMAGE_ORDERING )(x)
+	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv3', data_format=IMAGE_ORDERING )(x)
+	x = MaxPooling2D((2, 2), strides=(2, 2), name='block4_pool', data_format=IMAGE_ORDERING )(x)
 	f4 = x
 
 	# Block 5
-	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_conv1', data_format='channels_first' )(x)
-	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_conv2', data_format='channels_first' )(x)
-	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_conv3', data_format='channels_first' )(x)
-	x = MaxPooling2D((2, 2), strides=(2, 2), name='block5_pool', data_format='channels_first' )(x)
+	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_conv1', data_format=IMAGE_ORDERING )(x)
+	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_conv2', data_format=IMAGE_ORDERING )(x)
+	x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_conv3', data_format=IMAGE_ORDERING )(x)
+	x = MaxPooling2D((2, 2), strides=(2, 2), name='block5_pool', data_format=IMAGE_ORDERING )(x)
 	f5 = x
 
 	x = Flatten(name='flatten')(x)
@@ -93,29 +89,29 @@ def FCN8( nClasses ,  input_height=416, input_width=608 , vgg_level=3):
 
 	o = f5
 
-	o = ( Conv2D( 4096 , ( 7 , 7 ) , activation='relu' , padding='same', data_format='channels_first'))(o)
+	o = ( Conv2D( 4096 , ( 7 , 7 ) , activation='relu' , padding='same', data_format=IMAGE_ORDERING))(o)
 	o = Dropout(0.5)(o)
-	o = ( Conv2D( 4096 , ( 1 , 1 ) , activation='relu' , padding='same', data_format='channels_first'))(o)
+	o = ( Conv2D( 4096 , ( 1 , 1 ) , activation='relu' , padding='same', data_format=IMAGE_ORDERING))(o)
 	o = Dropout(0.5)(o)
 
-	o = ( Conv2D( nClasses ,  ( 1 , 1 ) ,kernel_initializer='he_normal' , data_format='channels_first'))(o)
-	o = Conv2DTranspose( nClasses , kernel_size=(4,4) ,  strides=(2,2) , use_bias=False, data_format='channels_first' )(o)
+	o = ( Conv2D( nClasses ,  ( 1 , 1 ) ,kernel_initializer='he_normal' , data_format=IMAGE_ORDERING))(o)
+	o = Conv2DTranspose( nClasses , kernel_size=(4,4) ,  strides=(2,2) , use_bias=False, data_format=IMAGE_ORDERING )(o)
 
 	o2 = f4
-	o2 = ( Conv2D( nClasses ,  ( 1 , 1 ) ,kernel_initializer='he_normal' , data_format='channels_first'))(o2)
+	o2 = ( Conv2D( nClasses ,  ( 1 , 1 ) ,kernel_initializer='he_normal' , data_format=IMAGE_ORDERING))(o2)
 
 	o , o2 = crop( o , o2 , img_input )
 
 	o = Add()([ o , o2 ])
 
-	o = Conv2DTranspose( nClasses , kernel_size=(4,4) ,  strides=(2,2) , use_bias=False, data_format='channels_first' )(o)
+	o = Conv2DTranspose( nClasses , kernel_size=(4,4) ,  strides=(2,2) , use_bias=False, data_format=IMAGE_ORDERING )(o)
 	o2 = f3 
-	o2 = ( Conv2D( nClasses ,  ( 1 , 1 ) ,kernel_initializer='he_normal' , data_format='channels_first'))(o2)
+	o2 = ( Conv2D( nClasses ,  ( 1 , 1 ) ,kernel_initializer='he_normal' , data_format=IMAGE_ORDERING))(o2)
 	o2 , o = crop( o2 , o , img_input )
 	o  = Add()([ o2 , o ])
 
 
-	o = Conv2DTranspose( nClasses , kernel_size=(16,16) ,  strides=(8,8) , use_bias=False, data_format='channels_first' )(o)
+	o = Conv2DTranspose( nClasses , kernel_size=(16,16) ,  strides=(8,8) , use_bias=False, data_format=IMAGE_ORDERING )(o)
 
 	o_shape = Model(img_input , o ).output_shape
 
 
@@ -9,22 +9,11 @@
 
 import os
 file_path = os.path.dirname( os.path.abspath(__file__) )
+VGG_Weights_path = file_path+"/../data/vgg16_weights_th_dim_ordering_th_kernels.h5"
 
-VGG_Weights_path = file_path+"/../../data/vgg16_weights_th_dim_ordering_th_kernels.h5"
 
+def VGGSegnet( n_classes ,  input_height=416, input_width=608 , vgg_level=3):
 
-# for input(360,480) output will be  ( 170 , 240)
-
-# input_image_size -> ( height , width )
-
-
-def VGGSegnet( nClasses ,  input_height=416, input_width=608 , vgg_level=3):
-
-	assert input_height%32 == 0
-	assert input_width%32 == 0
-
-	# https://github.com/fchollet/deep-learning-models/releases/download/v0.1/vgg16_weights_th_dim_ordering_th_kernels.h5
-	n_classes = 3
 	img_input = Input(shape=(3,input_height,input_width))
 
 	x = Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv1', data_format='channels_first' )(img_input)
@@ -95,11 +84,20 @@ def VGGSegnet( nClasses ,  input_height=416, input_width=608 , vgg_level=3):
 	outputHeight = o_shape[2]
 	outputWidth = o_shape[3]
 
-	o = (Reshape((  n_classes , outputHeight*outputWidth   )))(o)
+	o = (Reshape((  -1  , outputHeight*outputWidth   )))(o)
 	o = (Permute((2, 1)))(o)
 	o = (Activation('softmax'))(o)
 	model = Model( img_input , o )
 	model.outputWidth = outputWidth
 	model.outputHeight = outputHeight
 
 	return model
+
+
+
+
+if __name__ == '__main__':
+	m = VGGSegnet( 101 )
+	from keras.utils import plot_model
+	plot_model( m , show_shapes=True , to_file='model.png')
+