Точность проверки Model.fit() отличается от Model.predict()

#keras #deep-learning #classification #conv-neural-network

#keras #глубокое обучение #классификация #conv-нейронная сеть

Вопрос:

Я создал CNN для выполнения двоичной классификации в keras со следующим кодом:

 def neural_network():
  classifier = Sequential()

  # Adding a first convolutional layer
  classifier.add(Convolution2D(48, 3, input_shape = (320, 320, 3), activation = 'relu'))
  classifier.add(MaxPooling2D())

  # Adding a second convolutional layer
  classifier.add(Convolution2D(48, 3, activation = 'relu'))
  classifier.add(MaxPooling2D())


  #Flattening
  classifier.add(Flatten())

  #Full connected
  classifier.add(Dense(256, activation = 'relu'))
  #Full connected
  classifier.add(Dense(256, activation = 'sigmoid'))

  #Full connected
  classifier.add(Dense(1, activation = 'sigmoid'))


  # Compiling the CNN
  classifier.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])

  classifier.summary()


  train_datagen = ImageDataGenerator(rescale = 1./255,
                                    shear_range = 0.2,
                                    horizontal_flip = True,
                                    vertical_flip=True,
                                    brightness_range=[0.5, 1.5])

  test_datagen = ImageDataGenerator(rescale = 1./255)

  training_set = train_datagen.flow_from_directory('/content/drive/My Drive/data_sep/train',
                                                  target_size = (320, 320),
                                                  batch_size = 32,
                                                  class_mode = 'binary')

  test_set = test_datagen.flow_from_directory('/content/drive/My Drive/data_sep/validate',
                                              target_size = (320, 320),
                                              batch_size = 32,
                                              class_mode = 'binary')

  es = EarlyStopping(
      monitor="val_accuracy",
      mode="max",
      patience
      baseline=None,
      restore_best_weights=True,
  )

  filepath  = "/content/drive/My Drive/data_sep/weightsbestval.hdf5"
  checkpoint = ModelCheckpoint(filepath, monitor='val_accuracy', verbose=1, save_best_only=True, mode='max')
  callbacks_list = [checkpoint]

  history = classifier.fit(training_set,
                          epochs  = 10,
                          validation_data = test_set,
                          callbacks= es
                          )
  
  best_score = max(history.history['val_accuracy'])

  from sklearn.metrics import classification_report

  predictions =(classifier.predict(test_set) > 0.5).astype("int32")

  newlist = predictions.tolist()
  finallist = []
  for number in newlist:
    finallist.append(number[0])

  predicted_classes = np.asarray(finallist)
  true_classes = test_set.classes
  class_labels = list(test_set.class_indices.keys())
  report = classification_report(true_classes, predicted_classes, target_names=class_labels)
  
  accuracy = metrics.accuracy_score(true_classes, predicted_classes)  
  print(true_classes)
  print(predicted_classes)
  print(class_labels)
  correct = 0
  for i in range(len(true_classes)):
    if (true_classes[i] == predicted_classes[i]): 
      correct = correct   1
  print(correct)
  print((correct*1.0)/(len(true_classes)*1.0))
  print(report)
  return best_score
 

Когда я запускаю модель, я получаю точность проверки 81,90% с помощью model.fit()
Но после завершения модели точность проверки прогноза составляет 40%.
Я добавил обратный вызов, в котором восстанавливаются наилучшие веса. Так в чем же здесь может быть проблема?

Ответ №1:

Что исправило это для меня, так это то, что я создал еще одну переменную генератора данных изображения

 test2_datagen = ImageDataGenerator(rescale = 1./255)

test2_set = test2_datagen.flow_from_directory('/content/drive/My Drive/data_sep/validate',
                                              target_size = (320, 320),
                                              batch_size = 32,
                                              class_mode = 'binary',
                                              Shuffle = False)
 

Но , как вы можете видеть , я установил Shuffle = False . Я публикую этот ответ на случай, если у кого-то возникнет такая же проблема. Поэтому я использовал test2_set for для предсказания.

Ответ №2:

 test2_set = test2_datagen.flow_from_directory('/content/drive/My Drive/data_sep/validate',
                                              target_size= (320, 320),
                                              batch_size= 32,
                                              class_mode= 'binary',
                                              shuffle= False)
 

Акцент на параметре shuffle в нижнем регистре, иначе этот код завершится ошибкой

Ответ №3:

Так как вы сохраняете лучшую модель в этой линейке

   checkpoint = ModelCheckpoint(filepath, monitor='val_accuracy', verbose=1, save_best_only=True, mode='max')
 

пожалуйста , загрузите эту модель в свой код , а затем прогнозируйте

 from keras.models import load_model  
loaded_model = load_model('data_sep/weightsbestval.hdf5')  
 

Затем

 loaded_model.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics['accuracy'])
score = loaded_model.evaluate(X_test, Y_test, verbose=0)
print ("%s: %.2f%%" % (loaded_model.metrics_names[1], score[1]*100))  
 

Пожалуйста, проголосуйте / отметьте правильно, если вы найдете это полезным