API обнаружения объектов Tensorflow 2: не удается установить batchsize равным 1

#tensorflow #tensorflow2.0 #tensorflow2.x

#tensorflow #tensorflow2.0 #tensorflow2.x

Вопрос:

Если я изменю batchsize на 1 более быстрый RCNN 640x640 и ResNet 50 как магистральный,

Я получаю следующую ошибку:

 The 'global_batch_size' 1 is not divisible by 'num_replicas_in_sync' 4
How can I set the batchsize to 1?
 

Ответ №1:

Как вы можете себе представить, проблема в вашем случае заключается в том, что вы на самом деле пытаетесь использовать 4 видеокарты / устройства ( num_replicas_in_sync ), но ваш batch_size равен 1. Излишне говорить, что вы не можете тренироваться с размером пакета 1 на 4 устройства.

Есть два решения:

  1. Либо измените num_replicas_in_sync на 1.
  2. Либо увеличьте global_batch_size значение, которое делится на 4 (4,8,12 и т.д.)