tensorflow/core/framework/cpu_allocator_impl.cc:80] Выделение 15414067200 превышает 10% свободной системной памяти в Google colab

# #tensorflow #google-colaboratory #object-detection-api #faster-rcnn #google-cloud-tpu

Вопрос:

Я запускаю модель tensorflow «faster_rsnn_resnet101_v1_640x640_coco17_tpu-8» в Google colab, и она не обучается, выдавая ошибку:

 Future major versions of TensorFlow will allow gradients to flow
into the labels input on backprop by default.

See `tf.nn.softmax_cross_entropy_with_logits_v2`.

W0515 18:56:17.701649 140709569681152 deprecation.py:339] From       /usr/local/lib/python3.7/dist-packages/tensorflow/python/util/dispatch.py:201: softmax_cross_entropy_with_logits (from tensorflow.python.ops.nn_ops) is deprecated and will be removed in a future version.
Instructions for updating:

Future major versions of TensorFlow will allow gradients to flow
into the labels input on backprop by default.

See `tf.nn.softmax_cross_entropy_with_logits_v2`.

2021-05-15 18:57:37.730678: W tensorflow/core/framework/cpu_allocator_impl.cc:80]      Allocation of 15414067200 exceeds 10% of free system memory.
tcmalloc: large alloc 15414067200 bytes == 0x55ef88536000 @  0x7ff9f0c29b6b 0x7ff9f0c49379 0x7ff9d63b0577 0x7ff9c8c4cc1f 0x7ff9c8cd524b 0x7ff9c8b22a46 0x7ff9c8b23a9c 0x7ff9c8b23d27 0x7ff9cd464cb3 0x7ff9c8dde3d6 0x7ff9c8dd227e 0x7ff9ccf72481 0x7ff9ccf6f173 0x7ff9c8e9a2d5 0x7ff9f09fc6db 0x7ff9efb3171f
^C
 

Я изменил размер пакета=1 в файле pipeline_file.config, но все равно остался прежним.

Комментарии:

1. Похоже, вы получаете ошибку OOM на CPU ( cpu_allocator_impl.cc:80 ). Убедитесь, что вы работаете на TPU, но выбираете TPU в Colab->Измените тип среды выполнения и следуйте инструкциям > обучение на TPU