#python #tensorflow #amazon-ec2 #tensorflow2.0
Вопрос:
Я использую машину AWC inf1.xlarge EC2 и провожу эксперименты с моделью обнаружения объектов YOLOv4. Я попытался запустить этот пример, в котором используется TensorFlow-neuron 1.15, все работало без каких-либо трудностей, были достигнуты примерно те же результаты, что и в учебнике. К сожалению, TensorFlow 1.15 устарел, и в этой версии нет никаких исправлений, обновлений и т. Д.
Я видел, что существует TensorFlow 2 для нейронных чипов, поэтому подумал, что должны возникнуть какие-либо трудности с получением аналогичных результатов. Итак, чтобы не изобретать колесо или не создавать совершенно другую реализацию YOLOv4, используемую в упомянутом примере, я перенес модель TF1.15 YOLOv4 на TF2, это было довольно просто.
Итак, следующим шагом было скомпилировать его для neuron, и тут начались проблемы, похоже, компилятор не дает никакой обратной связи, правильно он его скомпилировал или нет, занимает много времени, иногда даже машина EC2 зависает, и мне нужно выполнить принудительную остановку -> запуск, чтобы он снова заработал.
Затем я начал обрезать части YOLOv4, думая, что, возможно, есть неподдерживаемые операции или т. Д. Но все же он компилируется, но никогда не запускается на всех ядрах, просто на одном ядре…
Итак, мой вопрос в том, может быть, в этом пакете нейронов TF2 отсутствует какая-то документация, как правильно скомпилировать модель или как ее отладить? Это действительно раздражает, что я не могу получить обратную связь о процессе компиляции. Означает ли это, что для использования этих нейронных чипов лучше вернуться во времени к TF1.15?