Как установить потери для train_op с помощью tf estimator API, когда потери зависят от ввода и реализованы через пользовательский уровень потерь?

#python-3.x #tensorflow #tensorflow-estimator #tf.keras

#python-3.x #tensorflow #tensorflow-estimator #tf.keras

Вопрос:

Я реализую модель CNN с tf.estimator API.

Вкратце, функция затрат / потерь зависит от входных данных и содержит переменные, которые будут обновляться во время обучения. Я реализовал пользовательский слой с идентичным отображением только для вызова add_loss() и хранения обучаемых переменных для потери.

Однако, когда я попытался указать train_op for EstimatorSpec (используя AdamOptimizer ), я понятия не имею, как извлечь потерю и передать ее optimizer.minimize() .

Проблема возникла у меня, когда я пытался реализовать потерю с несколькими максимальными гауссовскими вероятностями, предложенную в Kendall_CVPR2018. Я принял общий подход в качестве примера кода, предоставленного автором статьи на Github, который определяет пользовательский уровень для потерь.

К сожалению, вышеупомянутый код использует Keras , в то время как я пытаюсь протестировать его с tensorflow , более конкретно, tf.estimator . В Keras при вызове model.compile() мы можем передавать данные None в качестве loss аргумента. Но я полагаю, что мы не можем передать None оптимизатору в tensorflow.

 def model_fn(features, labels, mode, params):
    ...
    xs = ts.reshape(xs, shape=[-1, ...])
    nn_params = dict(...)
    ys_out = cnn_blabla(x, mode, ** nn_params)
    ...

    loss=???

    ...
    if mode == tf.estimator.ModeKeys.TRAIN:
        optimizer = tf.train.AdamOptimmizer(params['LEARNING_RATE'])
        train_op = optimizer.minimize(loss)
    ...
    return tf.estimator.EstimatorSpec(...)


def cnn_blabla(x, mode, n_outputs, ...):
    with tf.variable_scope("blabla", reuse=tf.AUTO_REUSE):
        layer_out_1 = conv(x, ..., activation=..., name=...)
        layer_out_2 = conv(layer_out_1, ..., activation=..., name=...)
        ...
        layer_out_v = conv(layer_out_u, ..., activation=..., name=...)
        out = CustomLossLayer(n_outputs=n_outputs, name="loss_blabla")(layer_out_v)
    return out


def conv(...):
    ...
  

Я ожидаю обучить модель с пользовательскими потерями через tf.estimator в tensorflow.