влияние обратного распространения на веса выборок при потерях тензорного потока

#tensorflow #backpropagation #masking #loss

#тензорный поток #обратное распространение #маскирование #потеря

Вопрос:

Я пытаюсь заменить маскирующий слой (маску для временных шагов), просто добавив веса выборки как 0 или 1. В документе Tensor flow для потерь упоминается, что он просто масштабирует потери, если целое число — https://www.tensorflow.org/api_docs/python/tf/keras/losses/CategoricalCrossentropy

Мне нужно знать, отличны ли градиенты от нуля для weight = 0, где sample_weights = [0,0,0,1,1,1,1] для 7 временных шагов, я мог бы попробовать это сам, но я действительно смущен результатами, я не знаю, делаю ли я что-то неправильно.

Заранее спасибо