Как можно обучить модель CNN с помощью K-кратной перекрестной проверки

#deep-learning #cross-validation #training-data #conv-neural-network

#глубокое обучение #перекрестная проверка #обучение-данные #conv-нейронная сеть

Вопрос:

Прежде всего, заранее благодарю вас за ответы, которые придут. Меня смущает использование K-кратной перекрестной проверки (CV) с CNN.

При работе с CV в обычных условиях, как показано по ссылке ниже, исходный набор данных сначала разделяется на тестовый и обучающий.

https://miro.medium.com/max/875/1 *pJ5jQHPfHDyuJa4-7LR11Q.png

Затем обучающий набор данных делится на обучение и проверку в цикле K в соответствии с определенным значением K. Короче говоря, если мы скажем, что K = 5, наше обучение повторяется 5 раз, и каждый раз формируется новая обученная модель.

Вопрос 1: Как мы можем рассчитать общую точность проверки обучения и значения потерь для 5 различных моделей. Нужно ли нам суммировать и усреднять успех всех моделей?

Вопрос 2: Мы отделили набор тестовых данных от исходного набора данных в начале обучения. Как мы можем протестировать набор ТЕСТОВЫХ данных на 5 различных моделях? Должны ли мы протестировать 5 моделей, а затем получить их среднюю точность, или мы должны протестировать только самую успешную модель?