#google-cloud-platform #google-cloud-automl
#google-облачная платформа #google-облако-automl #google-cloud-automl
Вопрос:
Я загрузил файл с 4000 записями для пакетного прогнозирования. Данные содержат 86 переменных, и это задача бинарной классификации. Я указал Облачное хранилище в качестве места назначения вывода. Пакетный прогноз вернул CSV-файл, содержащий всего 3730 записей. Интересно, почему некоторые записи отсутствуют в выходных данных. Файл с ошибкой был пуст, так что я понятия не имею. У вас есть какие-нибудь предложения?
Ответ №1:
Поведение, с которым вы сталкиваетесь, может возникать, когда некоторые из ваших входных данных повреждены, отсутствуют или иным образом представлены в формате, несовместимом с вашей моделью. С полными требованиями можно ознакомиться на странице подготовки ваших данных об обучении.
Таким образом, я бы рекомендовал вам проверить правильность ваших входных файлов, иначе ваша модель будет продолжать генерировать ошибки. Кроме того, ознакомьтесь со следующими параграфами: Clean up missing, incomplete, and inconsistent data
и Analyze your data after importing
:
Вам также следует проверить возможность обнуления каждого столбца, которая определяет, могут ли в столбце отсутствовать значения или NULL.
Кроме того, если размер пакета большой, может быть больше ошибочных прогнозов, чем вы ожидаете.
Ответ №2:
У меня та же проблема — отсутствуют прогнозы и пустая таблица ошибок. Я загружаю CSV из GCS. Я проверил, что столбцы обнуляются. У меня действительно есть смешанные типы str
и np.nan
в обнуляемых столбцах. Может ли это быть проблемой?
Спасибо!
Комментарии:
1. Этот ответ принципиально не отвечает на вопрос. Ответ заключается в том, чтобы задать другой, непохожий вопрос. Должен быть опубликован как другой вопрос.