Автоматическое прогнозирование пакетов таблиц — потерянные записи

#google-cloud-platform #google-cloud-automl

#google-облачная платформа #google-облако-automl #google-cloud-automl

Вопрос:

Я загрузил файл с 4000 записями для пакетного прогнозирования. Данные содержат 86 переменных, и это задача бинарной классификации. Я указал Облачное хранилище в качестве места назначения вывода. Пакетный прогноз вернул CSV-файл, содержащий всего 3730 записей. Интересно, почему некоторые записи отсутствуют в выходных данных. Файл с ошибкой был пуст, так что я понятия не имею. У вас есть какие-нибудь предложения?

Ответ №1:

Поведение, с которым вы сталкиваетесь, может возникать, когда некоторые из ваших входных данных повреждены, отсутствуют или иным образом представлены в формате, несовместимом с вашей моделью. С полными требованиями можно ознакомиться на странице подготовки ваших данных об обучении.

Таким образом, я бы рекомендовал вам проверить правильность ваших входных файлов, иначе ваша модель будет продолжать генерировать ошибки. Кроме того, ознакомьтесь со следующими параграфами: Clean up missing, incomplete, and inconsistent data и Analyze your data after importing :

Вам также следует проверить возможность обнуления каждого столбца, которая определяет, могут ли в столбце отсутствовать значения или NULL.

Кроме того, если размер пакета большой, может быть больше ошибочных прогнозов, чем вы ожидаете.

Ответ №2:

У меня та же проблема — отсутствуют прогнозы и пустая таблица ошибок. Я загружаю CSV из GCS. Я проверил, что столбцы обнуляются. У меня действительно есть смешанные типы str и np.nan в обнуляемых столбцах. Может ли это быть проблемой?

Спасибо!

Комментарии:

1. Этот ответ принципиально не отвечает на вопрос. Ответ заключается в том, чтобы задать другой, непохожий вопрос. Должен быть опубликован как другой вопрос.