Идеи о том, что делать с набором данных, использующим только временные метки, для проекта машинного обучения

#datetime #machine-learning #timestamp #project

#datetime #машинное обучение #временные метки #проект

Вопрос:

Я пишу проект машинного обучения (я совсем новичок в этом), и теперь я немного застрял в том, что делать дальше.

У меня есть 2, несколько небольших набора данных, один из них имеет временные метки для того, когда произошел вывод, другой такой же, но имеет входные временные метки, они в формате: год / месяц / день / час / минута / секунда.

Я попытался выполнить довольно много функций и разделить эти столбцы, а также изучить разницу между ближайшими входами и ближайшими выходами, чтобы лучше понять временные задержки, а также попытаться увидеть время простоя. Я сделал много визуализаций, чтобы увидеть, куда я могу пойти отсюда, и теперь я совершенно застрял. Я не вижу никаких очевидных шаблонов.

Мне не нужно делать прогнозирование временных рядов, и теперь я пытаюсь выполнить обнаружение аномалий в том, что у меня есть.

  • Моя проблема в том, что я понятия не имею, что мне делать с этим дальше, может быть, у вас есть какие-то советы о том, какие алгоритмы я могу применить?

  • Я также застрял, чтобы узнать, могу ли я подключить ввод к его выходной временной метке, есть ли какие-либо очевидные способы, которые обычно применяются для этого?

  • В основном я хочу видеть шаблоны и отклонения в данных, я попытался просмотреть сгенерированные фрагменты данных. Я действительно не знаю, какие хорошие модели / эксперименты можно применить и опробовать в моем случае.

  • есть ли какие-либо методы интеллектуального анализа данных, которые вы могли бы посоветовать мне использовать?

Ответ №1:

Похоже, вы на правильном пути!

Вот несколько идей для рассмотрения:

  • Есть ли тенденция по дням недели? Выходные являются пиковыми или нет?
  • Имеет ли значение время суток в сочетании с днем недели?
  • Вы рассматривали объем в сочетании с другими переменными? Всплеск трафика в среду вечером в 2 часа ночи может быть красным флагом.

В принципе, я бы попытался ввести в ваши данные сезонность, час, день недели, месяц, год и т.д.

Ссылка: Как использовать машинное обучение для обнаружения аномалий и мониторинга состояния;
Расстояние Махаланобиса