#datetime #machine-learning #timestamp #project
#datetime #машинное обучение #временные метки #проект
Вопрос:
Я пишу проект машинного обучения (я совсем новичок в этом), и теперь я немного застрял в том, что делать дальше.
У меня есть 2, несколько небольших набора данных, один из них имеет временные метки для того, когда произошел вывод, другой такой же, но имеет входные временные метки, они в формате: год / месяц / день / час / минута / секунда.
Я попытался выполнить довольно много функций и разделить эти столбцы, а также изучить разницу между ближайшими входами и ближайшими выходами, чтобы лучше понять временные задержки, а также попытаться увидеть время простоя. Я сделал много визуализаций, чтобы увидеть, куда я могу пойти отсюда, и теперь я совершенно застрял. Я не вижу никаких очевидных шаблонов.
Мне не нужно делать прогнозирование временных рядов, и теперь я пытаюсь выполнить обнаружение аномалий в том, что у меня есть.
-
Моя проблема в том, что я понятия не имею, что мне делать с этим дальше, может быть, у вас есть какие-то советы о том, какие алгоритмы я могу применить?
-
Я также застрял, чтобы узнать, могу ли я подключить ввод к его выходной временной метке, есть ли какие-либо очевидные способы, которые обычно применяются для этого?
-
В основном я хочу видеть шаблоны и отклонения в данных, я попытался просмотреть сгенерированные фрагменты данных. Я действительно не знаю, какие хорошие модели / эксперименты можно применить и опробовать в моем случае.
-
есть ли какие-либо методы интеллектуального анализа данных, которые вы могли бы посоветовать мне использовать?
Ответ №1:
Похоже, вы на правильном пути!
Вот несколько идей для рассмотрения:
- Есть ли тенденция по дням недели? Выходные являются пиковыми или нет?
- Имеет ли значение время суток в сочетании с днем недели?
- Вы рассматривали объем в сочетании с другими переменными? Всплеск трафика в среду вечером в 2 часа ночи может быть красным флагом.
В принципе, я бы попытался ввести в ваши данные сезонность, час, день недели, месяц, год и т.д.
Ссылка: Как использовать машинное обучение для обнаружения аномалий и мониторинга состояния;
Расстояние Махаланобиса