Подход к созданию набора данных для прогнозирования действий пользователя

#machine-learning #dataset #feature-extraction #hidden-markov-models #bayesian-networks

#машинное обучение #набор данных #извлечение функций #скрытые-марковские-модели #байесовские сети

Вопрос:

Я работаю над созданием модели для прогнозирования действий пользователя на основе данных журнала. У меня есть данные, собранные о действиях пользователя в нескольких сеансах более года.

Я немного смущен тем, как представлять журналы в виде набора данных, чтобы применять алгоритмы машинного обучения. Я просмотрел пару исследовательских работ, в которых ученые использовали байесовские подходы и HMM для представления состояний действий пользователя в наборе данных. Но проблема в том, что в документах не рассматриваются детали реализации.

Итак, мой вопрос: учитывая набор действий пользователя с течением времени в нескольких сеансах, как можно создать диаграмму перехода состояния (или любое другое представление действий пользователя) для прогнозирования следующего действия пользователя.

Любая помощь приветствуется!

Комментарии:

1. Просим вас добавить некоторые образцы данных журнала. Возможно, вам придется выполнить некоторую предварительную обработку, чтобы убедиться, что вы сначала выводите функции и готовите их к вводу в любую конкретную модель.

2. @Amal : рассмотрим любой стандартный файл журнала Apache. Я застрял на том, какие функции и как их извлечь.

3. Вы пробовали Splunk или любой другой подобный инструмент для анализа журналов? Опубликую указатели на любую такую ссылку здесь, если я ее получу.