#machine-learning #prediction
Вопрос:
В этой задаче регрессии цель имеет пики в определенных точках. Например, существует много выборок с целевыми значениями 3 и 5, превышающими 4. Пожалуйста, обратитесь к приведенному ниже снипу.
Я хочу по-прежнему рассматривать это как проблему регрессии и быть достаточно близким к этим прогнозам пиковых точек. Набор данных также содержит множество категориальных переменных и пропущенных значений. Использование алгоритмов повышения и упаковки выдает небольшие значения, но распределение этих прогнозов является нормальным. В то время как я смотрю на что-то, что может дать несколько близкое распределение к цели, в основном не концентрируясь на средних диапазонах, где у исходной цели не так много образцов. Существуют ли какие-либо алгоритмы, которые могут помочь мне достичь этого? Я пытался преобразовать цель с помощью sqrt, но это не работает из-за природы цели.
Ответ №1:
Я бы попытался изменить метод выборки; выборка должна быть перемешана и представлять совокупность ваших данных. Мне нужно более подробно рассказать о вашей проблеме, чтобы дать четкое решение. Для преобразования с использованием sqrt я не знаю, поможет ли это, но я думаю, что вы не можете сделать это напрямую, потому что у вас есть отрицательные элементы в цели, если вы можете преобразовать цель, добавив к ней минимальное значение вашей цели, затем используйте sqrt.