#algorithm #ranking
Вопрос:
Для тех, кто не знаком с личностными тестами, идея, лежащая в их основе, заключается в том, что вы отвечаете на несколько вопросов с множественным выбором, и в конце вы получаете результат для предопределенного набора, которому ваши ответы наиболее точно соответствуют.
Обычно эти тесты разработаны таким образом, что каждый вариант ответа с множественным выбором соответствует исключительно одному значению в выходном наборе. Например,если выходной набор равен [A,B, C], то ответ 1 будет соответствовать только A, ответ 2 будет соответствовать только B и т. Д.
Я пытаюсь придумать алгоритм, в котором каждый ответ с множественным выбором может подавать сигнал нескольким значениям в выходном наборе. Например,если набор выходных данных [A,B, C], то ответ 1 даст 3 балла для вывода A и 6 баллов для вывода C, ответ 2 даст 5 баллов для вывода B и 2 балла для вывода A и C и т. Д.
Мой наивный подход к этому состоял в том, чтобы просто выбрать результат с наибольшим количеством баллов, но это немного разваливается, если общее количество возможных баллов в тесте для варианта A значительно больше, чем возможные баллы для варианта C (в конечном итоге будет большой уклон в сторону вывода A).
Есть ли способ, которым я могу ранжировать выходные параметры здесь, учитывая входные баллы из ответов, и дать каждому варианту справедливый шанс?
Комментарии:
1. Это очень субъективный вопрос, так как этот алгоритм на самом деле не имеет правильного ответа и потребует настройки, чтобы «чувствовать» себя правильно. Тем не менее, мой первый инстинкт состоит в том, чтобы выбрать правильный ответ на основе
points/total_possible_points
(гдеtotal_possible_points
получены баллы, если на каждый вопрос был дан ответ, который дал этому результату наибольшее количество баллов»), то есть результат выбирается в большей степени на основе того, насколько близки к «оптимальным» ответы были для этого вывода.2. @dominicm00 Я
points/total_possible_points
также немного подумал об этом методе, я думаю о сценарии, в котором кто-то получает 19/20 возможных баллов за вариант A и 1/1 возможных баллов за вариант C, он сильно отклонится в сторону варианта C, даже если там не так много сигнала.3. Вам следует взглянуть на «наивные классификаторы Байеса».
4. @user8811409 честно говоря, что-то вроде этого сценария, вероятно, означает, что вам следует лучше распределять баллы в тесте, так как я предполагаю, что вы контролируете значения баллов. Тем не менее, если вы хотите учесть этот сценарий, я бы использовал какой-то метод доверия ( youtube.com/watch?v=8idr1WZ1A7Q ) на основе количества вопросов, которые повлияли на результат, чтобы определить, достаточно ли данных для надежного определения ответа.