Коэффициент подобия, учитывающий различную длину наборов

#similarity

#сходство

Вопрос:

Я использую индекс Джаккарда для сравнения перекрытия позиций между двумя наборами инструментов. Однако на индекс сильно влияет количество позиций в каждом инструменте (например, позиции инструмента A=5; позиции инструмента B=12) — см. Пример ниже.

Есть ли какой-либо способ учесть разную длину между двумя наборами/инструментами?

Заранее спасибо, София


Пример: Инструмент А: Элементы: 1 0 0 1 0

Инструмент В: Предметы: 1 0 1 1 1 1 1 1 1 0

ДЖИ = 2/(0 6 2) JI = 0,25

Поскольку в инструменте В гораздо больше элементов, перекрытие, возможно, недооценивается, поскольку инструмент А является просто «более коротким» инструментом и сосредоточен на ключевых элементах для измерения интересующей конструкции.