#php #compare #similarity
#php #Сравнить #сходство
Вопрос:
Я пытаюсь сравнить пару строк, используя similar_text, хотя строки составляют десятки тысяч, если не больше символов, и similar_text всегда истекает или завершается при запуске. Есть ли какие-либо другие положительные альтернативы? (обратите внимание, левенштейн работает только до 255 символов, в противном случае он возвращает -1).
РЕДАКТИРОВАТЬ: Пока спасибо за отзыв. Я пытаюсь сравнить две версии статей, похожих на эссе, с течением времени. Каждая редакция меняет несколько вещей, но не очень много, но я хотел бы измерить процент изменения каждый раз. Я нашел similar_text и подумал, что это будет идеально.
Комментарии:
1. Что вы хотите сравнить, что вы хотите выяснить?
2. Какие строки вы ищете и почему? Вам нужно передать процентное сходство?
3. similar_text(), кажется, наиболее рекомендуется для таких длинных строк. strcmp() безопасен для двоичных файлов, но я бы не стал использовать его в этом случае. Короче говоря, мой ответ — нет, их нет.
4. известно, что similar_test() имеет проблемы с производительностью при работе с большими строками.
5. Вы могли бы обработать эссе в формате «одно слово в строке», а затем использовать для них diff. эссе с меньшим количеством разделов с изменением различий подразумевали бы более высокое сходство.