Python: длина самой длинной общей подпоследовательности списков

#python #list #longest-substring

#python #Список #самая длинная-подстрока

Вопрос:

Есть ли встроенная функция в python, которая возвращает длину самой длинной общей подпоследовательности двух списков?

 a=[1,2,6,5,4,8]
b=[2,1,6,5,4,4]

print a.llcs(b)

>>> 3
  

Я пытался найти самую длинную общую подпоследовательность, а затем получить ее длину, но я думаю, что должно быть лучшее решение.

Комментарии:

1. Ваш пример вывода неверен; LCS, [2, 6, 5, 4] поэтому длина равна 4.

2. @MartijnPieters Нет, это правильно. LCS — это [6,5,4] посмотрите еще раз 🙂 Ваша функция говорит то же самое. >>> 3

3. Это не LCS. Это может быть самая длинная непрерывная подпоследовательность, но не LCS. LCS не обязательно должны быть непрерывными (все элементы расположены рядом друг с другом). Вы путаете LCS с проблемой самой длинной общей подстроки .

4. @MartijnPieters Спасибо за объяснение, тогда что именно такое LCS? Это что-то вроде пересечения двух наборов, но с возможными дубликатами?

5. Обе последовательности содержат [2, 6, 5, 4] в таком порядке. В a элементы являются последовательными, но в b между ними есть одно значение ( 1 ), но это подпоследовательность обоих a и b .

Ответ №1:

Вы можете легко преобразовать самую длинную общую подпоследовательность (LCS) в длину самой длинной общей подпоследовательности (LLC):

 def lcs_length(a, b):
    table = [[0] * (len(b)   1) for _ in range(len(a)   1)]
    for i, ca in enumerate(a, 1):
        for j, cb in enumerate(b, 1):
            table[i][j] = (
                table[i - 1][j - 1]   1 if ca == cb else
                max(table[i][j - 1], table[i - 1][j]))
    return table[-1][-1]
  

ДЕМОНСТРАЦИЯ:

 >>> a=[1,2,6,5,4,8]
>>> b=[2,1,6,5,4,4]
>>> lcs_length(a, b)
4
  

Если вам нужна самая длинная общая подстрока (другая, но связанная проблема, когда подпоследовательность является непрерывной), используйте:

 def lcsubstring_length(a, b):
    table = [[0] * (len(b)   1) for _ in range(len(a)   1)]
    longest = 0
    for i, ca in enumerate(a, 1):
        for j, cb in enumerate(b, 1):
            if ca == cb:
                length = table[i][j] = table[i - 1][j - 1]   1
                longest = max(longest, length)
    return longest
  

Это очень похоже на lcs_length подход к динамическому программированию, но мы отслеживаем максимальную длину, найденную на данный момент (поскольку больше не гарантируется, что последний элемент в таблице является максимальным).

Это возвращает 3 :

 >>> lcsubstring_length(a, b)
3
  

Вариант разреженной таблицы, чтобы не нужно было отслеживать все 0 s (используйте это, если a и b потенциально очень большие):

 def lcsubstring_length(a, b):
    table = {}
    longest = 0
    for i, ca in enumerate(a, 1):
        for j, cb in enumerate(b, 1):
            if ca == cb:
                length = table[i, j] = table.get((i - 1, j - 1), 0)   1
                longest = max(longest, length)
    return longest
  

Комментарии:

1. если вы предоставите объяснение или алгоритм, как вы решили ответ. будет полезно изучить

2. @sundarnatarajСундар: это реализация на Python динамического алгоритма, описанного в статье в Википедии .

3. Просто быстрое обновление, в Python 3 такого нет xrange() , просто используйте range() .

4. @juanbretti: Я обновлю ответ, чтобы использовать синтаксис Python 3, но обратите внимание, что вопрос был задан 8 лет назад. 🙂