Вывести все подмножества массива с суммой, равной целевой сумме

#python #dynamic-programming #cp #subset-sum

#python #динамическое программирование #cp #подмножество-сумма

Вопрос:

Учитывая массив из N элементов, найдите все подмножества массива с суммой, равной целевому значению.
Я видел все старые вопросы, доступные на этом сайте, связанные с суммой подмножеств, но ни один из них не сработал для меня.

Формат ввода

  • Первая строка ввода содержит целое число N размер массива
  • Вторая строка содержит элементы массива, разделенные пробелом
  • Целевое значение суммы

Формат вывода

  • Вывести все подмассивы (индексы элементов).

Мой код отлично работает для небольших входных данных, но для N> 150 требуется очень много времени. Существует ли какой-либо другой эффективный алгоритм для этого. Пожалуйста, скажите мне, как оптимизировать этот код для больших входных данных.
И вот мой код

 from collections import deque

class Pair:
    def __init__(self, i, j, path_set):
        self.i = i
        self.j = j
        self.path_set = path_set

def get_subsets(arr, n, value): 
    """
    This function appends all the possible paths in result list for the given target sum
    Arguments:
        arr = A list of numbers
        n = number of elements in that list arr
        value = Target sum for which we want to generate table
    """
    # return immediately if there is no possible subset in arr whose sum is equal to value
    if dp[n][value] == False:
        return
        
    queue = deque()
    queue.append(Pair(n, value, set()))

    while len(queue) > 0:
        pair = queue.popleft()
        if pair.i == 0 or pair.j == 0:
            result.append(pair.path_set)
        else:
            exclude = dp[pair.i - 1][pair.j]
            if exclude:
                queue.append(Pair(pair.i-1, pair.j, pair.path_set))

            if pair.j >= arr[pair.i-1]:
                include = dp[pair.i - 1][pair.j - arr[pair.i -1]]
                if include:
                    b = pair.path_set.copy()
                    b.add(pair.i - 1)
                    queue.append(Pair(pair.i - 1, pair.j-arr[pair.i-1], b))
            

def make_dp(arr, n, value):
    """
    This function makes a table of target sum equal to the value
    Arguments:
        arr = A list of numbers
        n = number of elements in that list arr
        value = Target sum for which we want to generate table
    Returns:
        dp = A 2D boolean table
    """
    dp = [[False for i in range(value 1)] for j in range(n 1)]
    
    for i in range(n 1):
        for j in range(value 1):
            if j ==0:
                dp[i][j] = True
            elif i == 0:
                dp[i][j] = False
            else:
                if dp[i-1][j]:
                    dp[i][j] = True
                elif j >=arr[i-1]:
                    if dp[i-1][j-arr[i-1]]:
                        dp[i][j] = True
    return dp

if __name__ == '__main__':
    n = int(input())
    arr = list(map(int, input().split()))
    value = int(input())
    dp = make_dp(arr, n, value)
    result = []
    get_subsets(arr, n, value)
    print(result)
 

Ввод, для которого требуется очень много времени:

 200

200
 

Пожалуйста, оптимизируйте этот код или сообщите мне любой другой подход для выполнения того же.
Заранее спасибо.

Ответ №1:

Вы можете обнаружить, что использование itertools и комбинаций немного эффективнее. Код также намного проще.

 from itertools import chain, combinations

li = [1,2,3,4,5,6]
s=12

itr=chain.from_iterable(combinations(li, n) for n in range(len(li) 1))

result = [el for el in itr if sum(el)==s]

print(result)
 

Вывод:

 [(1, 5, 6), (2, 4, 6), (3, 4, 5), (1, 2, 3, 6), (1, 2, 4, 5)]
 

Комментарии:

1. Спасибо за ваш любезный ответ, но ваш код будет работать только для меньших входных данных, это займет очень много времени (TLE) для большого значения N. Вы также можете попробовать тестовый пример, который я предоставил с моим вопросом.

Ответ №2:

Вы можете получить это за O (n) раз, создав словарь совокупных сумм, которые указывают на их соответствующий индекс. Когда в словаре существует сумма s T для суммы s , у вас есть диапазон, который в сумме составляет T :

 from itertools import accumulate

A      = list(range(1,201))
T      = 200
sums   = {s:i for i,s in enumerate(accumulate(A)) }
result = [ [*range(i 1,sums[s T] 1)] for s,i in sums.items() if s T in sums ]

print(result)
# [[4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19], 
#  [37, 38, 39, 40, 41], 
#  [199]]
 

Даже для 1 миллиона значений в списке это занимает меньше секунды.

Обратите внимание, что это предполагает, что все элементы в массиве> 0.

Можно было бы поддерживать нулевые и отрицательные значения всего несколькими изменениями:

 from itertools import accumulate
 
A      = [*range(-10,11)]
T      = 20

sums   = dict()
for i,s in enumerate(accumulate(A)):
    sums.setdefault(s,[]).append(i)
    
result = []
for cum,starts in sums.items():
    if cum T not in sums: continue
    result.extend( [*range(s 1,e 1)] for s in starts 
                                     for e in sums[cum T] if s<e )

print(A)
# [-10, -9, -8, -7, -6, -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

print(result)  
# [[9, 10, 11, 12, 13, 14, 15, 16], [12, 13, 14, 15, 16]]
 

Это занимает 2-3 секунды для списка с 1 миллионом значений, но может быть дольше в зависимости от размера результата.