#python #dynamic-programming #cp #subset-sum
#python #динамическое программирование #cp #подмножество-сумма
Вопрос:
Учитывая массив из N элементов, найдите все подмножества массива с суммой, равной целевому значению.
Я видел все старые вопросы, доступные на этом сайте, связанные с суммой подмножеств, но ни один из них не сработал для меня.
Формат ввода
- Первая строка ввода содержит целое число N размер массива
- Вторая строка содержит элементы массива, разделенные пробелом
- Целевое значение суммы
Формат вывода
- Вывести все подмассивы (индексы элементов).
Мой код отлично работает для небольших входных данных, но для N> 150 требуется очень много времени. Существует ли какой-либо другой эффективный алгоритм для этого. Пожалуйста, скажите мне, как оптимизировать этот код для больших входных данных.
И вот мой код
from collections import deque
class Pair:
def __init__(self, i, j, path_set):
self.i = i
self.j = j
self.path_set = path_set
def get_subsets(arr, n, value):
"""
This function appends all the possible paths in result list for the given target sum
Arguments:
arr = A list of numbers
n = number of elements in that list arr
value = Target sum for which we want to generate table
"""
# return immediately if there is no possible subset in arr whose sum is equal to value
if dp[n][value] == False:
return
queue = deque()
queue.append(Pair(n, value, set()))
while len(queue) > 0:
pair = queue.popleft()
if pair.i == 0 or pair.j == 0:
result.append(pair.path_set)
else:
exclude = dp[pair.i - 1][pair.j]
if exclude:
queue.append(Pair(pair.i-1, pair.j, pair.path_set))
if pair.j >= arr[pair.i-1]:
include = dp[pair.i - 1][pair.j - arr[pair.i -1]]
if include:
b = pair.path_set.copy()
b.add(pair.i - 1)
queue.append(Pair(pair.i - 1, pair.j-arr[pair.i-1], b))
def make_dp(arr, n, value):
"""
This function makes a table of target sum equal to the value
Arguments:
arr = A list of numbers
n = number of elements in that list arr
value = Target sum for which we want to generate table
Returns:
dp = A 2D boolean table
"""
dp = [[False for i in range(value 1)] for j in range(n 1)]
for i in range(n 1):
for j in range(value 1):
if j ==0:
dp[i][j] = True
elif i == 0:
dp[i][j] = False
else:
if dp[i-1][j]:
dp[i][j] = True
elif j >=arr[i-1]:
if dp[i-1][j-arr[i-1]]:
dp[i][j] = True
return dp
if __name__ == '__main__':
n = int(input())
arr = list(map(int, input().split()))
value = int(input())
dp = make_dp(arr, n, value)
result = []
get_subsets(arr, n, value)
print(result)
Ввод, для которого требуется очень много времени:
200

200
Пожалуйста, оптимизируйте этот код или сообщите мне любой другой подход для выполнения того же.
Заранее спасибо.
Ответ №1:
Вы можете обнаружить, что использование itertools и комбинаций немного эффективнее. Код также намного проще.
from itertools import chain, combinations
li = [1,2,3,4,5,6]
s=12
itr=chain.from_iterable(combinations(li, n) for n in range(len(li) 1))
result = [el for el in itr if sum(el)==s]
print(result)
Вывод:
[(1, 5, 6), (2, 4, 6), (3, 4, 5), (1, 2, 3, 6), (1, 2, 4, 5)]
Комментарии:
1. Спасибо за ваш любезный ответ, но ваш код будет работать только для меньших входных данных, это займет очень много времени (TLE) для большого значения N. Вы также можете попробовать тестовый пример, который я предоставил с моим вопросом.
Ответ №2:
Вы можете получить это за O (n) раз, создав словарь совокупных сумм, которые указывают на их соответствующий индекс. Когда в словаре существует сумма s T
для суммы s
, у вас есть диапазон, который в сумме составляет T
:
from itertools import accumulate
A = list(range(1,201))
T = 200
sums = {s:i for i,s in enumerate(accumulate(A)) }
result = [ [*range(i 1,sums[s T] 1)] for s,i in sums.items() if s T in sums ]
print(result)
# [[4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
# [37, 38, 39, 40, 41],
# [199]]
Даже для 1 миллиона значений в списке это занимает меньше секунды.
Обратите внимание, что это предполагает, что все элементы в массиве> 0.
Можно было бы поддерживать нулевые и отрицательные значения всего несколькими изменениями:
from itertools import accumulate
A = [*range(-10,11)]
T = 20
sums = dict()
for i,s in enumerate(accumulate(A)):
sums.setdefault(s,[]).append(i)
result = []
for cum,starts in sums.items():
if cum T not in sums: continue
result.extend( [*range(s 1,e 1)] for s in starts
for e in sums[cum T] if s<e )
print(A)
# [-10, -9, -8, -7, -6, -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print(result)
# [[9, 10, 11, 12, 13, 14, 15, 16], [12, 13, 14, 15, 16]]
Это занимает 2-3 секунды для списка с 1 миллионом значений, но может быть дольше в зависимости от размера результата.