#python #python-3.x #algorithm #optimization
#python #python-3.x #алгоритм #оптимизация
Вопрос:
Какова цель?
Моя цель — найти все армстронг / нарциссические числа в шестнадцатеричном формате для заданного количества цифр.
Основная идея
Основная идея заключается в том, что для набора цифр, например, [A, 3, F, 5] сумма степеней всегда одинакова, независимо от порядка, в котором они встречаются. Это означает, что нам не нужно рассматривать каждое возможное число до нашего максимума, что должно значительно сократить время выполнения.
Что у меня есть до сих пор
# Armstrong numbers base 16 for n digits
import time
import itertools
from typing import Counter
pows = [[]]
def genPow(max, base):
global pows
pows = [[0]*1 for i in range(base)]
for i in range(base):
pows[i][0] = i ** max
def check(a, b):
c1 = Counter(a)
c2 = Counter(b)
diff1 = c1-c2
diff2 = c2-c1
# Check if elements in both 'sets' are equal in occurence
return (diff1 == diff2)
def armstrong(digits):
results = []
genPow(digits, 16)
# Generate all combinations without consideration of order
for set in itertools.combinations_with_replacement('0123456789abcdef', digits):
sum = 0
# Genereate sum for every 'digit' in the set
for digit in set:
sum = sum pows[int(digit, 16)][0]
# Convert to hex
hexsum = format(sum, 'x')
# No point in comparing if the length isn't the same
if len(hexsum) == len(set):
if check(hexsum, set):
results.append(hexsum)
return sorted(results)
start_time = time.time()
print(armstrong(10))
print("--- %s seconds ---" % (time.time() - start_time))
Моя проблема
Моя проблема в том, что это все еще довольно медленно. Для 10 цифр требуется до ~ 60 секунд. Я почти уверен, что есть способы сделать это более эффективным. Некоторые вещи, о которых я могу думать, но не знаю, как это сделать: более быстрый способ генерации комбинаций, условие остановки вычисления. из суммы, лучший способ сравнить сумму и набор, преобразовать в шестнадцатеричное значение после сравнения
Есть идеи, как это оптимизировать?
Редактировать: я попытался сравнить / проверить немного по-другому, и это уже немного быстрее https://gist.github.com/Claypaenguin/d657c4413b510be580c1bbe3e7872624 Тем временем я пытаюсь понять рекурсивный подход, потому что, похоже, это будет намного быстрее.
Комментарии:
1. Вы хотите преобразовать шестнадцатеричное число в десятичное?
2. Если бы вы могли изменить шестнадцатеричные цифры, чтобы начать работать — это проблема. будет намного быстрее. — Затем вы пишете вспомогательную функцию (точно так же, как вы делали для проверки
is_armstrong
)
Ответ №1:
Ваша проблема в том, что combinations_with_replacement
для базы b
и длины l
возвращаются (b l choose b)
разные вещи. Что в вашем случае (база 16, длина 10) означает, что у вас есть 5 311 735 комбинаций.
Для каждого из которых вы затем выполняете вычисления с большим весом.
Что вам нужно сделать, это отфильтровать комбинации, которые вы создаете, по мере их создания. Как только вы поймете, что вы не на пути к числу Армстронга, откажитесь от этого пути. Вычисление покажется более сложным, но оно того стоит, поскольку позволяет пропускать целые блоки комбинаций без необходимости их индивидуальной генерации.
Вот псевдокод для сути техники:
# recursive search for Armstrong numbers with:
#
# base = base of desired number
# length = length of desired number
# known_digits = already chosen digits (not in order)
# max_digit = the largest digit we are allowed to add
#
# The base case is that we are past or at a solution.
#
# The recursive cases are that we lower max_digit, or add max_digit to known_digits.
#
# When we add max_digit we compute min/max sums. Looking at those we
# stop searching if our min_sum is too big or our max_sum is too small.
# We then look for leading digits in common. This may let us discover
# more digits that we need. (And if they are too big, we can't do that.)
def search(base, length, known_digits, max_digit):
digits = known_digits.copy() # Be sure we do not modify the original.
answer = []
if length < len(digits):
# We can't have any solutions.
return []
elif length == len(digits):
if digits is a solution:
return [digits]
else:
return []
elif 0 < max_digit:
answer = search(base, length, digits, max_digit-1)
digits.append(max_digit)
# We now have some answers, and known_digits. Can we find more?
find min_sum (all remaining digits are 0)
if min_sum < base**(length-1):
min_sum = base**(length-1)
find max_sum (all remaining digits are max_digit)
if base**length <= max_sum:
max_sum = base**length - 1
# Is there a possible answer between them?
if max_sum < base**(length-1) or base**length <= min_sum:
return answer # can't add more
else:
min_sum_digits = base_digits(min_sum, base)
max_sum_digits = base_digits(max_sum, base)
common_leading_digits = what digits are in common?
new_digits = what digits in common_leading_digits can't be found in our known_digits?
if 0 == len(new_digits):
return answer search(base, length, digits, max_digit)
elif max_digit < max(new_digits):
# Can't add this digit
return answer
else:
digits.extend(new_digits)
return answer search(base, length, digits, max_digit)
У меня была небольшая логическая ошибка, но вот рабочий код:
def in_base (n, b):
answer = []
while 0 < n:
answer.append(n % b)
n = n // b
return answer
def powers (b, length, cached={}):
if (b, length) not in cached:
answer = []
for i in range(b):
answer.append(i**length)
cached[(b, length)] = answer
return cached[(b, length)]
def multiset_minus (a, b):
count_a = {}
for x in a:
if x not in count_a:
count_a[x] = 1
else:
count_a[x] = 1
minus_b = []
for x in b:
if x in count_a:
if 1 == count_a[x]:
count_a.pop(x)
else:
count_a[x] -= 1
else:
minus_b.append(x)
return minus_b
def armstrong_search (length, b, max_digit=None, known=None):
if max_digit is None:
max_digit = b-1
elif max_digit < 0:
return []
if known is None:
known = []
else:
known = known.copy() # Be sure not to accidentally share
if len(known) == length:
base_rep = in_base(sum([powers(b,length)[x] for x in known]), b)
if 0 == len(multiset_minus(known, base_rep)):
return [(base_rep)]
else:
return []
elif length < len(known):
return []
else:
min_sum = sum([powers(b,length)[x] for x in known])
max_sum = min_sum (length - len(known)) * powers(b,length)[max_digit]
if min_sum < b**(length-1):
min_sum = b**(length-1)
elif b**length < min_sum:
return []
if b**length < max_sum:
max_sum = b**length - 1
elif max_sum < b**(length-1):
return []
min_sum_rep = in_base(min_sum, b)
max_sum_rep = in_base(max_sum, b)
common_digits = []
for i in range(length-1, -1, -1):
if min_sum_rep[i] == max_sum_rep[i]:
common_digits.append(min_sum_rep[i])
else:
break
new_digits = multiset_minus(known, common_digits)
if 0 == len(new_digits):
answers = armstrong_search(length, b, max_digit-1, known)
known.append(max_digit)
answers.extend(armstrong_search(length, b, max_digit, known))
return answers
else:
known.extend(new_digits)
return armstrong_search(length, b, max_digit, known)
И для быстрого примера:
digits = list('0123456789abcdef')
print([''.join(reversed([digits[i] for i in x])) for x in armstrong_search(10, len(digits))])
Требуется чуть более 2 секунд, чтобы обнаружить, что единственный ответ bcc6926afe
.
Комментарии:
1. Я не уверен, действительно ли я понимаю ваш подход. Как я узнаю, если я не на пути к числу Армстронга?
2. @Claypenguin Вы не на пути к числу Армстронга, если ваша сумма слишком мала, чтобы соответствовать количеству цифр, слишком высока, чтобы соответствовать количеству цифр, или вы указали слишком много цифр (может случиться, когда разрыв между min и max дает вамкуча новых цифр).
3. О, а также, если у вас есть необходимое количество цифр, но нет номера Армстронга.
4. @Claypenguin Я добавил (надеюсь) рабочий код.
5. Спасибо за код! Цифры на самом деле находятся в обратном порядке, поэтому для (10,16) ответ будет
EFA6296CCB
, но на самом деле это не проблема. Теперь я должен попытаться понять, что это на самом деле делает 🙂
Ответ №2:
Поскольку комбинации itertools будут возвращать числа в порядке возрастания, сравнение суммы степеней было бы более эффективным с использованием отсортированного списка его цифр:
Вот генератор нарциссических чисел общего назначения, который использует этот режим сравнения:
import string
import itertools
def narcissic(base=10,startSize=1,endSize=None):
baseDigits = string.digits string.ascii_uppercase string.ascii_lowercase
if not endSize:
endSize = 1
while (base/(base-1))**(endSize 1) < base*(endSize 1): endSize = 1
def getDigits(N):
result = []
while N:
N,digit = divmod(N,base)
result.append(digit)
return result[::-1]
yield (0,"0")
allDigits = [*range(base)]
for size in range(startSize,endSize):
powers = [i**size for i in range(base)]
for digits in itertools.combinations_with_replacement(allDigits, size):
number = sum(powers[d] for d in digits)
numDigits = getDigits(number)
if digits == tuple(sorted(numDigits)):
baseNumber = "".join(baseDigits[d] for d in numDigits)
yield number, baseNumber
вывод:
for i,(n,bn) in enumerate(narcissic(5)): print(i 1,":",n,"-->",bn)
1 : 0 --> 0
2 : 1 --> 1
3 : 2 --> 2
4 : 3 --> 3
5 : 4 --> 4
6 : 13 --> 23
7 : 18 --> 33
8 : 28 --> 103
9 : 118 --> 433
10 : 353 --> 2403
11 : 289 --> 2124
12 : 419 --> 3134
13 : 4890 --> 124030
14 : 4891 --> 124031
15 : 9113 --> 242423
16 : 1874374 --> 434434444
17 : 338749352 --> 1143204434402
18 : 2415951874 --> 14421440424444
Используя timeit для сравнения производительности, мы получаем увеличение скорости в 3,5 раза:
from timeit import timeit
t = timeit(lambda:list(narcissic(16,10,11)),number=1)
print("narcissic",t) # 11.006802322999999
t = timeit(lambda:armstrong(10),number=1)
print("armstrong:",t) # 40.324530023
Обратите внимание, что время обработки увеличивается экспоненциально с каждым новым размером, поэтому простое увеличение скорости в 3,5 раза не будет иметь смысла, поскольку это только подтолкнет проблему к следующему размеру