Армстронг / Нарциссическое число для базы 16 / шестнадцатеричное

#python #python-3.x #algorithm #optimization

#python #python-3.x #алгоритм #оптимизация

Вопрос:

Какова цель?

Моя цель — найти все армстронг / нарциссические числа в шестнадцатеричном формате для заданного количества цифр.

Основная идея

Основная идея заключается в том, что для набора цифр, например, [A, 3, F, 5] сумма степеней всегда одинакова, независимо от порядка, в котором они встречаются. Это означает, что нам не нужно рассматривать каждое возможное число до нашего максимума, что должно значительно сократить время выполнения.

Что у меня есть до сих пор

 # Armstrong numbers base 16 for n digits

import time
import itertools
from typing import Counter

pows = [[]]

def genPow(max, base):
    global pows
    pows = [[0]*1 for i in range(base)]
    for i in range(base):
        pows[i][0] = i ** max

def check(a, b):
    c1 = Counter(a)
    c2 = Counter(b)

    diff1 = c1-c2
    diff2 = c2-c1

    # Check if elements in both 'sets' are equal in occurence
    return (diff1 == diff2)

def armstrong(digits):
    results = []
    genPow(digits, 16)
    # Generate all combinations without consideration of order
    for set in itertools.combinations_with_replacement('0123456789abcdef', digits):
        sum = 0
        # Genereate sum for every 'digit' in the set
        for digit in set:
            sum = sum   pows[int(digit, 16)][0] 
        # Convert to hex
        hexsum = format(sum, 'x')
        # No point in comparing if the length isn't the same
        if len(hexsum) == len(set):
            if check(hexsum, set):
                results.append(hexsum)

    return sorted(results)

start_time = time.time()
print(armstrong(10))
print("--- %s seconds ---" % (time.time() - start_time))

Моя проблема

Моя проблема в том, что это все еще довольно медленно. Для 10 цифр требуется до ~ 60 секунд. Я почти уверен, что есть способы сделать это более эффективным. Некоторые вещи, о которых я могу думать, но не знаю, как это сделать: более быстрый способ генерации комбинаций, условие остановки вычисления. из суммы, лучший способ сравнить сумму и набор, преобразовать в шестнадцатеричное значение после сравнения

Есть идеи, как это оптимизировать?

Редактировать: я попытался сравнить / проверить немного по-другому, и это уже немного быстрее https://gist.github.com/Claypaenguin/d657c4413b510be580c1bbe3e7872624 Тем временем я пытаюсь понять рекурсивный подход, потому что, похоже, это будет намного быстрее.

1. Вы хотите преобразовать шестнадцатеричное число в десятичное?

2. Если бы вы могли изменить шестнадцатеричные цифры, чтобы начать работать — это проблема. будет намного быстрее. — Затем вы пишете вспомогательную функцию (точно так же, как вы делали для проверки is_armstrong )

Ответ №1:

Ваша проблема в том, что combinations_with_replacement для базы b и длины l возвращаются (b l choose b) разные вещи. Что в вашем случае (база 16, длина 10) означает, что у вас есть 5 311 735 комбинаций.

Для каждого из которых вы затем выполняете вычисления с большим весом.

Что вам нужно сделать, это отфильтровать комбинации, которые вы создаете, по мере их создания. Как только вы поймете, что вы не на пути к числу Армстронга, откажитесь от этого пути. Вычисление покажется более сложным, но оно того стоит, поскольку позволяет пропускать целые блоки комбинаций без необходимости их индивидуальной генерации.

Вот псевдокод для сути техники:

 # recursive search for Armstrong numbers with:
#
#   base = base of desired number
#   length = length of desired number
#   known_digits = already chosen digits (not in order)
#   max_digit = the largest digit we are allowed to add
#
# The base case is that we are past or at a solution.
#
# The recursive cases are that we lower max_digit, or add max_digit to known_digits.
#
# When we add max_digit we compute min/max sums.  Looking at those we
# stop searching if our min_sum is too big or our max_sum is too small.
# We then look for leading digits in common.  This may let us discover
# more digits that we need.  (And if they are too big, we can't do that.)
def search(base, length, known_digits, max_digit):
    digits = known_digits.copy() # Be sure we do not modify the original.
    answer = []
    if length < len(digits):
        # We can't have any solutions.
        return []
    elif length == len(digits):
        if digits is a solution:
            return [digits]
        else:
            return []
    elif 0 < max_digit:
        answer = search(base, length, digits, max_digit-1)
    digits.append(max_digit)

    # We now have some answers, and known_digits.  Can we find more?
    find min_sum (all remaining digits are 0)
    if min_sum < base**(length-1):
        min_sum = base**(length-1)

    find max_sum (all remaining digits are max_digit)
    if base**length <= max_sum:
        max_sum = base**length - 1
     
    # Is there a possible answer between them?
    if max_sum < base**(length-1) or base**length <= min_sum:
        return answer # can't add more
    else:
        min_sum_digits = base_digits(min_sum, base)
        max_sum_digits = base_digits(max_sum, base)
        common_leading_digits = what digits are in common?
        new_digits = what digits in common_leading_digits can't be found in our known_digits?
        if 0 == len(new_digits):
            return answer   search(base, length, digits, max_digit)
        elif max_digit < max(new_digits):
            # Can't add this digit
            return answer
        else:
            digits.extend(new_digits)
            return answer   search(base, length, digits, max_digit)

У меня была небольшая логическая ошибка, но вот рабочий код:

 def in_base (n, b):
    answer = []
    while 0 < n:
        answer.append(n % b)
        n = n // b
    return answer


def powers (b, length, cached={}):
    if (b, length) not in cached:
        answer = []
        for i in range(b):
            answer.append(i**length)
        cached[(b, length)] = answer
    return cached[(b, length)]

def multiset_minus (a, b):
    count_a = {}
    for x in a:
        if x not in count_a:
            count_a[x] = 1
        else:
            count_a[x]  = 1
    minus_b = []
    for x in b:
        if x in count_a:
            if 1 == count_a[x]:
                count_a.pop(x)
            else:
                count_a[x] -= 1
        else:
            minus_b.append(x)
    return minus_b


def armstrong_search (length, b, max_digit=None, known=None):
    if max_digit is None:
        max_digit = b-1
    elif max_digit < 0:
        return []

    if known is None:
        known = []
    else:
        known = known.copy() # Be sure not to accidentally share

    if len(known) == length:
        base_rep = in_base(sum([powers(b,length)[x] for x in known]), b)
        if 0 == len(multiset_minus(known, base_rep)):
            return [(base_rep)]
        else:
            return []
    elif length < len(known):
        return []
    else:
        min_sum = sum([powers(b,length)[x] for x in known])
        max_sum = min_sum   (length - len(known)) * powers(b,length)[max_digit]

        if min_sum < b**(length-1):
            min_sum = b**(length-1)
        elif b**length < min_sum:
            return []

        if b**length < max_sum:
            max_sum = b**length - 1
        elif max_sum < b**(length-1):
            return []

        min_sum_rep = in_base(min_sum, b)
        max_sum_rep = in_base(max_sum, b)

        common_digits = []
        for i in range(length-1, -1, -1):
            if min_sum_rep[i] == max_sum_rep[i]:
                common_digits.append(min_sum_rep[i])
            else:
                break

        new_digits = multiset_minus(known, common_digits)
        if 0 == len(new_digits):
            answers = armstrong_search(length, b, max_digit-1, known)
            known.append(max_digit)
            answers.extend(armstrong_search(length, b, max_digit, known))
            return answers
        else:
            known.extend(new_digits)
            return armstrong_search(length, b, max_digit, known)

И для быстрого примера:

 digits = list('0123456789abcdef')
print([''.join(reversed([digits[i] for i in x])) for x in armstrong_search(10, len(digits))])

Требуется чуть более 2 секунд, чтобы обнаружить, что единственный ответ bcc6926afe .

1. Я не уверен, действительно ли я понимаю ваш подход. Как я узнаю, если я не на пути к числу Армстронга?

2. @Claypenguin Вы не на пути к числу Армстронга, если ваша сумма слишком мала, чтобы соответствовать количеству цифр, слишком высока, чтобы соответствовать количеству цифр, или вы указали слишком много цифр (может случиться, когда разрыв между min и max дает вамкуча новых цифр).

3. О, а также, если у вас есть необходимое количество цифр, но нет номера Армстронга.

4. @Claypenguin Я добавил (надеюсь) рабочий код.

5. Спасибо за код! Цифры на самом деле находятся в обратном порядке, поэтому для (10,16) ответ будет EFA6296CCB , но на самом деле это не проблема. Теперь я должен попытаться понять, что это на самом деле делает 🙂

Ответ №2:

Поскольку комбинации itertools будут возвращать числа в порядке возрастания, сравнение суммы степеней было бы более эффективным с использованием отсортированного списка его цифр:

Вот генератор нарциссических чисел общего назначения, который использует этот режим сравнения:

 import string
import itertools
def narcissic(base=10,startSize=1,endSize=None):
    baseDigits = string.digits string.ascii_uppercase string.ascii_lowercase
    if not endSize:
        endSize  = 1
        while (base/(base-1))**(endSize 1) < base*(endSize 1): endSize  = 1

    def getDigits(N):
        result = []
        while N:
            N,digit = divmod(N,base)
            result.append(digit)
        return result[::-1]

    yield (0,"0")
    allDigits = [*range(base)]
    for size in range(startSize,endSize):
        powers = [i**size for i in range(base)]
        for digits in itertools.combinations_with_replacement(allDigits, size):
            number    = sum(powers[d] for d in digits)
            numDigits = getDigits(number)
            if digits == tuple(sorted(numDigits)):
                baseNumber = "".join(baseDigits[d] for d in numDigits)
                yield number, baseNumber

вывод:

 for i,(n,bn) in enumerate(narcissic(5)): print(i 1,":",n,"-->",bn)    

1 : 0 --> 0
2 : 1 --> 1
3 : 2 --> 2
4 : 3 --> 3
5 : 4 --> 4
6 : 13 --> 23
7 : 18 --> 33
8 : 28 --> 103
9 : 118 --> 433
10 : 353 --> 2403
11 : 289 --> 2124
12 : 419 --> 3134
13 : 4890 --> 124030
14 : 4891 --> 124031
15 : 9113 --> 242423
16 : 1874374 --> 434434444
17 : 338749352 --> 1143204434402
18 : 2415951874 --> 14421440424444

Используя timeit для сравнения производительности, мы получаем увеличение скорости в 3,5 раза:

 from timeit import timeit        

t = timeit(lambda:list(narcissic(16,10,11)),number=1)
print("narcissic",t) # 11.006802322999999

t = timeit(lambda:armstrong(10),number=1)
print("armstrong:",t) # 40.324530023

Обратите внимание, что время обработки увеличивается экспоненциально с каждым новым размером, поэтому простое увеличение скорости в 3,5 раза не будет иметь смысла, поскольку это только подтолкнет проблему к следующему размеру