#python #memory-management #memory-leaks #gmp
#python #управление памятью #утечки памяти #gmp
Вопрос:
Мне рекомендовали использовать gmpy для эффективного вычисления больших чисел. Раньше я просто использовал python, и мой скрипт работал день или два, а затем исчерпал память (не уверен, как это произошло, потому что использование памяти моей программы должно быть в основном постоянным.. может быть, утечка памяти?)
В любом случае, я продолжаю получать эту странную ошибку после запуска моей программы в течение пары секунд:
mp_allocate< 545275904->545275904 >
Fatal Python error: mp_allocate failure
This application has requested the Runtime to terminate it in an unusual way.
Please contact the application's support team for more information.
Кроме того, python выходит из строя, и Windows 7 выдает мне общий python.exe has stopped working
диалог.
Этого не происходило при использовании стандартных целых чисел python. Теперь, когда я переключаюсь на gmpy, я получаю эту ошибку всего за несколько секунд до запуска моего скрипта. Я думал, что gmpy специализируется на работе с арифметикой больших чисел?
Для справки, вот пример программы, которая выдает ошибку:
import gmpy2
p = gmpy2.xmpz(3000000000)
s = gmpy2.xmpz(2)
M = s**p
for x in range(p):
s = (s * s) % M
У меня 10 гигабайт оперативной памяти, и без gmpy этот скрипт работал несколько дней без нехватки памяти (все еще не уверен, как это произошло, учитывая s
, что на самом деле никогда не увеличивается..
У кого-нибудь есть идеи?
РЕДАКТИРОВАТЬ: Забыл упомянуть, что я использую Python 3.2
Комментарии:
1. Какую версию Python вы используете?
2. О да, это
**
не*
так . Пропустил это. Хороший.3. @RichieHindle прав; кроме того, если вы используете Python 2, используйте
xrange
вместоrange
. В Python 2range
возвращает список, который в этом случае будет содержать 3 000 000 000 элементов, что многовато даже для 10 ГБ оперативной памяти.4. @TomZych: Я использую Python 3 и, по-видимому, xrange не существует?
5. Тогда это ответ в комментарии @RichieHindle, который необъяснимо исчез. Он указал, что
2**3000000000
это, вероятно, слишком велико, чтобы поместиться в адресном пространстве вашего компьютера. Попробуйте вместо этого использовать один миллиард и посмотрите, работает ли это.
Ответ №1:
Отказ от ответственности: Я поддерживаю gmpy и gmpy2.
Я не смогу протестировать это до сегодняшнего вечера. Но пара комментариев и вопросов.
Вместо использования (s * s) % M используйте pow(s, 2, M) . Это должно быть быстрее.
Что произойдет, если вы используете gmpy2.mpz() вместо gmpy2.xmpz() ?
Используете ли вы 64-разрядную версию Python и gmpy2? (Я предполагаю, что это так, но я просто хочу подтвердить.)
Что касается range и xrange, в Python 3.x range заменил xrange .
Отредактируйте с дополнительной информацией.
Причиной сбоя было переполнение внутренних структур в 32-разрядной сборке. Использование 64-разрядной версии Python и gmpy или gmpy2 является правильным решением.
Функция unpack(x,n) аналогична функции split() для строки: она делит число на ряд из n-разрядных значений. Это эквивалентно, но намного быстрее, чем:
def unpack(x,n):
r = []
m = 2**n
while x:
x, temp = divmod(x,m)
r.append(temp)
return r
Некоторая документация доступна через help(gmpy2.unpack)
, но лучшая документация находится в моем списке дел.
Причина, по которой unpack() можно использовать для устранения операции%, та же, что и при добавлении цифр числа с основанием 10 для проверки делимости на 9. В этом случае unpack() создает p-разрядные числа, и мы делим на 2 ** p — 1 .
Вот некоторый тестовый код:
import gmpy2
import time
def mersenne1(p):
'''Primality test for Mersenne prime: 2**p -1.
Uses native Python longs. Does not verify that p is prime.'''
s = 4
M = 2**p - 1
for i in range(p-2):
s = ((s*s)-2) % M
return False if s else True
def mersenne2(p):
'''Primality test for Mersenne prime: 2**p -1.
Uses gmpy2.mpz. Does not verify that p is prime.'''
s = gmpy2.mpz(4)
M = gmpy2.mpz(2)**p - 1
for i in range(p-2):
s = ((s*s)-2) % M
return False if s else True
def mersenne3(p):
'''Primality test for Mersenne prime: 2**p -1.
Uses gmpy2.mpz and no mod. Does not verify that p is prime.'''
s = gmpy2.mpz(4)
M = gmpy2.mpz(2)**p - 1
for i in range(p-2):
s = (s*s)
s = sum(gmpy2.unpack(s, p))
s = sum(gmpy2.unpack(s, p))
if s < 2:
s = M - 2 s
else:
s = s - 2
return False if s else True
if __name__ == "__main__":
p = 44497
start = time.time()
result1 = mersenne1(p)
print("Elapsed time: {:6.3f}".format(time.time() - start))
start = time.time()
result2 = mersenne2(p)
print("Elapsed time: {:6.3f}".format(time.time() - start))
start = time.time()
result3 = mersenne3(p)
print("Elapsed time: {:6.3f}".format(time.time() - start))
if result1 == result2 == result3:
print("All three tests are equal!")
else:
print("Oops, something has gone wrong.")
И некоторое время выполнения…
C:x64Python32>python.exe mersenne.py
Elapsed time: 163.683
Elapsed time: 12.782
Elapsed time: 3.630
All three tests are equal!
Комментарии:
1. Спасибо за ответ. Хороший вызов для 64-разрядных версий python и gmpy. Похоже, это устранило проблему. Кроме того, я не могу использовать
pow(s, 2, M)
, я думаю, потому что моя фактическая строка кодаs = ((s * s) - 2) % M
. Я просто оставил это для простоты примера кода.2. ISTR gmp имеет какую-то функцию по модулю мощности?
3. @RyanPeschel Похоже, вы ищете простые числа Мерсенна. Если это так, должно быть значительное улучшение производительности путем замены% некоторыми дополнениями. Если M = 2 ** n-1, то x % M можно вычислить, разбив x на n-битные фрагменты и добавив фрагменты. Вам нужно будет повторить разделение / добавление дважды, но это будет быстрее для больших n . Команда будет
x=sum(gmpy2.unpack(x, n))
. Поэкспериментируйте с этим намеком, и я смогу опубликовать пример позже.4. @casevh: Да, я! Я также был бы очень признателен за пример того, как его оптимизировать. Я попытался просмотреть документацию для распаковки, но, похоже, ничего не могу найти в ней. Также он выдает мне сообщение об ошибке, в котором говорится, что он ожидает целых чисел, когда я использую xmpz.
5. Ах, по-видимому, если я использую mpz вместо xmpz для распаковки, он запускается. Тем не менее, я не совсем уверен, что делает суммирование unpack, поскольку, похоже, я не могу найти никакой документации по ним.