Python(2.7)で数値のすべての要因を見つける効率的な方法を誰かに説明してもらえますか?
これを行うアルゴリズムを作成できますが、コード化が不十分であり、多数の結果を生成するには時間がかかりすぎると思います。
primefac
ませんか?pypi.python.org/pypi/primefac
Python(2.7)で数値のすべての要因を見つける効率的な方法を誰かに説明してもらえますか?
これを行うアルゴリズムを作成できますが、コード化が不十分であり、多数の結果を生成するには時間がかかりすぎると思います。
primefac
ませんか?pypi.python.org/pypi/primefac
回答:
from functools import reduce
def factors(n):
return set(reduce(list.__add__,
([i, n//i] for i in range(1, int(n**0.5) + 1) if n % i == 0)))
これにより、すべての要因が非常に迅速に返されますn
。
なぜ平方根を上限とするのですか?
sqrt(x) * sqrt(x) = x
。したがって、2つの因子が同じである場合、それらは両方とも平方根です。1つの係数を大きくすると、他の係数を小さくする必要があります。つまり、2つのうちの1つは常にと同じかそれ以下になるsqrt(x)
ため、その時点まで検索するだけで、2つの一致係数の1つを見つけることができます。その後、を使用x / fac1
して取得できfac2
ます。
のreduce(list.__add__, ...)
小さなリストを取っています[fac1, fac2]
と、一の長いリストでそれらを一緒に参加します。
[i, n/i] for i in range(1, int(sqrt(n)) + 1) if n % i == 0
復帰要因のペアを使用すると、分割残りあればn
小さい方によってはゼロ(それはあまりにも大きい方をチェックする必要がない;それだけで取得することを分割することでn
小さい方によって)。
set(...)
外側には、唯一の完璧な正方形のために起こる重複、退治されます。の場合n = 4
、これは2
2回返されるためset
、そのうちの1つを削除します。
sqrt
-人々が実際にはPython 3をサポートすることを考えた前に、それから、おそらくです私はサイトは私がに対してそれを試してみましたから、それを得たと思う__iadd__
し、それが速かったです。私はある時点x**0.5
でよりも高速であることについて何かを覚えているようですsqrt(x)
-そしてそれはその方法でより確実です。
if not n % i
代わりに使用すると15%高速に動作するようですif n % i == 0
/
両方の引数が整数であり、それらが正確に割り切れる場合、つまりで4 / 2 == 2.0
ない場合でも浮動小数点数を返し2
ます。
from functools import reduce
、これを機能させるために追加する必要があります。
@agfによって提示されたソリューションは素晴らしいですが、任意の奇数の実行時間を最大50%高速化できます、パリティをチェックすることにより。奇数の要素は常にそれ自体が奇数なので、奇数を処理するときにこれらをチェックする必要はありません。
プロジェクトオイラーパズルを自分で解き始めたところです。一部の問題では、2つのネストされたfor
ループ内で除数チェックが呼び出されるため、この関数のパフォーマンスが不可欠です。
この事実とagfの優れたソリューションを組み合わせると、次の関数ができあがります。
from math import sqrt
def factors(n):
step = 2 if n%2 else 1
return set(reduce(list.__add__,
([i, n//i] for i in range(1, int(sqrt(n))+1, step) if n % i == 0)))
ただし、数値が小さい場合(〜<100)、この変更による追加のオーバーヘッドにより、関数の実行に時間がかかる場合があります。
速度を確認するためにいくつかのテストを実行しました。以下は使用されるコードです。異なるプロットを作成するために、X = range(1,100,1)
それに応じて変更しました。
import timeit
from math import sqrt
from matplotlib.pyplot import plot, legend, show
def factors_1(n):
step = 2 if n%2 else 1
return set(reduce(list.__add__,
([i, n//i] for i in range(1, int(sqrt(n))+1, step) if n % i == 0)))
def factors_2(n):
return set(reduce(list.__add__,
([i, n//i] for i in range(1, int(sqrt(n)) + 1) if n % i == 0)))
X = range(1,100000,1000)
Y = []
for i in X:
f_1 = timeit.timeit('factors_1({})'.format(i), setup='from __main__ import factors_1', number=10000)
f_2 = timeit.timeit('factors_2({})'.format(i), setup='from __main__ import factors_2', number=10000)
Y.append(f_1/f_2)
plot(X,Y, label='Running time with/without parity check')
legend()
show()
X = range(1,100,1)
ここでは大きな違いはありませんが、数値が大きいほど、利点は明白です。
X = range(1,100000,1000)(奇数のみ)
X = range(2,100000,100)(偶数のみ)
X = range(1,100000,1001)(代替パリティ)
agfの答えは本当にすごいです。を使用しないように書き直すことができるかどうかを確認したかったのreduce()
です。これは私が思いついたものです:
import itertools
flatten_iter = itertools.chain.from_iterable
def factors(n):
return set(flatten_iter((i, n//i)
for i in range(1, int(n**0.5)+1) if n % i == 0))
トリッキーなジェネレーター関数を使用するバージョンも試しました:
def factors(n):
return set(x for tup in ([i, n//i]
for i in range(1, int(n**0.5)+1) if n % i == 0) for x in tup)
私は計算して時間を計った:
start = 10000000
end = start + 40000
for n in range(start, end):
factors(n)
1回実行してPythonにコンパイルさせ、次にtime(1)コマンドで3回実行して、最高の時間を保ちました。
itertoolsバージョンはタプルを構築し、それをflatten_iter()に渡していることに注意してください。代わりにリストを作成するようにコードを変更すると、少し遅くなります。
トリッキーなジェネレーター関数バージョンはPythonで可能な最速だと思います。しかし、それは削減バージョンよりも実際にはそれほど高速ではなく、私の測定に基づいて約4%高速です。
for tup in
):factors = lambda n: {f for i in range(1, int(n**0.5)+1) if n % i == 0 for f in [i, n//i]}
agfの答えへの代替アプローチ:
def factors(n):
result = set()
for i in range(1, int(n ** 0.5) + 1):
div, mod = divmod(n, i)
if mod == 0:
result |= {i, div}
return result
reduce()
が大幅に高速であるかどうかを確認することに興味があったので、reduce()
agfと同じように、パーツ以外のすべてのことをほとんど行いました。読みやすくするために、のようなis_even(n)
式ではなく、のような関数呼び出しを表示すると便利ですn % 2 == 0
。
これは、同じアルゴリズムをよりパイソン的なスタイルで実装する@agfのソリューションに代わるものです。
def factors(n):
return set(
factor for i in range(1, int(n**0.5) + 1) if n % i == 0
for factor in (i, n//i)
)
このソリューションは、インポートなしでPython 2とPython 3の両方で機能し、はるかに読みやすくなっています。私はこのアプローチのパフォーマンスをテストしていませんが、漸近的に同じであるはずです。パフォーマンスが深刻な問題である場合、どちらのソリューションも最適ではありません。
SymPyと呼ばれる業界強度のアルゴリズムがありfactorintは:
>>> from sympy import factorint
>>> factorint(2**70 + 3**80)
{5: 2,
41: 1,
101: 1,
181: 1,
821: 1,
1597: 1,
5393: 1,
27188665321L: 1,
41030818561L: 1}
これには1分もかかりませんでした。メソッドのカクテルを切り替えます。上記のリンクのドキュメントを参照してください。
すべての主要な要素を考えると、他のすべての要素を簡単に構築できます。
受け入れられた回答が上記の数を因数分解するのに十分な時間(つまり、永遠)の実行を許可されたとしても、次の例のように、いくつかの大きな数では失敗することに注意してください。これは、ずさんなことが原因int(n**0.5)
です。たとえば、の場合n = 10000000000000079**2
、
>>> int(n**0.5)
10000000000000078L
以来10000000000000079が素数である、受け入れ答えのアルゴリズムは、この要因を見つけることはありません。これは単に1つずれているだけではないことに注意してください。大きい数の場合は、それだけ多くなります。このため、この種のアルゴリズムでは浮動小数点数を使用しないことをお勧めします。
sympy.divisors
特に除数が少ない数値の場合、それほど速くはないのではないかと思います。ベンチマークをお持ちですか?
sympy.divisors
100,000とほぼ同じ速度であり、それ以上の速度では実際に遅くなります(速度が実際に重要な場合)。(そしてもちろん、のsympy.divisors
ような数値でも機能します10000000000000079**2
。)
nが10 ** 16まで(おそらくもう少し)の場合、高速の純粋なPython 3.6ソリューションを次に示します。
from itertools import compress
def primes(n):
""" Returns a list of primes < n for n > 2 """
sieve = bytearray([True]) * (n//2)
for i in range(3,int(n**0.5)+1,2):
if sieve[i//2]:
sieve[i*i//2::i] = bytearray((n-i*i-1)//(2*i)+1)
return [2,*compress(range(3,n,2), sieve[1:])]
def factorization(n):
""" Returns a list of the prime factorization of n """
pf = []
for p in primeslist:
if p*p > n : break
count = 0
while not n % p:
n //= p
count += 1
if count > 0: pf.append((p, count))
if n > 1: pf.append((n, 1))
return pf
def divisors(n):
""" Returns an unsorted list of the divisors of n """
divs = [1]
for p, e in factorization(n):
divs += [x*p**k for k in range(1,e+1) for x in divs]
return divs
n = 600851475143
primeslist = primes(int(n**0.5)+1)
print(divisors(n))
afg&eryksunのソリューションのさらなる改善。次のコードは、ランタイムの漸近的な複雑さを変更せずに、すべての因子のソートされたリストを返します。
def factors(n):
l1, l2 = [], []
for i in range(1, int(n ** 0.5) + 1):
q,r = n//i, n%i # Alter: divmod() fn can be used.
if r == 0:
l1.append(i)
l2.append(q) # q's obtained are decreasing.
if l1[-1] == l2[-1]: # To avoid duplication of the possible factor sqrt(n)
l1.pop()
l2.reverse()
return l1 + l2
アイデア:list.sort()関数を使用して、nlog(n)に複雑さを与えるソートされたリストを取得する代わりに、O(n)の複雑さを必要とするl2でlist.reverse()を使用する方がはるかに高速です。(これがpythonの作成方法です。)l2.reverse()の後に、l2をl1に追加して、ソートされた因子のリストを取得できます。
l1には増加するi -sが含まれていることに注意してください。l2には、減少するq -sが含まれています。それが上記のアイデアを使用する背後にある理由です。
list.reverse
、それが全体的な複雑さを変更することはO(n)ではないO(1)、ではありません。
l1 + l2.reversed()
その場でリストを逆にするのではなく、戻ることで、小さな(2〜3%)速度の向上を拾うことができます。
私はこれらの素晴らしい答えのほとんどをtimeitで試して、それらの効率と私の単純な機能を比較しましたが、私は常にここに挙げたものよりも優れていると思っています。私はそれを共有し、あなた方全員がどう思うか見てみようと思いました。
def factors(n):
results = set()
for i in xrange(1, int(math.sqrt(n)) + 1):
if n % i == 0:
results.add(i)
results.add(int(n/i))
return results
書かれているとおり、テストのために数学をインポートする必要がありますが、math.sqrt(n)をn **。5で置き換えることも同様に機能するはずです。重複はセットに存在できないため、重複のチェックに時間を費やすことはありません。
xrange(1, int(math.sqrt(n)) + 1)
一度評価されます。
これは、reduceを使用しない別の方法で、多数の場合に良好に機能します。sum
リストをフラット化するために使用します。
def factors(n):
return set(sum([[i, n//i] for i in xrange(1, int(n**0.5)+1) if not n%i], []))
sum
またはreduce(list.__add__)
リストをフラット化するために使用しないでください。
sqrt(number_to_factor)
3 * 3 * 11とを持つ99のような異常な数よりも大きい数を取得してくださいfloor sqrt(99)+1 == 10
。
import math
def factor(x):
if x == 0 or x == 1:
return None
res = []
for i in range(2,int(math.floor(math.sqrt(x)+1))):
while x % i == 0:
x /= i
res.append(i)
if x != 1: # Unusual numbers
res.append(x)
return res
x=8
expected:[1, 2, 4, 8]
、got:[2, 2, 2]
素数を使用して大幅に高速化する場合の例を次に示します。これらのリストはインターネットで簡単に見つけることができます。コードにコメントを追加しました。
# http://primes.utm.edu/lists/small/10000.txt
# First 10000 primes
_PRIMES = (2, 3, 5, 7, 11, 13, 17, 19, 23, 29,
31, 37, 41, 43, 47, 53, 59, 61, 67, 71,
73, 79, 83, 89, 97, 101, 103, 107, 109, 113,
127, 131, 137, 139, 149, 151, 157, 163, 167, 173,
179, 181, 191, 193, 197, 199, 211, 223, 227, 229,
233, 239, 241, 251, 257, 263, 269, 271, 277, 281,
283, 293, 307, 311, 313, 317, 331, 337, 347, 349,
353, 359, 367, 373, 379, 383, 389, 397, 401, 409,
419, 421, 431, 433, 439, 443, 449, 457, 461, 463,
467, 479, 487, 491, 499, 503, 509, 521, 523, 541,
547, 557, 563, 569, 571, 577, 587, 593, 599, 601,
607, 613, 617, 619, 631, 641, 643, 647, 653, 659,
661, 673, 677, 683, 691, 701, 709, 719, 727, 733,
739, 743, 751, 757, 761, 769, 773, 787, 797, 809,
811, 821, 823, 827, 829, 839, 853, 857, 859, 863,
877, 881, 883, 887, 907, 911, 919, 929, 937, 941,
947, 953, 967, 971, 977, 983, 991, 997, 1009, 1013,
# Mising a lot of primes for the purpose of the example
)
from bisect import bisect_left as _bisect_left
from math import sqrt as _sqrt
def get_factors(n):
assert isinstance(n, int), "n must be an integer."
assert n > 0, "n must be greather than zero."
limit = pow(_PRIMES[-1], 2)
assert n <= limit, "n is greather then the limit of {0}".format(limit)
result = set((1, n))
root = int(_sqrt(n))
primes = [t for t in get_primes_smaller_than(root + 1) if not n % t]
result.update(primes) # Add all the primes factors less or equal to root square
for t in primes:
result.update(get_factors(n/t)) # Add all the factors associted for the primes by using the same process
return sorted(result)
def get_primes_smaller_than(n):
return _PRIMES[:_bisect_left(_PRIMES, n)]
ここですでに提示されているアルゴリズムよりも潜在的に効率的なアルゴリズム(特にに小さな主要ファクトンがある場合n
)。ここでの秘訣は、素因数が見つかるたびに試行分割が必要になる限度を調整することです。
def factors(n):
'''
return prime factors and multiplicity of n
n = p0^e0 * p1^e1 * ... * pk^ek encoded as
res = [(p0, e0), (p1, e1), ..., (pk, ek)]
'''
res = []
# get rid of all the factors of 2 using bit shifts
mult = 0
while not n & 1:
mult += 1
n >>= 1
if mult != 0:
res.append((2, mult))
limit = round(sqrt(n))
test_prime = 3
while test_prime <= limit:
mult = 0
while n % test_prime == 0:
mult += 1
n //= test_prime
if mult != 0:
res.append((test_prime, mult))
if n == 1: # only useful if ek >= 3 (ek: multiplicity
break # of the last prime)
limit = round(sqrt(n)) # adjust the limit
test_prime += 2 # will often not be prime...
if n != 1:
res.append((n, 1))
return res
もちろん、これはまだ裁判の分割であり、これ以上凝ったものはありません。したがって、その効率はまだ非常に制限されています(特に、小さな除数のない多数の場合)。
これはpython3です。除算//
は、python 2に適応する必要がある唯一のものでなければなりません(追加from __future__ import division
)。
を使用set(...)
すると、コードが少し遅くなります。これは、平方根をチェックする場合にのみ必要です。これが私のバージョンです:
def factors(num):
if (num == 1 or num == 0):
return []
f = [1]
sq = int(math.sqrt(num))
for i in range(2, sq):
if num % i == 0:
f.append(i)
f.append(num/i)
if sq > 1 and num % sq == 0:
f.append(sq)
if sq*sq != num:
f.append(num/sq)
return f
このif sq*sq != num:
条件は、平方根が整数ではない12のような数値に必要ですが、平方根のフロアが係数になります。
このバージョンでは数値自体は返されませんが、必要に応じて簡単に修正できます。出力もソートされません。
1〜5000のすべての数値で10000回、1〜5000のすべての数値で100回実行した。dansalmo、Jason Schorn、oxrockのソリューション、agfのソリューション、stevehaのソリューション、およびeryksunのソリューションを含め、私がテストした他のすべてのバージョンよりも優れていますが、oxrockのソリューションははるかに近いものです。
import math
'''
I applied finding prime factorization to solve this. (Trial Division)
It's not complicated
'''
def generate_factors(n):
lower_bound_check = int(math.sqrt(n)) # determine lowest bound divisor range [16 = 4]
factors = set() # store factors
for divisors in range(1, lower_bound_check + 1): # loop [1 .. 4]
if n % divisors == 0:
factors.add(divisors) # lower bound divisor is found 16 [ 1, 2, 4]
factors.add(n // divisors) # get upper divisor from lower [ 16 / 1 = 16, 16 / 2 = 8, 16 / 4 = 4]
return factors # [1, 2, 4, 8 16]
print(generate_factors(12)) # {1, 2, 3, 4, 6, 12} -> pycharm output
Pierre Vriens hopefully this makes more sense. this is an O(nlogn) solution.
次のリスト内包のように単純なものを使用します。1と検索しようとしている数をテストする必要がないことに注意してください。
def factors(n):
return [x for x in range(2, n//2+1) if n%x == 0]
平方根の使用に関して、10の因数を見つけたいとしましょう。sqrt(10) = 4
したがってrange(1, int(sqrt(10))) = [1, 2, 3, 4]
、整数の部分と4までのテストでは明らかに5が見落とされます。
あなたがこの方法でそれをしなければならないなら、私が提案する何かを見逃していない限り、を使用しint(ceil(sqrt(x)))
ます。もちろん、これは関数への不必要な呼び出しをたくさん生み出します。
私は読みやすさと速度のために@oxrockのソリューションが最高だと思うので、Python 3+用に書き直したコードを次に示します。
def num_factors(n):
results = set()
for i in range(1, int(n**0.5) + 1):
if n % i == 0: results.update([i,int(n/i)])
return results
numpyがpythonループよりもはるかに高速であっても、誰もnumpyを使用していないというこの質問を見て、私はかなり驚きました。numpyで@agfのソリューションを実装すると、平均で8倍速くなります。他のいくつかのソリューションを派手に実装した場合、素晴らしい時間を得ることができると信じています。
これが私の機能です:
import numpy as np
def b(n):
r = np.arange(1, int(n ** 0.5) + 1)
x = r[np.mod(n, r) == 0]
return set(np.concatenate((x, n / x), axis=None))
x軸の数値は関数への入力ではないことに注意してください。関数への入力は、2からx軸上の数値から1を引いたものです。したがって、10は入力です。2** 10-1 = 1023
import 'dart:math';
generateFactorsOfN(N){
//determine lowest bound divisor range
final lowerBoundCheck = sqrt(N).toInt();
var factors = Set<int>(); //stores factors
/**
* Lets take 16:
* 4 = sqrt(16)
* start from 1 ... 4 inclusive
* check mod 16 % 1 == 0? set[1, (16 / 1)]
* check mod 16 % 2 == 0? set[1, (16 / 1) , 2 , (16 / 2)]
* check mod 16 % 3 == 0? set[1, (16 / 1) , 2 , (16 / 2)] -> unchanged
* check mod 16 % 4 == 0? set[1, (16 / 1) , 2 , (16 / 2), 4, (16 / 4)]
*
* ******************* set is used to remove duplicate
* ******************* case 4 and (16 / 4) both equal to 4
* return factor set<int>.. this isn't ordered
*/
for(var divisor = 1; divisor <= lowerBoundCheck; divisor++){
if(N % divisor == 0){
factors.add(divisor);
factors.add(N ~/ divisor); // ~/ integer division
}
}
return factors;
}