これをPythonで行う方法は次のとおりです。
x = [None] * numElements
または、事前ポップしたいデフォルト値、たとえば
bottles = [Beer()] * 99
sea = [Fish()] * many
vegetarianPizzas = [None] * peopleOrderingPizzaNotQuiche
[EDIT:買主の危険負担[Beer()] * 99
構文が作成するものを Beer
した後、同じ単一のインスタンスに99個の参照を持つ配列を移入]
Pythonのデフォルトのアプローチはかなり効率的ですが、要素の数を増やすと効率は低下します。
比較する
import time
class Timer(object):
def __enter__(self):
self.start = time.time()
return self
def __exit__(self, *args):
end = time.time()
secs = end - self.start
msecs = secs * 1000 # millisecs
print('%fms' % msecs)
Elements = 100000
Iterations = 144
print('Elements: %d, Iterations: %d' % (Elements, Iterations))
def doAppend():
result = []
i = 0
while i < Elements:
result.append(i)
i += 1
def doAllocate():
result = [None] * Elements
i = 0
while i < Elements:
result[i] = i
i += 1
def doGenerator():
return list(i for i in range(Elements))
def test(name, fn):
print("%s: " % name, end="")
with Timer() as t:
x = 0
while x < Iterations:
fn()
x += 1
test('doAppend', doAppend)
test('doAllocate', doAllocate)
test('doGenerator', doGenerator)
と
#include <vector>
typedef std::vector<unsigned int> Vec;
static const unsigned int Elements = 100000;
static const unsigned int Iterations = 144;
void doAppend()
{
Vec v;
for (unsigned int i = 0; i < Elements; ++i) {
v.push_back(i);
}
}
void doReserve()
{
Vec v;
v.reserve(Elements);
for (unsigned int i = 0; i < Elements; ++i) {
v.push_back(i);
}
}
void doAllocate()
{
Vec v;
v.resize(Elements);
for (unsigned int i = 0; i < Elements; ++i) {
v[i] = i;
}
}
#include <iostream>
#include <chrono>
using namespace std;
void test(const char* name, void(*fn)(void))
{
cout << name << ": ";
auto start = chrono::high_resolution_clock::now();
for (unsigned int i = 0; i < Iterations; ++i) {
fn();
}
auto end = chrono::high_resolution_clock::now();
auto elapsed = end - start;
cout << chrono::duration<double, milli>(elapsed).count() << "ms\n";
}
int main()
{
cout << "Elements: " << Elements << ", Iterations: " << Iterations << '\n';
test("doAppend", doAppend);
test("doReserve", doReserve);
test("doAllocate", doAllocate);
}
私のWindows 7 i7では、64ビットPythonが
Elements: 100000, Iterations: 144
doAppend: 3587.204933ms
doAllocate: 2701.154947ms
doGenerator: 1721.098185ms
C ++が提供する(MSVC、64ビット、最適化を有効にして構築)
Elements: 100000, Iterations: 144
doAppend: 74.0042ms
doReserve: 27.0015ms
doAllocate: 5.0003ms
C ++デバッグビルドは以下を生成します。
Elements: 100000, Iterations: 144
doAppend: 2166.12ms
doReserve: 2082.12ms
doAllocate: 273.016ms
ここでのポイントは、Pythonを使用すると7〜8%のパフォーマンスの向上を達成できることです。高性能アプリを作成している場合(またはWebサービスなどで使用されているものを作成している場合)これは手探りではありませんが、言語の選択を再考する必要があるかもしれません。
また、ここのPythonコードは実際にはPythonコードではありません。ここで本当にPythonesqueコードに切り替えると、パフォーマンスが向上します。
import time
class Timer(object):
def __enter__(self):
self.start = time.time()
return self
def __exit__(self, *args):
end = time.time()
secs = end - self.start
msecs = secs * 1000 # millisecs
print('%fms' % msecs)
Elements = 100000
Iterations = 144
print('Elements: %d, Iterations: %d' % (Elements, Iterations))
def doAppend():
for x in range(Iterations):
result = []
for i in range(Elements):
result.append(i)
def doAllocate():
for x in range(Iterations):
result = [None] * Elements
for i in range(Elements):
result[i] = i
def doGenerator():
for x in range(Iterations):
result = list(i for i in range(Elements))
def test(name, fn):
print("%s: " % name, end="")
with Timer() as t:
fn()
test('doAppend', doAppend)
test('doAllocate', doAllocate)
test('doGenerator', doGenerator)
与える
Elements: 100000, Iterations: 144
doAppend: 2153.122902ms
doAllocate: 1346.076965ms
doGenerator: 1614.092112ms
(32ビットのdoGeneratorはdoAllocateよりも優れています)。
ここでは、doAppendとdoAllocateの間のギャップが大幅に大きくなっています。
明らかに、ここでの違いは、これをほんの数回以上実行している場合、またはこれらの数値が桁違いにスケールアウトされる負荷の高いシステムでこれを実行している場合、またはかなり大きなリスト。
ここでのポイント:最高のパフォーマンスを得るには、Pythonの方法を使用してください。
しかし、一般的な高レベルのパフォーマンスについて心配している場合、Pythonは間違った言語です。最も基本的な問題は、デコレータなどのPythonの機能(https://wiki.python.org/moin/PythonSpeed/PerformanceTips#Data_Aggregation#Data_Aggregation)により、Python関数呼び出しが他の言語よりも最大300倍遅くなっていることです。