@CaptainGiraffeの回答に関するコメントで@Stefanが推測したように、構造体のベクトルではなく構造体のベクトルを使用することで、かなりの利益が得られます。修正されたコードは次のようになります。
#include <vector>
#include <cmath>
#include <iostream>
#include <time.h>
class FloodIsolation {
public:
FloodIsolation() :
h(0),
floodedCells(0),
floodedCellsTimeInterval(0),
qInflow(0),
qStartTime(0),
qEndTime(0),
lowerFloorCells(0),
cellLocationX(0),
cellLocationY(0),
cellLocationZ(0),
levelOfCell(0),
valueOfCellIds(0),
h0(0),
vU(0),
vV(0),
vUh(0),
vVh(0),
vUh0(0),
vVh0(0),
ghh(0),
sfx(0),
sfy(0),
qIn(0),
typeInterface(nEdges, 0),
neighborIds(nEdges, 0)
{
}
~FloodIsolation(){
}
void Update() {
h = h + 1;
floodedCells = !floodedCells;
floodedCellsTimeInterval = !floodedCellsTimeInterval;
qInflow = qInflow + 1;
qStartTime = qStartTime + 1;
qEndTime = qEndTime + 1;
lowerFloorCells = lowerFloorCells + 1;
cellLocationX = cellLocationX + 1;
cellLocationY = cellLocationY + 1;
cellLocationZ = cellLocationZ + 1;
levelOfCell = levelOfCell + 1;
valueOfCellIds = valueOfCellIds + 1;
h0 = h0 + 1;
vU = vU + 1;
vV = vV + 1;
vUh = vUh + 1;
vVh = vVh + 1;
vUh0 = vUh0 + 1;
vVh0 = vVh0 + 1;
ghh = ghh + 1;
sfx = sfx + 1;
sfy = sfy + 1;
qIn = qIn + 1;
for(int j = 0; j < nEdges; ++j) {
++typeInterface[j];
++neighborIds[j];
}
}
private:
static const int nEdges = 6;
bool floodedCells;
bool floodedCellsTimeInterval;
std::vector<int> neighborIds;
double valueOfCellIds;
double h;
double h0;
double vU;
double vV;
double vUh;
double vVh;
double vUh0;
double vVh0;
double ghh;
double sfx;
double sfy;
double qInflow;
double qStartTime;
double qEndTime;
double qIn;
double nx;
double ny;
double floorLevels;
int lowerFloorCells;
bool flagInterface;
std::vector<int> typeInterface;
bool floorCompleteleyFilled;
double cellLocationX;
double cellLocationY;
double cellLocationZ;
int levelOfCell;
};
int main() {
std::vector<FloodIsolation> isolation(20000);
clock_t start = clock();
for (int i = 0; i < 400; ++i) {
if(i % 100 == 0) {
std::cout << i << "\n";
}
for (auto &f : isolation)
f.Update();
}
clock_t stop = clock();
std::cout << "Time: " << difftime(stop, start) / 1000 << "\n";
}
VC ++ 2015 CTPのコンパイラでコンパイルし、を使用して-EHsc -O2b2 -GL -Qpar
、次のような結果が得られます。
0
100
200
300
Time: 0.135
g ++でコンパイルすると、少し遅い結果が生成されます。
0
100
200
300
Time: 0.156
同じハードウェアで、Java 8u45のコンパイラ/ JVMを使用すると、次のような結果が得られます。
0
100
200
300
Time: 181
これはVC ++のバージョンよりも約35%遅く、g ++のバージョンよりも約16%遅くなります。
反復回数を希望の2000に増やすと、差は3%に低下します。この場合のC ++の利点の一部は、実際には実行自体ではなく、単に高速なロード(Javaの永続的な問題)であることを示唆しています。この場合、これは驚くべきことではありません。(ポストされたコードで)測定される計算は非常に簡単なので、ほとんどのコンパイラーが最適化のために多くのことを行うことができるとは思えません。
std::vector<bool>
要素ごとに1ビットを使用してスペースを節約するため、多くのビットシフトが発生します。スピードが欲しいなら、それから離れるべきです。std::vector<int>
代わりに使用してください。